JP6936866B2 - 外観特徴の記述属性を認識する方法及び装置 - Google Patents

外観特徴の記述属性を認識する方法及び装置 Download PDF

Info

Publication number
JP6936866B2
JP6936866B2 JP2019551650A JP2019551650A JP6936866B2 JP 6936866 B2 JP6936866 B2 JP 6936866B2 JP 2019551650 A JP2019551650 A JP 2019551650A JP 2019551650 A JP2019551650 A JP 2019551650A JP 6936866 B2 JP6936866 B2 JP 6936866B2
Authority
JP
Japan
Prior art keywords
feature
target
appearance
attribute
descriptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019551650A
Other languages
English (en)
Other versions
JP2020510264A (ja
Inventor
ヤオ,チュンフオン
フオン,バイラン
リー,ドーァフオン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2020510264A publication Critical patent/JP2020510264A/ja
Application granted granted Critical
Publication of JP6936866B2 publication Critical patent/JP6936866B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Description

本発明は、画像処理技術の分野に、特に、外観特徴の記述属性を認識する方法及び装置に関する。
歩行者属性認識は、監視映像内の歩行者の外観特徴の記述属性を認識するために使用されるパターン認識技術である。歩行者の外観特徴には、性別、年令、姿、衣服、髪、装飾品、及び姿勢などの複数の様子が含まれる。夫々の外観特徴は複数の記述属性を含む。例えば、外観特徴が性別であるとき、性別の記述属性は男性及び女性を含む。他の例として、外観特徴が髪であるとき、髪の記述属性は長髪及び短髪を含む。髪の外観特徴には、他の記述属性が更に含まれ得る。例えば、髪の記述属性は、色に基づき区別され、髪の記述属性は、白、黒、茶、などを含む。歩行者属性認識の対象は、カメラによって任意の角度で無作為に撮影される標的画像である。目的は、歩行者の外観特徴の記述属性を認識することによって、視覚情報検索を簡単にし且つ視覚情報認識の正確さ及び速さを向上させることである。
先行技術では、標的画像内の対象の外観特徴の記述属性が認識されるとき、特徴解析及び分類トレーニングが標的画像に対して行われる。異なる外観特徴の記述属性の認識、例えば、長髪及び短髪を含む記述属性の認識はまた、標的画像全体に対して特徴解析を実行することを意味し、無意味な画像処理動作を含んでコンピュータ画像処理作業負荷を増大させる。
本発明は、種々の外観特徴に基づく標的画像から、ある外観特徴の記述属性に関係がある認識領域を意図的に選択し、それによって、無意味な画像処理動作を減らすとともに、コンピュータ画像処理作業負荷を減らすよう、外観特徴の記述属性を認識する方法及び装置を開示する。
第1の態様は、外観特徴の記述属性を認識する方法を提供する。方法は、画像処理デバイスによって実行され、対象を含む標的画像を取得するステップと、前記標的画像の外観特徴の位置特徴を取得して、前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される部分の位置を決定するステップであって、前記外観特徴は、前記対象の外観の特徴が属するタイプを示すために使用され、前記外観特徴の前記位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される部分の位置を示すために使用され、前記外観特徴は局所属性を有し、該局所属性は、前記画像処理デバイスに局所処理方法で前記標的画像を処理するように指示するために使用される、ステップと、前記対象の前記部分を含む標的領域を前記位置特徴に基づき認識するステップと、前記標的領域に対して特徴解析を実行し、前記対象の前記外観特徴の記述属性を認識するステップとを含む。
局所属性を有している外観特徴の位置特徴が決定される。局所属性を有している外観特徴の場合に、無意味な認識領域を減らし、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らすために、標的画像からは、対象のものであって外観特徴によって指し示される部分が位置している標的領域が、特徴解析のための認識領域として意図的に選択される。
第1の態様に基づき、第1の実施において、方法は、前記外観特徴の位置属性を受け取るステップを更に含み、このとき、前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される。
第1の態様に基づき、第2の実施において、方法は、前記外観特徴と位置属性との間の事前に記憶された対応から、前記対象の前記外観特徴の前記位置属性を取得するステップを更に含み、このとき、前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される。
第1の態様、又は第1の態様の第1若しくは第2の実施を参照して、第3の実施において、方法は、1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かすステップと、前記オフセット領域に対して特徴解析を実行し、前記対象の前記外観特徴の他の記述属性を認識するステップと、前もってセットされたアルゴリズムに従って、前記記述属性及び前記他の記述属性から目標記述属性を決定するステップとを更に含み、このとき、前記目標記述属性は、前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である。標的領域の位置は、左方向、右方向、上方向、下方向、又は他の方向において調整される。不明りょうな標的画像から取得され、対象の部分を含まないか又は対象の部分の一部分しか含まない標的領域の場合に、標的領域が動かされた後に、対象の部分を含むオフセット領域が取得され得る。これは、対象の部分の一部分しか含まない標的領域が不明りょうな標的画像から取得されるということで記述属性を認識する際に誤りが比較的に大きくなるというリスクを減らし、記述属性を認識する精度を高める。
第1の態様又は第1の態様の第3の実施を参照して、第4の実施において、方法は、1つ以上の候補領域を取得するよう、前記オフセット領域又は前記標的領域を中心として使用することによって、前記オフセット領域又は前記標的領域を外側へ広げるステップと、前記候補領域に対して特徴解析を実行し、前記対象の前記外観特徴の他の記述属性を認識するステップと、前もってセットされたアルゴリズムに従って、前記記述属性及び前記他の記述属性から目標記述属性を決定するステップとを更に含み、このとき、前記目標記述属性は、前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である。前記標的領域又は前記オフセット領域は、位置調整のために周りを広げられる。不明りょうな標的画像から取得され、対象の部分を含まないか又は対象の部分の一部分しか含まない標的領域の場合に、標的領域又はオフセット領域が広げられた後に、対象の部分を含む候補領域が取得され得る。これは、対象の部分の一部分しか含まない標的領域又はオフセット領域が不明りょうな標的画像から取得されるということで記述属性を認識する際に誤りが比較的に大きくなるというリスクを減らし、記述属性を認識する精度を高める。
第1の態様の第3又は第4の実施を参照して、第5の実施において、1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かす前記ステップは、形状が同じであって連続的である複数のブロックに前記標的領域を分割することと、前記1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向で前記標的領域を1以上のオフセット単位だけ動かすこととを含み、このとき、各オフセット領域のサイズは、前記標的領域のサイズと同じであり、前記オフセット単位の数量は、正の整数である。
第1の態様、又は第1の態様の第1乃至第5の実施のうちのいずれか1つを参照して、第6の実施において、外観特徴の位置特徴を取得する前記ステップは、前記外観特徴の前記位置特徴を含む情報を受け取ることを含み、このとき、前記情報は、前記外観特徴の前記位置特徴を示すために使用される。
第1の態様、又は第1の態様の第1乃至第5の実施のうちのいずれか1つを参照して、第7の実施において、外観特徴の位置特徴を取得する前記ステップは、前記外観特徴と前記位置特徴との間の事前に記憶された対応をクエリすることと、前記外観特徴及び前記対応に基づき前記外観特徴の前記位置特徴を取得することとを含む。
第2の態様に従って、外観特徴の記述属性を認識する方法が提供される。方法は、画像処理デバイスによって実行され、対象を含む標的画像を取得するステップと、前記対象の外観特徴の第1位置特徴及び第2位置特徴を取得して、前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第1部分及び第2部分の位置を決定するステップであって、前記外観特徴は、前記対象の外観の特徴が属するタイプを示すために使用され、前記第1位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第1部分の位置を示すために使用され、前記第2位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第2部分の位置を示すために使用され、前記外観特徴は局所属性を有し、該局所属性は、前記画像処理デバイスに局所処理方法で前記標的画像を処理するように指示するために使用される、ステップと、前記第1位置特徴及び前記第2位置特徴に基づき前記第1部分と前記第2部分との間の最大距離を求めるステップと、前記第1部分及び前記第2部分を含む標的領域を前記最大距離に基づき認識するステップと、前記標的領域に対して特徴解析を実行し、前記標的画像における前記対象の前記外観特徴の記述属性を認識するステップとを含む。
局所属性を有している外観特徴の複数の位置特徴が決定される。局所属性を有している外観特徴の場合に、無意味な認識領域を減らし、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らすために、標的画像からは、外観特徴によって指し示される対象の複数の部分が位置している標的領域が、特徴解析のための認識領域として意図的に選択される。
第2の態様に基づき、第1の実施において、前記最大距離は、前もってセットされた閾値よりも小さい。前もってセットされた閾値は、画像処理デバイスに、標的画像に対して局所的処理又は大域的処理を実行するよう指示するために、使用される。最大距離が前もってセットされた閾値よりも小さい場合には、画像処理デバイスは、標的画像に対して局所的処理を実行するよう指示される。あるいは、最大距離が前もってセットされた閾値よりも大きいか又はそれに等しい場合には、画像処理デバイスは、標的画像に対して大域的処理を実行するよう指示される。大域的処理は、標的画像を処理することである。
第2の態様又は第2の態様の第1の実施を参照して、第2の実施において、方法は、前記外観特徴の位置属性を受け取るステップを更に含み、このとき、前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される。
第2の態様又は第2の態様の第1の実施を参照して、第3の実施において、方法は、前記外観特徴と位置属性との間の事前に記憶された対応から、前記対象の前記外観特徴の前記位置属性を取得するステップを更に含み、このとき、前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される。
第2の態様、又は第2の態様の第1乃至第3の実施のうちのいずれか1つを参照して、第4の実施において、前記対象の外観特徴の第1位置特徴及び第2位置特徴を取得する前記ステップは、前記外観特徴の前記第1位置特徴及び前記第2位置特徴を含む情報を受け取ることを含み、このとき、前記情報は、前記外観特徴の前記第1位置特徴及び前記第2位置特徴を示すために使用される。
第2の態様、又は第2の態様の第1乃至第3の実施のうちのいずれか1つを参照して、第5の実施において、前記対象の外観特徴の第1位置特徴及び第2位置特徴を取得する前記ステップは、前記外観特徴と前記第1位置特徴及び前記第2位置特徴の夫々との間の事前に記憶された対応をクエリすることと、前記外観特徴及び前記対応に基づき前記外観特徴の前記第1位置特徴及び前記第2位置特徴を取得することとを含む。
第2の態様、又は第2の態様の第1乃至第5の実施のうちのいずれか1つを参照して、第6の実施において、方法は、1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かすステップと、前記オフセット領域に対して特徴解析を実行し、前記対象の前記外観特徴の他の記述属性を認識するステップと、前もってセットされたアルゴリズムに従って、前記記述属性及び前記他の記述属性から目標記述属性を決定するステップとを更に含み、このとき、前記目標記述属性は、前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である。標的領域の位置は、左方向、右方向、上方向、下方向、又は他の方向において調整される。不明りょうな標的画像から取得され、対象の部分を含まないか又は対象の部分の一部分しか含まない標的領域の場合に、標的領域が動かされた後に、対象の部分を含むオフセット領域が取得され得る。これは、対象の部分の一部分しか含まない標的領域が不明りょうな標的画像から取得されるということで記述属性を認識する際に誤りが比較的に大きくなるというリスクを減らし、記述属性を認識する精度を高める。
第2の態様の第6の実施を参照して、第7の実施において、方法は、1つ以上の候補領域を取得するよう、前記オフセット領域又は前記標的領域を中心として使用することによって、前記オフセット領域又は前記標的領域を外側へ広げるステップと、前記候補領域に対して特徴解析を実行し、前記対象の前記外観特徴の他の記述属性を認識するステップと、前もってセットされたアルゴリズムに従って、前記記述属性及び前記他の記述属性から目標記述属性を決定するステップとを更に含み、このとき、前記目標記述属性は、前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である。前記標的領域又は前記オフセット領域は、位置調整のために周りを広げられる。不明りょうな標的画像から取得され、対象の部分を含まないか又は対象の部分の一部分しか含まない標的領域の場合に、標的領域又はオフセット領域が広げられた後に、対象の部分を含む候補領域が取得され得る。これは、対象の部分の一部分しか含まない標的領域又はオフセット領域が不明りょうな標的画像から取得されるということで記述属性を認識する際に誤りが比較的に大きくなるというリスクを減らし、記述属性を認識する精度を高める。
第2の態様の第6又は第7の実施を参照して、第8の実施において、1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かす前記ステップは、形状が同じであって連続的である複数のブロックに前記標的領域を分割することと、前記1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向で前記標的領域を1以上のオフセット単位だけ動かすこととを含み、このとき、各オフセット領域のサイズは、前記標的領域のサイズと同じであり、前記オフセット単位の数量は、正の整数である。
第3の態様に従って、外観特徴の記述属性を認識する方法が提供される。方法は、画像処理デバイスによって実行され、対象を含む標的画像を取得するステップと、前記標的画像に対して特徴解析を実行し、前記標的画像内の前記対象の外観特徴の記述属性を認識するステップとを含み、前記外観特徴は、前記対象の外観の特徴が属するタイプを示すために使用され、前記記述属性は、前記対象の前記外観の前記特徴を識別するために使用され、前記外観特徴は大域属性を有し、該大域属性は、前記標的画像を処理する方法が大域的処理であることを示すために使用される。
外観特徴が大域属性を有していることが決定される。大域属性を有している外観特徴の場合に、標的画像が特徴解析のための認識領域として直接選択され、一方、ブロック特徴解析が標的画像に対して行われる必要はない。これは、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らす。
第3の態様を参照して、第1の実施において、方法は、前記外観特徴の位置属性を受け取るステップを更に含み、このとき、前記位置属性は、前記外観特徴が前記大域属性を有していることを示すために使用される。
第3の態様を参照して、第2の実施において、方法は、前記外観特徴と位置属性との間の事前に記憶された対応から、前記対象の前記外観特徴の前記位置属性を取得するステップを更に含み、このとき、前記位置属性は、前記外観特徴が前記大域属性を有していることを示すために使用される。
第3の態様、又は第3の態様の第1若しくは第2の実施を参照して、第3の実施において、方法は、前記外観特徴に関連する他の外観特徴を取得するステップであって、前記他の外観特徴は、前記対象の前記外観のものであって前記外観特徴の前記特徴に関連する他の特徴が属するタイプを示すために使用される、ステップと、前記他の外観特徴の記述属性を取得するステップと、前記他の外観特徴の記述属性を使用することによって前記外観特徴の記述属性を変更することとを更に含む。大域属性を有している外観特徴の記述属性は、大域属性を有している外観特徴に関連する、局所属性を有している他の外観特徴の記述属性を使用することによって変更され、大域属性を有している外観特徴の記述属性を認識する精度は向上する。
第3の態様の第3の実施を参照して、第4の実施において、前記外観特徴に関連する他の外観特徴を取得する前記ステップは、前記外観特徴と前記他の外観特徴との間の事前に記憶された対応をクエリすることと、前記外観特徴に関連する前記他の外観特徴を取得することとを含む。
第3の態様の第3の実施を参照して、第5の実施において、前記外観特徴に関連する他の外観特徴を取得する前記ステップは、前記他の外観特徴の識別子を含む情報を受け取ることと、前記外観特徴に関連する前記他の外観特徴を取得することとを含む。
第3の態様の第3乃至第5の実施のうちのいずれか1つを参照して、第6の実施において、前記他の外観特徴の記述属性を取得する前記ステップは、前記他の外観特徴の位置特徴を取得し、前記他の外観特徴は、前記対象の前記外観の前記他の特徴が属するタイプを示すために使用され、前記他の外観特徴の前記位置特徴は、前もってセットされた対象モデルにおいて前記対象のものであって前記他の外観特徴によって指し示される部分の位置を示すために使用され、前記他の外観特徴は局所属性を有し、該局所属性は、前記画像処理デバイスに前記標的画像を局所処理方法で処理するように指示するために使用される、ことと、前記対象の前記部分を含む標的領域を前記他の外観特徴の前記位置特徴に基づき認識することと、前記標的領域に対して特徴解析を実行し、前記対象の前記他の外観特徴の記述属性を認識することとを含む。
第3の態様の第6の実施を参照して、第7の実施において、方法は、前記他の外観特徴の位置属性を受け取るステップを更に含み、このとき、前記位置属性は、前記他の外観特徴が前記局所属性を有していることを示すために使用される。
第3の態様の第6の実施を参照して、第8の実施において、方法は、前記他の外観特徴と位置属性との間の事前に記憶された対応から、前記対象の前記他の外観特徴の前記位置属性を取得するステップを更に含み、このとき、前記位置属性は、前記他の外観特徴が前記局所属性を有していることを示すために使用される。
第3の態様の第6乃至第8の実施のうちのいずれか1つを参照して、第9の実施において、方法は、1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かすステップと、前記オフセット領域に対して特徴解析を実行し、前記対象の前記他の外観特徴の他の記述属性を認識するステップと、前もってセットされたアルゴリズムに従って、前記他の外観特徴の記述属性及び前記他の記述属性から目標記述属性を、前記他の外観特徴の前記記述属性として決定するステップとを更に含み、このとき、前記目標記述属性は、前記他の外観特徴の記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である。
第3の態様又は第3の態様の第9の実施を参照して、第10の実施において、方法は、1つ以上の候補領域を取得するよう、前記オフセット領域又は前記標的領域を中心として使用することによって、前記オフセット領域又は前記標的領域を外側へ広げるステップと、前記候補領域に対して特徴解析を実行し、前記対象の前記他の外観特徴の他の記述属性を認識するステップと、前もってセットされたアルゴリズムに従って、前記他の外観特徴のものである前記記述属性及び前記他の記述属性から目標記述属性を、前記他の外観特徴の前記記述属性として決定するステップとを更に含み、このとき、前記目標記述属性は、前記他の外観特徴のものである前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である。前記標的領域又は前記オフセット領域は、位置調整のために周りを広げられる。不明りょうな標的画像から取得され、対象の部分を含まないか又は対象の部分の一部分しか含まない標的領域の場合に、標的領域又はオフセット領域が広げられた後に、対象の部分を含む候補領域が取得され得る。これは、対象の部分の一部分しか含まない標的領域又はオフセット領域が不明りょうな標的画像から取得されるということで他の外観特徴の記述属性を認識する際に誤りが比較的に大きくなるというリスクを減らし、他の外観特徴の記述属性を認識する精度を高める。
第3の態様の第9又は第10の実施を参照して、第11の実施において、1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かす前記ステップは、形状が同じであって連続的である複数のブロックに前記標的領域を分割することと、前記1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向で前記標的領域を1以上のオフセット単位だけ動かすこととを含み、このとき、各オフセット領域のサイズは、前記標的領域のサイズと同じであり、前記オフセット単位の数量は、正の整数である。
第3の態様の第6乃至第11の実施のうちのいずれか1つを参照して、第12の実施において、前記他の外観特徴の位置特徴を取得する前記ステップは、前記他の外観特徴の前記位置特徴を含む情報を受け取ることを含み、このとき、前記情報は、前記他の外観特徴の前記位置特徴を示すために使用される。
第3の態様の第6乃至第11の実施のうちのいずれか1つを参照して、第13の実施において、前記他の外観特徴の位置特徴を取得する前記ステップは、前記他の外観特徴と前記位置特徴との間の事前に記憶された対応をクエリすることと、前記他の外観特徴及び前記対応に基づき前記他の外観特徴の前記位置特徴を取得することとを含む。
第4の態様は、外観特徴の記述属性を認識する装置を提供する。装置は、第1の態様又は第1の態様の可能な実施のうちのいずれか1つにおいて外観特徴の記述属性を認識する方法を実行するよう構成されるモジュールを含む。モジュールは、ハードウェアを使用することによって実装されても、又は対応するソフトウェアを実行することでハードウェアによって実装されてもよい。
第5の態様は、外観特徴の記述属性を認識する装置であって、プロセッサ及びメモリを含む前記装置を提供する。メモリはコンピュータ命令を記憶し、プロセッサはメモリへ接続される。プロセッサは、メモリ内のコンピュータ命令を実行して、第1の態様又は第1の態様の可能な実施のうちのいずれか1つにおける方法を実行するよう構成される。
第6の態様は、外観特徴の記述属性を認識する装置を提供する。装置は、第2の態様又は第2の態様の可能な実施のうちのいずれか1つにおいて外観特徴の記述属性を認識する方法を実行するよう構成されるモジュールを含む。モジュールは、ハードウェアを使用することによって実装されても、又は対応するソフトウェアを実行することでハードウェアによって実装されてもよい。
第7の態様は、外観特徴の記述属性を認識する装置であって、プロセッサ及びメモリを含む前記装置を提供する。メモリはコンピュータ命令を記憶し、プロセッサはメモリへ接続される。プロセッサは、メモリ内のコンピュータ命令を実行して、第2の態様又は第2の態様の可能な実施のうちのいずれか1つにおける方法を実行するよう構成される。
第8の態様は、外観特徴の記述属性を認識する装置を提供する。装置は、第3の態様又は第3の態様の可能な実施のうちのいずれか1つにおいて外観特徴の記述属性を認識する方法を実行するよう構成されるモジュールを含む。モジュールは、ハードウェアを使用することによって実装されても、又は対応するソフトウェアを実行することでハードウェアによって実装されてもよい。
第9の態様は、外観特徴の記述属性を認識する装置であって、プロセッサ及びメモリを含む前記装置を提供する。メモリはコンピュータ命令を記憶し、プロセッサはメモリへ接続される。プロセッサは、メモリ内のコンピュータ命令を実行して、第3の態様又は第3の態様の可能な実施のうちのいずれか1つにおける方法を実行するよう構成される。
本発明の実施形態は、外観特徴の記述属性を認識する方法及び装置を提供する。標的画像の外観特徴の位置特徴が取得され、そして、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置が決定される。ここで、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、外観特徴の位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、画像処理デバイスに標的画像を局所処理方法で処理するように指示するために使用される。位置特徴に基づき標的領域が認識され、標的領域は対象の部分を含む。次いで、標的領域に対して特徴解析が実行され、対象の外観特徴の記述属性が認識される。局所属性を有している外観特徴の位置特徴が決定される。局所属性を有している外観特徴の場合に、無意味な認識領域を減らし、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らすために、標的画像からは、対象のものであって外観特徴によって指し示される部分が位置している標的領域が、特徴解析のための認識領域として意図的に選択される。
本発明の実施形態における技術的解決法をより明りょうに記載すべく、以下は、本発明の実施形態について説明するために必要とされる添付の図面について簡単に述べる。
本発明の実施形態に従う画像処理システムの構成図である。 本発明の実施形態に従う画像処理デバイス120の構造図である。 本発明の実施形態に従って外観特徴の記述属性を認識する方法のフローチャートである。 本発明の実施形態に従って標的領域を決定する概略図である。 本発明の実施形態に従って標的領域の移動後に得られる概略図である。 本発明の実施形態に従うブロック分割図の概略図である。 本発明の実施形態に従って外観特徴の記述属性を認識する他の方法のフローチャートである。 本発明の実施形態に従って外観特徴の記述属性を認識する他の方法のフローチャートである。 本発明の実施形態に従って外観特徴の記述属性を認識する装置の構造図である。 本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。 本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。 本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。 本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。 本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。
以下は、添付の図面を参照して、本発明の実施形態における技術的解決法について明りょう且つ完全に記載する。明らかに、記載されている実施形態は、本発明の実施形態の一部にすぎず、全てではない。
実施形態において提供される画像処理デバイス、装置、及び方法は、主として歩行者監視分野に適用され、監視映像内の歩行者及び歩行者の外観特徴の記述属性を認識するために使用される。外観特徴は、監視下にある人物の外観の特徴が属するタイプを示すために使用される。例えば、外観特徴は、人の髪の色若しくは髪の長さ、又は皮膚の色、身長、性別、着衣のタイプ、あるいは、歩行者の携行しているかばんのタイプであってよい。代替的に、車両監視分野における適用では、外観特徴、車両の色、車両ナンバープレート、又は車両の運転手の顔特徴、着衣のスタイル、若しくは性別、などであってよい。記述属性は、人物の外観の特徴を識別するために使用される。例えば、外観特徴は、歩行者の皮膚の色である。皮膚の色は、複数の記述属性、すなわち、黄、黒、及び白を含む。
実施形態において提供される、外観特徴の記述属性を認識する方法及び装置は、画像処理システムに適用される。図1は、本発明の実施形態に従う画像処理システムの構成図である。図1に示されるように、画像処理システムは、初期画像撮影装置110及び画像処理デバイス120を含む。初期画像撮影装置110は、画像処理デバイス120へ通信上接続されている。初期画像撮影装置110は、異なる撮影角度で初期画像をモニタし取得するよう構成され、このとき、初期画像は対象を含む。初期画像撮影装置110は、初期画像を画像処理デバイス120へ送る。初期画像を受け取った後、画像処理デバイス120は、初期画像内の対象の輪郭を認識し、輪郭によって形成された輪郭画像を得る。輪郭画像は対象を含む。
輪郭画像を取得した後、画像処理デバイス120は、輪郭画像内の対象を含む標的画像を取得する。輪郭画像内の対象を含む標的画像を取得する方法において、画像処理デバイス120は、前もってセットされた対象モデルにおける対象の角度に基づく面上で輪郭画像の角度を回転させる。このとき、角度回転後に得られる輪郭画像内の対象の角度は、前もってセットされた対象モデルにおける対象の角度と同じであり、輪郭画像内の対象及び前もってセットされた対象モデル内の対象は、同じ対象タイプに属する。例えば、初期画像内の対象が歩行者である場合には、前もってセットされた対象モデルは、前もってセットされた人体モデル、具体的に、直立した人体モデルである。例えば、初期画像内の対象が車両である場合には、前もってセットされた対象モデルは、前もってセットされた車両モデルである。輪郭画像内の対象を含む標的画像を取得する他の方法において、画像処理デバイス120は、ユーザによって入力された標的画像を受け取る。このとき、標的画像は、ユーザが端末デバイスを使用して輪郭画像を回転させた後に得られる標的画像であり、端末デバイスは、この実施形態で提供されている画像処理デバイス120であってよい。画像処理デバイスは、端末デバイスとして使用されてよく、ユーザによって入力された命令を受け取り、標的画像を得るために輪郭画像を回転させるよう構成される。
標的画像を取得した後、画像処理デバイス120は、外観特徴の位置属性が大域属性又は局所属性であるかどうかを判定する。局所属性は、標的画像を局所処理方法で処理するように画像処理デバイス120に指示するために使用され、大域属性は、標的画像を大域処理方法で処理するように画像処理デバイス120に指示するために使用される。
外観特徴の位置属性が局所属性である場合には、画像処理デバイス120は、外観特徴の位置特徴に一致する標的領域を認識し、標的領域に対して特徴解析を実行し、対象の外観特徴の記述属性を認識する。標的領域は、対象の部分を含む。
外観特徴の位置属性が大域属性である場合には、画像処理デバイス120は、標的画像に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。
この実施形態で提供されている画像撮影装置110は、画像撮影、写真撮影、などを通じて画像を取得する機能を具備するデスクトップコンピュータ、サーバ、モバイルコンピュータ、モバイル写真撮影機、手持ち式端末デバイス、装着型写真撮影機、などである。
この実施形態で提供されている画像処理デバイス120は、デスクトップコンピュータ、サーバ、モバイルコンピュータ、手持ち式端末デバイス、などである。
図2は、本発明の実施形態に従う画像処理デバイス120の構造図である。図2に示されるように、この実施形態で提供されている画像処理デバイス120は、コンピュータであり、プロセッサ11、メモリ12、通信バス13、及びインターフェイス14を含む。プロセッサ11は、通信バス13を使用することによってメモリ12と通信する。
インターフェイス14は、端末デバイスと通信するよう構成される。端末デバイスによって送られるデータ122及び情報は、インターフェイス14を使用することによって受け取られ得る。データ122は、標的画像を含む。
メモリ12は、プログラム121を記憶するよう構成される。プログラム121は、対象の外観特徴の記述属性を認識するために使用される。プログラム121は、画像処理機能のプログラムを含む。画像処理機能は、確率の形で表される、記述属性を認識することの結果を出力するための画像処理モデルを使用する機能である。画像処理モデルは、画像を処理するために使用される数学モデル、例えば、畳み込みニューラルネットワークであってよい。
メモリ12は、データ122と、インターフェイス14を使用することによって送られる情報とを記憶するよう更に構成される。
メモリ12は、揮発性メモリ、不揮発性メモリ、又はそれらの組み合わせを含む。揮発性メモリは、例えば、ランダム・アクセス・メモリ(英語:random-access memory,RAM)である。不揮発性メモリは、フロッピーディスク、ハードディスク、固体状態ディスク(solid state disk,SSD)、又は光ディスクなどの、プログラムコードを記憶することができる任意のマシン読み出し可能な媒体である。
プロセッサ11は、プログラム121を実行して、外観特徴の記述属性を認識するよう構成される。プロセッサ11は、外観特徴の位置属性が大域属性又は局所属性であるかどうかを判定するよう構成される。位置属性が局所属性である場合には、プロセッサ11は、外観特徴の位置特徴に一致する標的領域を認識し、標的領域に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置を示すために使用される。標的領域は、対象のものであって外観特徴によって指し示される部分を含む。位置属性が大域属性である場合には、プロセッサ11は、インターフェイス14を使用することによって受け取られる標的画像に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。
プロセッサ11は、画像処理デバイス120のメインデバイスの1つである。プロセッサ11の主たる機能は、コンピュータ命令を説明し、コンピュータソフトウェアにおいてデータを処理することである。プロセッサ11は、中央演算処理装置(英語:central processing unit,CPU)、複合プログラム可能論理デバイス(英語:Complex Programmable Logic Device,CPLD)、又はフィールド・プログラマブル・ゲート・アレイ(Field-Programmable Gate Array,FPGA)であってよい。
以下は、本発明の実施形態で開示される、外観特徴の記述属性を認識する方法について具体的に説明する。外観特徴の記述属性を認識する方法は、図1及び図2に示される画像処理デバイス120に適用され、画像処理デバイス120のプロセッサ11によって実行される。図3aは、本発明の実施形態に従って外観特徴の記述属性を認識する方法のフローチャートである。図3aに示されるように、この実施形態は、歩行者監視分野に適用され、対象の外観特徴の位置属性が局所属性である場合に対象の外観特徴の記述属性を認識する方法について主に記載する。方法は、具体的に、次のステップを含む。
S310.対象を含む標的画像を取得する。このステップで標的画像を取得することの詳細については、図1に示された上記の内容を参照されたい。輪郭画像を取得した後、画像処理システムの画像処理デバイス120は、輪郭画像内の対象を含む標的画像を取得する。詳細は、ここで再びは記載されない。
S320.標的画像の外観特徴の位置特徴を取得する。外観特徴は局所属性を有しており、局所属性は、標的画像を局所処理方法で処理するように画像処理デバイスに指示するために使用される。外観特徴の位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置を示すために使用される。
外観特徴の位置特徴を取得する方法は、外観特徴の位置特徴を含む情報を受け取り、外観特徴の位置特徴を取得することであり、このとき、情報は、外観特徴の位置特徴を示すために使用される。外観特徴の位置特徴を取得する他の方法は、画像処理デバイス120に事前に記憶されている、外観特徴と位置特徴との間の対応をクエリし、外観特徴及び対応に基づき外観特徴の位置特徴を取得することである。
この実施形態における前もってセットされた対象モデルは、前もってセットされた人体モデルである。外観特徴の位置特徴は、前もってセットされた人体モデルにおいて人体のものであって外観特徴によって指し示される部分の位置を示すために使用される。前もってセットされた人体モデルにおける人体の部分の位置は、次の2つの方法で決定される。
1つの方法では、前もってセットされた人体モデルにおける人体の部分の輪郭と、前もってセットされた人体モデルの輪郭との間の位置の比が、決定される。位置の比は、前もってセットされた人体モデルにおける人体の部分の位置を決定するよう、すなわち、外観特徴の位置特徴を決定するよう、前もってセットされた人体モデルにおける人体の部分の輪郭と、前もってセットされた人体モデルの輪郭との間の投影関係を取得することによって決定され得る。
他の方法では、人体の部分を含む幾何学領域及び、人体の部分を含む幾何学領域と、前もってセットされた人体モデルを含む幾何学領域との間の位置の比が、前もってセットされた人体モデルにおける人体の部分の位置を決定するよう、すなわち、外観特徴の位置特徴を決定するよう、決定される。人体の部分を含む幾何学領域は、前もってセットされた人体モデルにおける人体の部分の最上点から最下点の間の高さ線と、前もってセットされた人体モデルにおける人体の部分の最左点から最右点の間の幅線とによって形成される第1の対称な幾何学領域である。前もってセットされた人体モデルを含む幾何学領域は、前もってセットされた人体モデルの最上点から最下点の間の高さ線と、前もってセットされた人体モデルの最左点から最右点の間の幅線とによって形成される第2の対称な幾何学領域である。この実施において、位置の比は、第1の対称な幾何学領域の高さと第2の対称な幾何学領域の高さとの間の比に基づき、又は第1の対称な幾何学領域の幅と第2の対称な幾何学領域の幅との間の比に基づき決定され得る。代替的に、位置の比は、第1の対称な幾何学領域の高さと第2の対称な幾何学領域の高さとの間の比、及び第1の対称な幾何学領域の幅と第2の対称な幾何学領域の幅との間の比の両方に基づき、決定される。代替的に、位置の比は、第1の対称な幾何学領域と第2の対称な幾何学領域との間の投影関係に基づき決定される。
S330.対象の部分を含む標的領域を位置特徴に基づき認識する。
外観特徴の位置特徴が、前もってセットされた人体モデルにおける人体の部分の輪郭と、前もってセットされた人体モデルの輪郭との間の投影関係に基づき、決定される場合には、ステップS330において、画像処理デバイス120は、投影関係を含む輪郭を拡大又は縮小し、このとき、投影関係を含む拡大縮小された輪郭と、標的画像内の対象の輪郭との間の差は、特定の誤差範囲内に収まり、次いで、画像処理デバイス120は、投影関係に基づき、人体の部分を含む標的領域を認識する。
以下は、第1の対称な幾何学領域の高さと第2の対称な幾何学領域の高さとの間の比に基づき位置の比を決定することによって標的領域を認識する方法について記載する例を使用する。
例えば、外観特徴は髪であり、外観特徴の記述属性は短髪及び長髪を含む。髪の外観特徴の位置特徴は、前もってセットされた人体モデルを含む第2の対称な幾何学領域の上1/2の領域における第1の対称な幾何学領域の位置の比を決定することによって、取得される。外観特徴の位置特徴を取得した後、標的画像は、前もってセットされた人体モデルを含む第2の対称な幾何学領域の上1/2の領域における第1の対称な幾何学領域の位置の比に基づき、2つの領域部分、すなわち、上領域及び下領域に分けられ、標的画像の上領域が標的領域として選択される。図3bは、本発明の実施形態に従って標的領域を決定することの概略図である。図3bに示される右の画像において、標的画像は2つの領域部分、すなわち、上領域及び下領域に分けられており、標的画像の上領域が標的領域として選択されている。
第2の対称な幾何学領域における第1の対称な幾何学領域の位置の比は、左上角の座標と右下角の座標との組み合わせを使用することによって示され得る。例えば、上1/2の領域の位置の比は、ふた組の座標[0,0]及び[w,h/2]を使用することによって示される。画像処理デバイス120は、左上角の座標と右下角の座標との組み合わせに基づき、標的領域の位置が、左上角の座標と右下角の座標とによって形成される、標的画像の上1/2の領域であることを決定する。高さの比に基づき決定される位置の比に基づき位置特徴が決定される場合には、標的領域の幅は、デフォルトで標的画像の幅wであってよく、hは、標的画像の垂直高さを示す。
位置の比は、左上角の座標と右下角の座標との組み合わせを使用することによって、又は他の方法で、示され得る。例えば、標的領域の位置は、ロケーションアルゴリズムを使用するによって「上1/2」又は「首及び頭部」などの取得されたフォーマルパラメータに基づき計算を通じて決定されるか、あるいは、フォーマルパラメータと左上角の座標と右下角の座標との組み合わせとの間の事前に記憶された対応をクエリし、左上角の座標と右下角の座標との組み合わせを得ることによって決定される。
他の例として、外観特徴はバッグであり、外観特徴の記述属性は、バックパック、メッセンジャーバッグ、及びショルダーバッグを含む。バッグの外観特徴の位置特徴は、前もってセットされた人体モデルを含む第2の対称な幾何学領域の真ん中1/3の領域における第1の対称な幾何学領域の位置の比を決定することによって取得される。標的画像は、前もってセットされた人体モデルを含む第2の対称な幾何学領域の真ん中1/3の領域における第1の対称な幾何学領域の位置の比に基づき、3つの領域部分、すなわち、上領域、中領域、及び下領域に分けられ、標的画像の中領域が標的領域として選択される。例えば、真ん中1/3の領域の位置の比は、左上角の座標と右下角の座標との組み合わせを使用することによって、すなわち、ふた組の座標[0,h/3]及び[w,2h/3]を使用することによって、決定され得る。図3bに示される左の画像において、標的画像は3つの領域部分、すなわち、上領域、中領域、及び下領域に分けられており、標的画像の中領域が標的領域として選択されている。
更なる他の例として、外観特徴は、下半身部分の服装であり、外観特徴の記述属性は、ズボン、ショートパンツ、ミニスカート、スカート、キュロット、などを含む。下半身部分の服装の外観特徴の位置特徴は、第1の対称な幾何学領域が前もってセットされた人体モデルを含む第2の対称な幾何学領域の下1/3の領域内にあると決定することによって、取得される。標的画像は、前もってセットされた人体モデルを含む第2の対称な幾何学領域の下1/3の領域における第1の対称な幾何学領域の位置の比に基づき、3つの領域部分、すなわち、上領域、中領域、及び下領域に分けられ、標的画像の下領域が標的領域として選択される。
他の実施において、第2の対称な幾何学領域における第1の対称な幾何学領域の位置の比は、複数の座標対の組み合わせを使用することによって決定されてもよい。
位置の比が、第1の対称な幾何学領域の高さと第2の対称な幾何学領域の高さとの間の比、及び第1の対称な幾何学領域の幅と第2の対称な幾何学領域の幅との間の比の両方に基づき決定される場合に、標的領域の位置を決定するよう、位置の比は、左上角の座標、左下角の座標、右上角の座標、及び右下角の座標との組み合わせに基づき決定されてもよい。例えば、座標組み合わせは、左上角の座標[w/4,h/3]、左下角の座標[w/3,2h/3]、右上角の座標[3w/4,h/3]、及び右上角の座標[2w/3,2h/3]を含む。座標組み合わせを使用することによって決定される標的領域は、標的画像の真ん中部分にある逆台形領域である。他の実施において、第2の対称な幾何学領域における第1の対称な幾何学領域の位置の比は、少なくともふた組の座標、すなわち、左上角の座標、左下角の座標、右上角の座標、及び右下角の座標の組み合わせを使用することによって、決定され得る。
S340.標的領域に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。
特徴解析は、確率の形で表される、記述属性の認識結果を得るよう、画像処理技術を使用することによって標的領域に対して実行される。例えば、外観特徴が髪であるとき、髪の長さの少なくとも2つの記述属性、すなわち、長髪の記述属性及び短髪の記述属性がある。この場合に、確率の形で表される、記述属性の取得される認識結果は、2つの確率の組み合わせ、すなわち、(短髪の記述属性について0.9、及び長髪の記述属性について0.1)である。次いで、包括的な判定ルールに従う確率に対応する記述属性が、包括的な判定ルールに従って認識され、記述属性は、標的画像内の対象の外観特徴の記述属性として使用される。包括的な判定ルールは、比較又はクエリ後に、目標データに近い記述属性を選択することであってよい。例えば、目標データの値が1であり、それは、対象の外観特徴の記述属性が短髪であることを示す。この場合に、最も高い確率0.9に対応する短髪の記述属性についての0.9が、標的画像内の対象の外観特徴の記述属性として選択される。
図3aに示される実施形態に基づき、ステップS320の前に、画像処理デバイス120は、対象の外観特徴の位置属性を取得し、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。外観特徴の位置属性を取得する方法は、外観特徴の位置属性を含み、端末デバイスによって送られる情報を受け取って、外観特徴の位置属性を取得することである。例えば、外観特徴が髪であって、髪の記述属性が長髪及び短髪を含むとき、髪の外観特徴の位置属性が局所属性であることを示すようユーザによって送られた情報が受け取られ、髪の位置属性は局所属性と決定される。他の例として、外観特徴がバッグの一種であり、その種類のバッグの記述属性がバックパック又はハンドバッグを含むとき、その種類のバッグの外観特徴の位置属性が局所属性であることを示すようユーザによって送られた情報が受け取られ、その種類のバッグの位置属性は局所属性と決定される。更なる他の例として、外観特徴が下半身部分の服装であり、下半身部分の服装の記述属性がズボン又はスカートを含むとき、下半身部分の服装の外観特徴の位置属性が局所属性であることを示すようユーザによって送られた情報が受け取られ、下半身部分の衣服の位置属性は局所属性と決定される。
図3aに示される実施形態に基づき、ステップS320の前に、画像処理デバイス120は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得し、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。
図3aに示される実施形態に基づき、ステップS320の前に、画像処理デバイス120は、対象の外観特徴及び外観特徴の記述属性を取得する。ある方法では、画像処理デバイス120は、インターフェイス14を使用することによって、テキストを使用することによってユーザによって入力される外観特徴及び外観特徴の記述属性を受け取る。他の方法では、画像処理デバイス120は、視覚インターフェイス上での選択を通じてユーザによって入力される外観特徴及び外観特徴の記述属性を受け取る。更なる他の方法では、画像処理デバイス120は、外観特徴及び外観特徴の記述属性を含み、端末デバイスによって送られる情報を受け取って、対象の外観特徴及び外観特徴の記述属性を取得する。
図3aに示される実施形態に基づき、ステップS330が実行された後に、画像処理デバイス120は、中心として標的領域を使用することによって、標的領域を任意の方向で、複数の異なる指定された方向で、又は複数の指定された方向の中から選択された複数のランダムな方向で動かして、複数のオフセット領域を取得する。図3cは、本発明の実施形態に従って、標的領域の移動後に取得される概略図である。図3cに示されるように、実線ボックスによって形成された標的領域は、2つのオフセット領域(図中、左の破線ボックスによって形成されるオフセット領域、及び右の破線ボックスによって形成されるオフセット領域)を別々に得るよう、左の方向に及び右の方向に動かされている。左方向の移動の後に得られた、左の破線ボックスによって形成されるオフセット領域は、頭部全体を含み、標的領域及び、右方向の移動の後に得られたオフセット領域は、夫々頭部の一部分しか含まない。従って、標的領域が動かされた後、より正確な認識領域が取得され得る。次いで、図3cに示されるように、画像処理デバイス120は、画像処理技術を使用することによってオフセット領域に対して特徴解析を実行し、外観特徴の他の記述属性を取得し、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から目標記述属性を決定する。このとき、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である。
記述属性及び他の記述属性が確率の形で表される場合に、目標データの値は1であってよく、前もってセットされたアルゴリズムは、最も高い確率を使用することによって表される目標記述属性を認識し、目標記述属性を、標的画像内の対象の外観特徴の記述属性として使用することである。例えば、比較又はクエリの後、最も高い確率を使用することによって表される記述属性が、標的画像内の対象の外観特徴の記述属性として選択されてよい。他の例として、確率の和が、標的領域及び各オフセット領域に対応する同じ記述属性の確率に対して加算演算を実行することによって求められ、平均化処理又はサポートベクトルマシン処理が確率の和に対して実行され、最も高い確率を使用することによって表される目標記述属性が、標的画像内の対象の外観特徴の記述属性として選択される。他の実施において、目標データは、標準画像の標準パラメータであってよく、特徴解析が種々の方法で標準画像に対して実行された後に得られる標準パラメータであってよい。
オフセット領域を取得することの上記の実施において、1つ以上のオフセット領域を得るために標的領域に基づき標的領域を動かすことの具体的な実施は、標的領域を複数のブロックに分割することであり、このとき、複数のブロックは、形状が同じであり、複数のブロックは、連続的である。例えば、ブロックの形状は、水平バー、垂直バー、垂直グリッド、又は水平グリッドであってよい。図3dは、本発明の実施形態に従うブロック分割図の概略図である。図3dに示されるように、各画像内で太線によって形成される領域は、標的領域である。本発明のこの実施形態で提供されるブロック分割図は、図3dの左側に示される垂直バー形状のブロック分割図であっても、図3dの真ん中に示される水平バー形状のブロック分割図であっても、あるいは、図3dの右側に示される垂直又は水平グリッド形状のブロック分割図であってもよい。ブロックの形状は、本発明のこの実施形態において限定されない。次いで、図3dに示される3つの画像において、標的領域は、1つ以上のオフセット領域を得るために、標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において1つ以上のオフセット単位を動かされる。このとき、各オフセット領域のサイズは、標的領域のサイズと同じであり、オフセット単位の数量は、正の整数である。
複数のオフセット領域が取得された後、オフセット領域又は標的領域は、オフセット領域又は標的領域を含む候補領域を得るよう、1つ以上の異なる前もってセットされたサイズに従って周りを拡張される。候補領域のサイズは、オフセット領域のサイズよりも大きい。候補領域が取得された後、画像処理技術を使用することによって候補領域に対して特徴解析が実行され、外観特徴の他の記述属性が取得され、目標記述属性は、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から決定される。このとき、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である。他の記述属性は、特徴解析が候補領域に対して実行された後に取得される、候補領域に対応する外観特徴の記述属性を含むか、あるいは、特徴解析がオフセット領域に対して実行された後に取得される、オフセット領域に対応する外観特徴の記述属性を更に含む。
記述属性及び他の記述属性が確率の形で表される場合に、目標データの値は1であってよく、前もってセットされたアルゴリズムは、最も高い確率を使用することによって表される目標記述属性を認識し、目標記述属性を、標的画像内の対象の外観特徴の記述属性として使用することである。例えば、比較又はクエリの後、最も高い確率を使用することによって表される記述属性が、標的画像内の対象の外観特徴の記述属性として選択されてよい。例えば、髪の外観特徴の記述属性は短髪及び長髪を含み、特徴解析は、標的領域、オフセット領域、及び候補領域に対して実行される。この場合に、目標データの値が1であることは、短髪の記述属性の標準として使用され、特徴解析は、1つの標的領域、1つのオフセット領域、及び2つの候補領域に対して別々に実行される。標的領域、オフセット領域、及び候補領域に対応する記述属性の取得される確率は、夫々、[短髪の記述属性:0.7,長髪の記述属性:0.3]、[短髪の記述属性:0.95,長髪の記述属性:0.05]、[短髪の記述属性:0.6,長髪の記述属性:0.4]、及び[短髪の記述属性:0.45,長髪の記述属性:0.55]である。選択結果は、最大数演算を通じて第1の記述属性0.95である。換言すれば、髪の記述属性は、短髪の記述属性として認識される。他の例として、確率の和が、標的領域、各オフセット領域、及び各候補領域に対応する同じ記述属性の確率に対して加算演算を実行することによって求められ、平均化処理又はサポートベクトルマシン処理が確率の和に対して実行され、最も高い確率を使用することによって表される目標記述属性が、標的画像内の対象の外観特徴の記述属性として選択される。他の実施において、目標データは、標準画像の標準パラメータであってよく、特徴解析が種々の方法で標準画像に対して実行された後に得られる標準パラメータであってよい。
他の実施形態では、複数のオフセット領域又は複数の候補領域が取得された後、標的領域内の人体の部分、各オフセット領域内の人体の部分、及び各候補領域内の人体の部分に対して別々に輪郭認識が実行されてよい。前もってセットされた人体モデルの人体の部分と同じ輪郭形状を有している標的領域、オフセット領域、又は候補領域が認識されるとき、標的領域、オフセット領域、又は候補領域はリザーブされ、そして、リザーブされた標的領域に対応する記述属性、夫々のリザーブされたオフセット領域に対応する他の記述属性、及び夫々のリザーブされた候補領域に対応する他の記述属性を得るために、前もってセットされた人体モデルの人体の部分と同じ輪郭形状を有している標的領域、オフセット領域、又は候補領域に対して別々に特徴解析が実行される。標的領域に対応する上記の記述属性と、候補領域及びオフセット領域に対応する複数の他の記述属性とを取得した後、画像処理デバイス120は、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から目標記述属性を決定する。このとき、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である。前もってセットされたアルゴリズムについては、図3aに基づき記載された詳細を参照されたい。すなわち、特徴解析がオフセット領域及び候補領域に対して実行された後、外観特徴の他の記述属性が取得され、目標記述属性は、前もってセットされたアルゴリズムに従って、記述属性及び他の記述属性から決定される。詳細は、ここで再びは記載されない。
複数のオフセット領域が取得された後、前もってセットされた数量のオフセット領域が、人体の部分の輪郭認識又は特徴解析のために、ランダムに、又は所定の順序に従って、選択されてよい。複数の候補領域が取得された後、前もってセットされた数量の候補領域がまた、人体の部分の輪郭認識又は特徴解析のために、ランダムに、又は所定の順序に従って、選択されてもよい。前もってセットされた数量の選択された候補領域は、前もってセットされた数量のオフセット領域と同じであっても、又は異なってもよい。例えば、特徴解析は、ユーザ要件に応じて標的領域にのみ実行されればよく、あるいは、特徴解析又は輪郭認識は、ユーザの選択に基づき標的領域及び前もってセットされた数量のオフセット領域にのみ実行されればよく、あるいは、特徴解析又は輪郭認識は、ユーザ選択に基づき標的領域及び前もってセットされた数量の候補領域にのみ実行されればよく、あるいは、特徴解析は、標的領域、前もってセットされた数量のオフセット領域、及び前もってセットされた数量の候補領域に対して実行されてよい。オフセット領域が標的画像の端まで周りを拡張されるとき、得られた候補領域は標的画像である。換言すれば、オフセット領域が標的領域と同じ幅及び同じ高さを有していると認識されるとき、得られた候補領域は標的画像である。
以下は、本発明の実施形態で提供される、外観特徴の記述属性を認識する他の方法について記載する。図4は、本発明の実施形態に従って外観特徴の記述属性を認識する他の方法のフローチャートである。この実施形態は、歩行者監視分野に適用され、対象の外観特徴の位置属性が大域属性であるときに対象の外観特徴の記述属性を認識する方法について主に記載する。図4に示されるように、方法は、具体的に、次のステップを含む。
S410.対象を含む標的画像を取得する。このステップで標的画像を取得することの具体的な実施については、図3aに示される実施形態のステップS310の詳細を参照されたい。詳細は、ここで再びは記載されない。
S410.標的画像に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。外観特徴は大域属性を有しており、大域属性は、標的画像を大域処理方法で処理するように画像処理デバイスに指示するために使用される。特徴解析は、確率の形で表される、記述属性の認識結果を得るために、画像処理技術を使用することによって標的画像に対して実行される。包括的な判定ルールに従う確率に対応する記述属性が、包括的な判定ルールに従って認識され、記述属性は、標的画像内の対象の外観特徴の記述属性として使用される。例えば、比較又はクエリ後に、最も高い確率を使用することによって表される記述属性が、標的画像内の対象の外観特徴の記述属性として選択されてよい。
外観特徴の位置属性が大域属性であるときに外観特徴の記述属性を認識する上記の方法に基づき、ステップS420の前に、方法は、画像処理デバイス120が対象の外観特徴の位置属性を取得することを更に含み、このとき、位置属性は、外観特徴が大域属性を有していることを示すために使用される。外観特徴の位置属性を取得する方法は、外観特徴の位置属性を含み、端末デバイスによって送られる情報を受け取って、外観特徴の位置属性を取得することである。
外観特徴の位置属性が大域属性であるときに外観特徴の記述属性を認識する上記の方法に基づき、ステップS420の前に、方法は、画像処理デバイス120が、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得することを更に含む。このとき、位置属性は、外観特徴が大域属性を有していることを示すために使用される。
その上、対象の外観特徴の位置属性を取得する前に、画像処理デバイス120は、対象の外観特徴及び外観特徴の記述属性を取得する。対象の外観特徴及び外観特徴の記述属性を取得する方法において、画像処理デバイス120は、インターフェイス14を使用することによって、テキストを使用することによってユーザによって入力される外観特徴及び外観特徴の記述属性を受け取る。対象の外観特徴及び外観特徴の記述属性を取得する他の方法において、画像処理デバイス120は、視覚インターフェイス上での選択を通じてユーザによって入力される外観特徴及び外観特徴の記述属性を受け取る。対象の外観特徴及び外観特徴の記述属性を取得する他の方法において、画像処理デバイス120は、外観特徴及び外観特徴の記述属性を含み、端末デバイスによって送られる情報を受け取って、対象の外観特徴及び外観特徴の記述属性を取得する。
外観特徴の位置属性が大域属性であるときに外観特徴の記述属性を認識する上記の方法に基づき、ステップS420の後に、方法は、外観特徴に関連する他の外観特徴を取得し、このとき、他の外観特徴は、外観特徴の特徴に関連する、対象の外観の他の特徴が属するタイプを示すために使用される、ことと、他の外観特徴の記述属性を取得することと、他の外観特徴の記述属性を使用することによって外観特徴の記述属性を変更することとを更に含む。
この実施形態において、外観特徴に関連する他の外観特徴を取得することの実施は、外観特徴と他の外観特徴との間の、画像処理デバイスに事前に記憶されている対応をクエリし、外観特徴に関連する他の外観特徴を取得することである。外観特徴に関連する他の外観特徴を取得することの他の実施は、他の外観特徴の識別子を含む情報を受け取り、外観特徴に関連する他の外観特徴を取得することである。
この実施形態において他の外観特徴の記述属性を取得することの実施については、外観特徴の位置属性が局所属性であるときに、図3aに示される、外観特徴の記述属性を認識する上記の方法を参照されたい。詳細は、ここで再びは記載されない。
この実施形態において、外観特徴に関連する他の外観特徴の記述属性を使用することによって外観特徴の記述属性を変更することの具体的な実施は、関連性重み付けアルゴリズムを使用し、関連性重み付けアルゴリズムにおいて重み付けを実行するための重みとして、外観特徴と他の外観特徴との間の関連関係を示す関連性を使用し、標的画像内の対象の外観特徴の記述属性として、重み付け補正が外観特徴の記述属性に対して実行された後に取得される記述属性を使用することである。この実施において、大域属性を有している外観特徴に関連する他の外観特徴は、局所属性を有している。
上記の外観特徴が大域属性を有しているとき、ステップ420の後に、外観特徴の記述属性を認識する方法は、標的画像、標的領域、オフセット領域、又は候補領域を数学モデルに入力し、標的画像内の対象の外観特徴の記述属性として、目標データに近く、数学モデルを使用することによって出力される記述属性を使用することを更に含む。数学モデルは、トレーニングデータセットを使用することによってトレーニング訂正が計算モデルに対して実行された後に取得される数学モデルである。トレーニングデータセットは、他の画像及び他の画像内の対象の他の外観特徴の記述属性を含み、このとき、他の画像は、標的画像内の標的領域、オフセット領域、若しくは候補領域、又は他の対象を含み、標的画像とは異なる他の画像を含む。他の画像内の対象の他の外観特徴は、大域属性を有している標的画像の外観特徴に関連する。この実施において、他の画像内の対象の他の外観特徴は、大域属性又は局所属性を有する。他の画像に含まれる対象及び標的画像内の対象は、同じ対象タイプに属する。この実施において、計算モデルは、他の画像内の対象の他の外観特徴の記述属性と目標データとの間の差を得るよう、トレーニングデータセットを使用することによってトレーニングされ、計算モデルの計算パラメータは、計算パラメータが調整されている計算モデルを得るよう、差に基づき調整され、他の画像内の対象の外観特徴の記述属性は、調整された計算モデルを使用することによって認識される。ここで、計算モデルに対するトレーニング訂正は、他の画像内の対象の外観特徴の記述属性と目標データとの間にあって、計算モデルを使用することによって取得される差が目標誤差以下であるときに終了する。
以下は、本発明の実施形態で提供される、外観特徴の記述属性を認識する他の方法について記載する。図5は、本発明の実施形態に従って外観特徴の記述属性を認識する他の方法のフローチャートである。この実施形態は、歩行者監視分野に適用され、複数の位置特徴を使用することによって対象の外観特徴の記述属性を認識する方法について主に記載する。図5に示されるように、方法は、具体的に、次のステップを含む。
S510.対象を含む標的画像を取得する。このステップで標的画像を取得することの具体的な実施については、図3aに示される実施形態のステップS310の詳細を参照されたい。詳細は、ここで再びは記載されない。
S520.対象の外観特徴の第1位置特徴及び第2位置特徴を取得する。代替的に、対象の外観特徴の複数の位置特徴が取得されてもよく、このとき、各位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される各部分の位置を示すために使用され、外観特徴は、対象の外観の特徴が属するタイプを示すために使用される。例えば、第1位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される第1部分の位置を示すために使用され、第2位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される第2部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、標的画像を局所処理方法で処理するように画像処理デバイスに指示するために使用される。このステップで対象の外観特徴の位置特徴を取得することの実施については、図3aに示される実施形態に基づきステップS320で実施される詳細を参照されたい。詳細は、ここで再びは記載されない。
S530.第1位置特徴及び第2位置特徴に基づき第1部分と第2部分との間の最大距離を求める。最大距離は、前もってセットされた閾値よりも小さい。最大距離は、2つの部分(第1部分及び第2部分)の間の最大垂直高さ及び/又は2つの部分(第1部分及び第2部分)の間の最大幅を含む。前もってセットされた閾値は、最大距離を解析する効率が全ての標的画像を解析する効率よりも高いことを確かにする値である。複数の位置特徴が存在する場合に、最大距離は、任意の2つの部分の間の最大垂直高さ以上であるか、あるいは、任意の2つの部分の間の最大幅以上である。
S540.第1部分及び第2部分を含む標的領域を最大距離に基づき認識する。最大距離が2つの部分の間の最大垂直高さである場合に、標的領域の幅は、デフォルトで標的画像の幅である。最大距離が2つの部分の間の最大幅である場合に、標的領域の高さは、デフォルトで標的画像の高さである。最大距離が2つの部分の間の最大垂直高さ及び最大幅を含む場合には、標的領域の高さは、2つの部分の間の最大垂直高さであり、標的領域の幅は、2つの部分の間の最大幅である。複数の位置特徴が存在する場合に、標的領域は、外観特徴によって指し示される、対象の各部分を含む。
S550.標的領域に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。
複数の位置特徴を使用することによって対象の外観特徴の記述属性を認識することの実施形態に基づき、ステップS520の前に、方法は、画像処理デバイス120が対象の外観特徴の位置属性を取得することを更に含み、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。この実施形態において外観特徴の位置属性を取得する方法については、図3aに示される実施形態に基づき外観特徴の位置属性を取得することの具体的な実施詳細を参照されたい。詳細は、ここで再びは記載されない。
複数の位置特徴を使用することによって対象の外観特徴の記述属性を認識することの実施形態に基づき、ステップS520の前に、方法は、画像処理デバイス120が対象の外観特徴及び外観特徴の記述属性を取得することを更に含む。この実施形態において対象の外観特徴及び外観特徴の記述属性を取得する方法については、図3aに示される実施形態に基づき対象の外観特徴及び外観特徴の記述属性を取得することの具体的な実施詳細を参照されたい。詳細は、ここで再びは記載されない。
複数の位置特徴を使用することによって対象の外観特徴の記述属性を認識することの上記の実施形態に基づき、ステップS540の後に、方法は、オフセット領域を取得し、オフセット領域に対して特徴解析が実行された後に他の記述属性を認識し、次いで、標的領域に対して特徴解析が実行された後に認識される記述属性と、オフセット領域に対して特徴解析が実行された後に認識される他の記述属性とから、前もってセットされたアルゴリズムに従って目標記述属性を決定することを更に含む。この実施において、オフセット領域が取得され、他の記述属性はオフセット領域に基づき認識され、次いで、目標属性は、標的領域に基づき認識される記述属性と、オフセット領域に基づき認識される他の記述属性とに基づき、決定される。具体的な実施詳細については、図3aに示される実施形態における具体的な実施詳細を参照されたい。詳細は、ここで再びは記載されない。その上、候補領域がオフセット領域に基づき取得され、他の記述属性は候補領域に基づき取得され、次いで、目標記述属性は、記述属性及び複数の他の記述属性に基づき決定される。具体的な実施詳細については、図3aに示される実施形態における具体的な実施詳細を参照されたい。詳細は、ここで再びは記載されない。
プロセスの連続番号は、本発明の実施形態における実行順序を意味しないことが理解されるべきである。プロセスの実行順序は、プロセスの機能及び内部ロジックに基づき決定されるべきであり、本発明の実施形態の実施プロセスに対する如何なる限定としても解釈されるべきではない。
簡単な説明のために、上記の方法実施形態は、一連の動作組み合わせとして表されることが理解されるべきである。しかし、当業者は、本発明が記載される動作の順序に限られないと理解するはずである。その上、当業者はまた、本明細書で記載される全ての実施形態が好適な実施形態であって、関連する動作が本発明によって必ずしも必要とされないと理解するはずである。
上記の内容に基づき当業者によって考え出され得る他の適切なステップ組み合わせも、本発明の保護範囲内にある。その上、当業者はまた、本明細書で記載される全ての実施形態が好適な実施形態であって、関連する動作が本発明によって必ずしも必要とされないと理解するはずである。
図3a乃至図5を参照して、上記は、本発明の実施形態に従って外観特徴の記述属性を認識する方法について詳細に記載する。図6乃至図11を参照して、以下は、本発明の実施形態に従って外観特徴の記述属性を認識する装置について記載する。
図6は、本発明の実施形態に従って外観特徴の記述属性を認識する装置の構造図である。図6に示されるように、本発明のこの実施形態で提供される、外観特徴の記述属性を認識する装置610は、図3aに示される、外観特徴の記述属性を認識する方法に基づき、実施される。装置610は、プロセッサ611及びメモリ612を含む。メモリ612は、コンピュータ命令を記憶し、プロセッサ611は、メモリ612へ接続されている。プロセッサ611は、メモリ612内のコンピュータ命令を実行して、次のステップを実行するよう構成される。
対象を含む標的画像が取得される。この実施では、プロセッサ611が標的画像を取得する。詳細については、図3aに示されるステップS310における記載を参照されたい。詳細は、ここで再びは記載されない。
標的画像の外観特徴の位置特徴が取得され、このとき、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、外観特徴の位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、標的画像を局所処理方法で処理するように画像処理デバイスに指示するために使用される。この実施では、プロセッサ611が、標的画像の外観特徴の位置特徴を取得する。詳細については、図3aに示されるステップS320における記載を参照されたい。詳細は、ここで再びは記載されない。
対象の部分を含む標的領域が、位置特徴に基づき認識される。この実施では、プロセッサ611が、位置特徴に基づき標的領域を認識する。詳細については、図3aに示されるステップS330における記載を参照されたい。詳細は、ここで再びは記載されない。
標的領域に対して特徴解析が実行され、対象の外観特徴の記述属性が認識される。この実施では、プロセッサ611が、標的領域に対して特徴解析を実行し、対象の外観特徴の記述属性を認識する。詳細については、図3aに示されるステップS330における記載を参照されたい。詳細は、ここで再びは記載されない。
任意の実施では、プロセッサ611は、外観特徴の位置属性を受け取るよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。
任意の実施では、プロセッサ611は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得するよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。
任意の実施では、プロセッサ611は、次のステップを実行するよう更に構成される:
1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かすステップ;
オフセット領域に対して特徴解析を実行し、対象の外観特徴の他の記述属性を認識するステップ;及び
前もってセットされたアルゴリズムに従って、記述属性及び他の記述属性から目標記述属性を決定するステップであり、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である、ステップ。
この実施形態では、プロセッサ611が、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かし、オフセット領域に対して特徴解析を実行して対象の外観特徴の他の記述属性を認識し、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から目標記述属性を決定する。詳細については、図3aに示されるステップS330の後の関連する実施の記載を参照されたい。詳細は、ここで再びは記載されない。
任意の実施では、プロセッサ611は、形状が同じであって連続的である複数のブロックに標的領域を分割し、標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において標的領域を1つ以上のオフセット単位だけ動かして、1つ以上のオフセット領域を取得するよう更に構成される。このとき、各オフセット領域のサイズは、標的領域のサイズと同じであり、オフセット単位の数量は、正の整数である。
任意の実施では、プロセッサ611は、外観特徴の位置特徴を含む情報を受け取るよう更に構成され、このとき、情報は、外観特徴の位置特徴を示すために使用される。
任意の実施では、プロセッサ611は、外観特徴と位置特徴との間の事前に記憶された対応をクエリし、外観特徴及び対応に基づき外観特徴の位置特徴を取得するよう更に構成される。
本発明のこの実施形態において外観特徴の記述属性を認識する装置610は、本発明の実施形態における画像処理デバイス120に対応していてよく、本発明の実施形態において図3aに示される方法を実行するための対応するエンティティに対応していてよいことが理解されるべきである。その上、外観特徴の記述属性を認識する装置610におけるモジュールの上記及び他の動作及び/又は機能は、図3aに示される方法に関連するプロシージャを実施するために別々に使用される。簡潔さのために、詳細は、ここで再びは記載されない。
図7は、本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。図7に示されるように、本発明のこの実施形態で提供される、外観特徴の記述属性を認識する装置710は、図5に示される、外観特徴の記述属性を認識する方法に基づき、実施される。装置710は、プロセッサ711及びメモリ712を含む。メモリ712は、コンピュータ命令を記憶し、プロセッサ711は、メモリ712へ接続されている。プロセッサ711は、メモリ712内のコンピュータ命令を実行して、次のステップを実行するよう構成される。
対象を含む標的画像が取得される。この実施では、プロセッサ711が標的画像を取得する。詳細については、図3aに示されるステップS310における記載を参照されたい。詳細は、ここで再びは記載されない。
対象の外観特徴の第1位置特徴及び第2位置特徴が取得され、このとき、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、第1位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される第1部分の位置を示すために使用され、第2位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される第2部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、標的画像を局所処理方法で処理するように画像処理デバイスに指示するために使用される。この実施では、プロセッサ711が、標的画像の外観特徴の位置特徴を取得する。詳細については、図5に示されるステップS520における記載を参照されたい。詳細は、ここで再びは記載されない。
第1位置特徴及び第2位置特徴に基づき、第1部分と第2部分との間の最大距離が求められる。この実施では、プロセッサ711が、第1位置特徴及び第2位置特徴に基づき第1部分と第2部分との間の最大距離を求める。詳細については、図5に示されるステップS530における記載を参照されたい。詳細は、ここで再びは記載されない。
最大距離に基づき、第1部分及び第2部分を含む標的領域が認識される。この実施では、プロセッサ711が、最大距離に基づき標的領域を認識する。詳細については、図5に示されるステップS540における記載を参照されたい。詳細は、ここで再びは記載されない。
標的領域に対して特徴解析が実行され、標的画像内の対象の外観特徴の記述属性が認識される。この実施では、プロセッサ711が、標的領域に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。詳細については、図5に示されるステップS550における記載を参照されたい。詳細は、ここで再びは記載されない。
任意の実施では、最大距離は、前もってセットされた閾値よりも小さい。
任意の実施では、プロセッサ711は、外観特徴の位置属性を受け取るよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。
任意の実施では、プロセッサ711は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得するよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。
任意の実施では、プロセッサ711は、外観特徴の第1位置特徴及び第2位置特徴を含む情報を受け取るよう更に構成され、このとき、情報は、外観特徴の第1位置特徴及び第2位置特徴を示すために使用される。
任意の実施では、プロセッサ711は、外観特徴と第1位置特徴及び第2位置特徴の夫々との間の事前に記憶された対応をクエリし、外観特徴及び対応に基づき外観特徴の第1位置特徴及び第2位置特徴を取得するよう更に構成される。
任意の実施では、プロセッサ711は、次のステップを実行するよう更に構成される:
1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かすステップ;
オフセット領域に対して特徴解析を実行し、対象の外観特徴の他の記述属性を認識するステップ;及び
前もってセットされたアルゴリズムに従って、記述属性及び他の記述属性から目標記述属性を決定するステップであり、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である、ステップ。
この実施形態では、プロセッサ711が、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かし、オフセット領域に対して特徴解析を実行して対象の外観特徴の他の記述属性を認識し、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から目標記述属性を決定する。詳細については、図3aに示されるステップS330の後の関連する実施の記載を参照されたい。詳細は、ここで再びは記載されない。
任意の実施では、プロセッサ711は、形状が同じであって連続的である複数のブロックに標的領域を分割し、標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において標的領域を1つ以上のオフセット単位だけ動かして、1つ以上のオフセット領域を取得するよう更に構成される。このとき、各オフセット領域のサイズは、標的領域のサイズと同じであり、オフセット単位の数量は、正の整数である。
本発明のこの実施形態において外観特徴の記述属性を認識する装置710は、本発明の実施形態における画像処理デバイス120に対応していてよく、本発明の実施形態において図5に示される方法を実行するための対応するエンティティに対応していてよいことが理解されるべきである。その上、外観特徴の記述属性を認識する装置710におけるモジュールの上記及び他の動作及び/又は機能は、図5に示される方法に関連するプロシージャを実施するために別々に使用される。簡潔さのために、詳細は、ここで再びは記載されない。
図8は、本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。図8に示されるように、本発明のこの実施形態で提供される、外観特徴の記述属性を認識する装置810は、図3aに示される、外観特徴の記述属性を認識する方法に基づき、実施される。装置810は、取得ユニット811及び処理ユニット812を含み、処理ユニット812は、取得ユニット811へ接続されている。以下は、外観特徴の記述属性を認識する装置810内の各モジュールの機能について詳細に記載する。
取得ユニット811は、対象を含む標的画像を取得するよう構成される。この実施では、標的画像を取得することにおける取得ユニット811の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。標的画像を取得することにおける取得ユニット811の機能については、図3aに示される、画像処理デバイス120が標的画像を取得するステップS310で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
取得ユニット811は、標的画像の外観特徴の位置特徴が取得するよう更に構成され、このとき、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、外観特徴の位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、標的画像を局所処理方法で処理するように画像処理デバイスに指示するために使用される。この実施では、標的画像の外観特徴の位置特徴を取得することにおける取得ユニット811の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。標的画像の外観特徴の位置特徴を取得することにおける取得ユニット811の機能については、図3aに示される、画像処理デバイス120が標的画像の外観特徴の位置特徴を取得するステップS320で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
処理ユニット812は、対象の部分を含む標的領域を位置特徴に基づき認識するよう構成される。この実施では、標的領域を位置特徴に基づき認識することにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。標的領域を位置特徴に基づき認識することにおける処理ユニット812の機能については、図3aに示される、画像処理デバイス120が標的領域の位置特徴に基づき認識するステップS330で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
処理ユニット812は、標的領域に対して特徴解析を実行し、対象の外観特徴の記述属性を認識するよう更に構成される。この実施では、標的領域に対して特徴解析を実行し、対象の外観特徴の記述属性を認識することにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。標的領域に対して特徴解析を実行し、対象の外観特徴の記述属性を認識することにおける処理ユニット812の機能については、図3aに示される、画像処理デバイス120が標的領域に対して特徴解析を実行して対象の外観特徴の記述属性を認識するステップS340で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
任意の実施では、取得ユニット811は、外観特徴の位置属性を受け取るよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。この実施では、外観特徴の位置属性を受け取ることにおける取得ユニット811の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。
任意の実施では、取得ユニット811は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得するよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。この実施では、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得することにおける取得ユニット811の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施では、処理ユニット812は、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かすよう更に構成される。この実施では、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かすことにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
処理ユニット812は、オフセット領域に対して特徴解析を実行し、対象の外観特徴の他の記述属性を認識するよう更に構成される。この実施では、オフセット領域に対して特徴解析を実行して対象の外観特徴の他の記述属性を認識することにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
処理ユニット812は、前もってセットされたアルゴリズムに従って、記述属性及び他の記述属性から目標記述属性を決定するよう更に構成され、このとき、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である。この実施では、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から目標記述属性を決定することにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施では、処理ユニット812は、標的領域を複数のブロックに分割するよう更に構成される。この実施では、標的領域を複数のブロックに分割することにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
処理ユニット812は、標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において標的領域を1つ以上のオフセット単位動かして、1つ以上のオフセット領域を取得するよう更に構成される。このとき、各オフセット領域のサイズは、標的領域のサイズと同じであり、オフセット単位の数量は、正の整数である。この実施では、1つ以上のオフセット領域を取得するよう、標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において標的領域を1つ以上のオフセット単位動かすことにおける処理ユニット812の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよく、このとき、オフセット単位の数量は、正の整数である。
任意の実施では、取得ユニット811は、外観特徴の位置特徴を含む情報を受け取るよう更に構成され、このとき、情報は、外観特徴の位置特徴を示すために使用される。この実施では、外観特徴の位置特徴を含む情報を受け取ることにおける取得ユニット811の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。
任意の実施では、取得ユニット811は、外観特徴と位置特徴との間の事前に記憶された対応をクエリし、外観特徴及び対応に基づき外観特徴の位置特徴を取得するよう更に構成される。この実施では、外観特徴と位置特徴との間の事前に記憶された対応をクエリし、外観特徴及び対応に基づき外観特徴の位置特徴を取得することにおける取得ユニット811の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
本発明のこの実施形態において外観特徴の記述属性を認識する装置810は、特定用途向け集積回路(Application Specific Integrated Circuit,ASIC)又はプログラム可能論理デバイス(Programmable Logic Device,PLD)を使用することによって実施されてよいことが理解されるべきである。PLDは、複合プログラム可能論理デバイス(Complex Programmable Logic Device,CPLD)、フィールド・プログラマブル・ゲート・アレイ(Field-Programmable Gate Array,FPGA)、汎用アレイロジック(Generic Array Logic,GAL)、又はそれらの任意の組み合わせであってよい。図3aに示される、記述属性を認識する方法が、ソフトウェアを使用することによって実施されるとき、外観特徴の記述属性を認識する装置810及び装置810のモジュールは、代替的にソフトウェアモジュールであってもよい。
本発明のこの実施形態において外観特徴の記述属性を認識する装置810は、相応して、本発明の実施形態において記載される方法を実行してよい。その上、外観特徴の記述属性を認識する装置810におけるユニットの上記及び他の動作及び/又は機能は、図3aにおける方法及び図3aにおける方法に関係がある対応するプロシージャを実施するために別々に使用される。簡潔さのために、詳細は、ここで再びは記載されない。
図9は、本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。図9に示されるように、本発明のこの実施形態で提供される、外観特徴の記述属性を認識する装置910は、図5に示される、外観特徴の記述属性を認識する方法に基づき、実施される。装置910は、取得ユニット911及び処理ユニット912を含み、処理ユニット912は、取得ユニット911へ接続されている。以下は、外観特徴の記述属性を認識する装置910内の各モジュールの機能について詳細に記載する。
取得ユニット911は、対象を含む標的画像を取得するよう構成される。この実施では、標的画像を取得することにおける取得ユニット911の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。標的画像を取得することにおける取得ユニット911の機能については、図3aに示される、画像処理デバイス120が標的画像を取得するステップS310で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
取得ユニット911は、対象の外観特徴の第1位置特徴及び第2位置特徴を取得するよう更に構成され、このとき、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、第1位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される第1部分の位置を示すために使用され、第2位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される第2部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、標的画像を局所処理方法で処理するように画像処理デバイスに指示するために使用される。この実施では、対象の外観特徴の第1位置特徴及び第2位置特徴を取得することにおける取得ユニット911の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。対象の外観特徴の第1位置特徴及び第2位置特徴を取得することにおける取得ユニット911の機能については、図5に示される、画像処理デバイス120が対象の外観特徴の第1位置特徴及び第2位置特徴を取得するステップ520で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
処理ユニット912は、第1位置特徴及び第2位置特徴に基づき、第1部分と第2部分との間の最大距離を求めるよう構成される。この実施では、第1位置特徴及び第2位置特徴に基づき第1部分と第2部分との間の最大距離を求めることにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。第1位置特徴及び第2位置特徴に基づき第1部分と第2部分との間の最大距離を求めることにおける処理ユニット912の機能については、図5に示される、画像処理デバイス120が第1位置特徴及び第2位置特徴に基づき第1部分と第2部分との間の最大距離を求めるステップS530で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
処理ユニット912は、最大距離に基づき、第1部分及び第2部分を含む標的領域を認識するよう更に構成される。この実施では、標的領域を最大距離に基づき認識することにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。標的領域を最大距離に基づき認識することにおける処理ユニット912の機能については、図5に示される、画像処理デバイス120が最大距離に基づき標的領域を認識するステップS540で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
処理ユニット912は、標的領域に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識するよう更に構成される。この実施では、標的領域に対して特徴解析を実行して標的画像内の対象の外観特徴の記述属性を認識することにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。標的領域に対して特徴解析を実行して標的画像内の対象の外観特徴の記述属性を認識することにおける処理ユニット912の機能については、図5に示される、画像処理デバイス120が標的領域に対して特徴解析を実行して標的画像内の対象の外観特徴の記述属性を認識するステップS550で記載される具体的な詳細を参照されたい。詳細は、ここで再びは記載されない。
任意の実施では、最大距離は、前もってセットされた閾値よりも小さい。
任意の実施では、取得ユニット911は、外観特徴の位置属性を受け取るよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。この実施形態では、外観特徴の位置属性を受け取ることにおける取得ユニット911の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。
任意の実施では、取得ユニット911は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得するよう更に構成され、このとき、位置属性は、外観特徴が局所属性を有していることを示すために使用される。この実施では、外観特徴と位置属性との間の事前に記憶された対応から対象の外観特徴の位置属性を取得することにおける取得ユニット911の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施では、取得ユニット911は、外観特徴の第1位置特徴及び第2位置特徴を含む情報を受け取るよう更に構成され、このとき、情報は、外観特徴の第1位置特徴及び第2位置特徴を示すために使用される。この実施では、外観特徴の第1位置特徴及び第2位置特徴を含む情報を受け取ることにおける取得ユニット911の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。
任意の実施では、取得ユニット911は、外観特徴と第1位置特徴及び第2位置特徴の夫々との間の事前に記憶された対応をクエリし、外観特徴及び対応に基づき外観特徴の第1位置特徴及び第2位置特徴を取得するよう更に構成される。この実施では、外観特徴と第1位置特徴及び第2位置特徴の夫々との間の事前に記憶された対応をクエリし、外観特徴及び対応に基づき外観特徴の第1位置特徴及び第2位置特徴を取得することにおける取得ユニット911の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施では、処理ユニット912は、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かすよう更に構成される。この実施では、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、特定の方向において標的領域を動かすことにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい
処理ユニット912は、オフセット領域に対して特徴解析を実行し、対象の外観特徴の他の記述属性を認識するよう更に構成される。この実施では、オフセット領域に対して特徴解析を実行して対象の外観特徴の他の記述属性を認識することにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
処理ユニット912は、前もってセットされたアルゴリズムに従って、記述属性及び他の記述属性から目標記述属性を決定するよう更に構成され、このとき、目標記述属性は、記述属性及び他の記述属性の中で目標データに最も近い記述属性である。この実施形態では、前もってセットされたアルゴリズムに従って記述属性及び他の記述属性から目標記述属性を決定することにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施では、処理ユニット912は、形状が同じであって連続的である複数のブロックに標的領域を分割するよう更に構成される。この実施形態では、標的領域を複数のブロックに分割することにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
処理ユニット912は、標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において標的領域を1つ以上のオフセット単位だけ動かして、1つ以上のオフセット領域を取得するよう更に構成される。このとき、各オフセット領域のサイズは、標的領域のサイズと同じであり、オフセット単位の数量は、正の整数である。この実施では、1つ以上のオフセット領域を取得するよう、中心として標的領域を使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向において標的領域を1つ以上のオフセット単位だけ動かすことにおける処理ユニット912の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよく、このとき、オフセット単位の数量は、正の整数である。
本発明のこの実施形態において外観特徴の記述属性を認識する装置910は、特定用途向け集積回路(Application Specific Integrated Circuit,ASIC)又はプログラム可能論理デバイス(Programmable Logic Device,PLD)を使用することによって実施されてよいことが理解されるべきである。PLDは、複合プログラム可能論理デバイス(Complex Programmable Logic Device,CPLD)、フィールド・プログラマブル・ゲート・アレイ(Field-Programmable Gate Array,FPGA)、汎用アレイロジック(Generic Array Logic,GAL)、又はそれらの任意の組み合わせであってよい。図5に示される、記述属性を認識する方法が、ソフトウェアを使用することによって実施されるとき、外観特徴の記述属性を認識する装置910及び装置910のモジュールは、代替的にソフトウェアモジュールであってもよい。
本発明のこの実施形態において外観特徴の記述属性を認識する装置910は、相応して、本発明の実施形態において記載される方法を実行してよい。その上、外観特徴の記述属性を認識する装置910におけるユニットの上記及び他の動作及び/又は機能は、図5における方法及び図5における方法に関係がある対応するプロシージャを実施するために別々に使用される。簡潔さのために、詳細は、ここで再びは記載されない。
図10は、本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。図10に示されるように、本発明のこの実施形態で提供される、外観特徴の記述属性を認識する装置1010は、図4に示される、外観特徴の記述属性を認識する方法に基づき、実施される。装置1010は、プロセッサ1011及びメモリ1012を含む。メモリ1012は、コンピュータ命令を記憶し、プロセッサ1011は、メモリ1012へ接続されている。プロセッサ1011は、メモリ1012内のコンピュータ命令を実行して、次のステップを実行するよう構成される。
対象を含む標的画像が取得される。この実施では、プロセッサ1011が標的画像を取得する。詳細については、図3aに示されるステップS310における記載を参照されたい。詳細は、ここで再びは記載されない。
標的画像に対して特徴解析が実行され、標的画像内の対象の外観特徴の記述属性が認識される。外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、記述属性は、対象の外観の特徴を識別するために使用され、外観特徴は大域属性を有し、大域属性は、標的画像を処理する方法が大域的処理であることを示すために使用される。
この実施では、プロセッサ1011が、標的画像に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識する。詳細については、図4に示されるステップS420における記載を参照されたい。詳細は、ここで再びは記載されない。
外観特徴が大域属性を有していることが、決定される。外観特徴が大域属性を有している場合に、標的画像は、特徴解析のための認識領域として直接選択され、一方、ブロック特徴解析が標的画像に対して実行される必要はない。これは、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らす。
任意の実施では、プロセッサ1011は、外観特徴の位置属性を受け取るよう更に構成され、このとき、位置属性は、外観特徴が大域属性を有していることを示すために使用される。
任意の実施では、プロセッサ1011は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得するよう更に構成され、このとき、位置属性は、外観特徴が大域属性を有していることを示すために使用される。
任意の実施では、プロセッサ1011は、次のステップを実行するよう更に構成される。
外観特徴に関連する他の外観特徴が取得され、このとき、他の外観特徴は、外観特徴の特徴に関連する、対象の外観の他の特徴が属するタイプを示すために使用され、他の外観特徴の記述属性が取得され、外観特徴の記述属性は、他の外観特徴の記述属性を使用することによって変更される。この実施では、プロセッサ1011が、外観特徴に関連する他の外観特徴を取得し、他の外観特徴の記述属性を取得し、他の外観特徴の記述属性を使用することによって外観特徴の記述属性を変更する。詳細については、図4に示されるステップS420の後の関連するステップの詳細な記載を参照されたい。詳細は、ここで再びは記載されない。
大域属性を有している外観特徴の記述属性は、大域属性を有している外観特徴に関連する、局所属性を有している他の外観特徴の記述属性を使用することによって、変更され、大域属性を有している外観特徴の記述属性を認識する精度は、向上する。
任意の実施で、プロセッサ1011は、図4に示される、外観特徴の記述属性を認識する方法における関連するステップを実行するよう更に構成される。具体的な実施詳細については、図4に示される、外観特徴の記述属性を認識する方法における関連するステップを参照されたい。詳細は、ここで再びは記載されない。
本発明のこの実施形態において外観特徴の記述属性を認識する装置1010は、本発明の実施形態における画像処理デバイス120に対応していてよく、本発明の実施形態において図4に示される方法を実行するための対応するエンティティに対応していてよいことが理解されるべきである。その上、外観特徴の記述属性を認識する装置1010におけるモジュールの上記及び他の動作及び/又は機能は、図4に示される方法に関係があるプロシージャを実施するために別々に使用される。簡潔さのために、詳細は、ここで再びは記載されない。
図11は、本発明の実施形態に従って外観特徴の記述属性を認識する他の装置の構造図である。図11に示されるように、本発明のこの実施形態で提供される、外観特徴の記述属性を認識する装置1110は、取得ユニット1111及び処理ユニット1112を含み、処理ユニット1112は、取得ユニット1111へ接続されている。以下は、外観特徴の記述属性を認識する装置1110内の各モジュールの機能について詳細に記載する。
取得ユニット1111は、対象を含む標的画像を取得するよう構成される。標的画像を取得することにおける取得ユニット1111の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。標的画像を取得することにおける取得ユニット1111の機能については、図3aに示されるステップS310の具体的な実施詳細を参照されたい。詳細は、ここで再びは記載されない。
処理ユニット1112は、標的画像に対して特徴解析を実行し、標的画像内の対象の外観特徴の記述属性を認識するよう構成され、このとき、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、記述属性は、対象の外観の特徴を識別するために使用され、外観特徴は大域属性を有し、大域属性は、標的画像を処理する方法が大域的処理であることを示すために使用される。標的画像に対して特徴解析を実行して標的画像内の対象の外観特徴の記述属性を認識することにおける処理ユニット1112の機能については、図4に示されるステップS420の具体的な実施詳細を参照されたい。詳細は、ここで再びは記載されない。
外観特徴が大域属性を有していることが、決定される。外観特徴が大域属性を有している場合に、標的画像は、特徴解析のための認識領域として直接選択され、一方、ブロック特徴解析が標的画像に対して実行される必要はない。これは、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らす。
任意の実施では、取得ユニット1111は、外観特徴の位置属性を受け取るよう更に構成され、このとき、位置属性は、外観特徴が大域属性を有していることを示すために使用される。外観特徴の位置属性を受け取ることにおける取得ユニット1111の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されてよい。
任意の実施では、取得ユニット1111は、外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得するよう更に構成され、このとき、位置属性は、外観特徴が大域属性を有していることを示すために使用される。外観特徴と位置属性との間の事前に記憶された対応から、対象の外観特徴の位置属性を取得することにおける取得ユニット1111の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施では、取得ユニット1111は、外観特徴に関連する他の外観特徴を取得するよう更に構成され、このとき、他の外観特徴は、外観特徴の特徴に関連する、対象の外観の他の特徴が属するタイプを示すために使用される。この実施では、外観特徴に関連する他の外観特徴を取得することにおける取得ユニット1111の機能は、画像処理デバイス120のインターフェイス14を使用することによって実施されても、あるいは、画像処理デバイス120のプロセッサ11を使用することによって、外観特徴と他の外観特徴との間の事前に記憶された対応をクエリして、外観特徴に関連する他の外観特徴を取得することによって実施されてもよい。
取得ユニット1111は、他の外観特徴の記述属性を取得するよう更に構成される。この実施では、他の外観特徴の記述属性を取得することにおける取得ユニット1111の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
処理ユニット1112は、他の外観特徴の記述属性を使用することによって外観特徴の記述属性を変更するよう更に構成される。大域属性を有している外観特徴の記述属性は、大域属性を有している外観特徴に関連する、局所属性を有している他の外観特徴の記述属性を使用することによって、変更され、大域属性を有している外観特徴の記述属性を認識する精度は、向上する。この実施では、他の外観特徴の記述属性を使用することによって外観特徴の記述属性を変更することにおける処理ユニット1112の機能は、画像処理デバイス120のプロセッサ11を使用することによって実施されてよい。
任意の実施で、処理ユニット1112は、図4に示される、外観特徴の記述属性を認識する方法における関連するステップを実行するよう更に構成される。具体的な実施詳細については、図4に示される、外観特徴の記述属性を認識する方法における関連するステップを参照されたい。詳細は、ここで再びは記載されない。
本発明の実施形態は、外観特徴の記述属性を認識する方法及び装置を提供する。標的画像の外観特徴の位置特徴が取得され、そして、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置が決定される。ここで、外観特徴は、対象の外観の特徴が属するタイプを示すために使用され、外観特徴の位置特徴は、前もってセットされた対象モデルにおいて対象のものであって外観特徴によって指し示される部分の位置を示すために使用され、外観特徴は局所属性を有し、局所属性は、画像処理デバイスに標的画像を局所処理方法で処理するように指示するために使用される。位置特徴に基づき標的領域が認識され、標的領域は対象の部分を含む。次いで、標的領域に対して特徴解析が実行され、対象の外観特徴の記述属性が認識される。局所属性を有している外観特徴の位置特徴が決定される。局所属性を有している外観特徴の場合に、無意味な認識領域を減らし、画像処理動作プロセスを簡単にし、記述属性を認識する時間を減らし、コンピュータ画像処理作業負荷を減らすために、標的画像からは、対象のものであって外観特徴によって指し示される部分が位置している標的領域が、特徴解析のための認識領域として意図的に選択される。
本発明のこの実施形態において外観特徴の記述属性を認識する装置1110は、特定用途向け集積回路(Application Specific Integrated Circuit,ASIC)又はプログラム可能論理デバイス(Programmable Logic Device,PLD)を使用することによって実施されてよいことが理解されるべきである。PLDは、複合プログラム可能論理デバイス(Complex Programmable Logic Device,CPLD)、フィールド・プログラマブル・ゲート・アレイ(Field-Programmable Gate Array,FPGA)、汎用アレイロジック(Generic Array Logic,GAL)、又はそれらの任意の組み合わせであってよい。図4に示される、記述属性を認識する方法が、ソフトウェアを使用することによって実施されるとき、外観特徴の記述属性を認識する装置1110及び装置1110のモジュールは、代替的にソフトウェアモジュールであってもよい。
本発明のこの実施形態において外観特徴の記述属性を認識する装置1110は、相応して、本発明の実施形態において記載される方法を実行してよい。その上、外観特徴の記述属性を認識する装置1110におけるユニットの上記及び他の動作及び/又は機能は、図4における方法及び図4における方法に関係がある対応するプロシージャを実施するために別々に使用される。簡潔さのために、詳細は、ここで再びは記載されない。
上記の実施形態の一部又は全ては、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせを使用することによって実施されてよい。実施形態を実施するためにソフトウェアが使用されるとき、実施形態の全て又は一部は、コンピュータプログラム製品の形で実施されてもよい。コンピュータプログラム製品は1つ以上のコンピュータ命令を含む。コンピュータプログラム製品がコンピュータでロード又は実行されるとき、本発明の実施形態に従うプロシージャ又は機能が完全に又は部分的に発生する。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、又は他のプログラム可能な装置であってよい。コンピュータ命令は、コンピュータ可読記憶媒体に記憶されても、あるいは、コンピュータ可読記憶媒体から他のコンピュータ可読記憶媒体へ送信されてもよい。例えば、コンピュータ命令は、ウェブサイト、コンピュータ、サーバ、又はデータセンターから他のウェブサイト、コンピュータ、サーバ、又はデータセンターへ無線(例えば、赤外線、電波、又はマイクロ波)方式で送信されてよい。コンピュータ可読記憶媒体は、コンピュータによってアクセス可能な任意の使用可能な媒体、又は1つ以上の使用可能な媒体を一体化する、サーバ若しくはデータセンターなどのデータ記憶デバイスであってよい。使用可能な媒体は、磁気媒体(例えば、フロッピーディスク、ハードディスク、若しくは磁気テープ)、光学媒体(例えば、DVD)、又は半導体媒体であってよい。半導体媒体は、固体状態ディスク(Solid State Disk,SSD)であってよい。
当業者は、本明細書で開示されている実施形態で記載される例と組み合わせて、ユニット及びアルゴリズムステップが電子ハードウェア又はコンピュータソフトウェア及び電子ハードウェアの組み合わせによって実施可能であると承知し得る。機能がハードウェア又はソフトウェアによって実行されるかどうかは、技術的解決法の設計制約及び特定の用途に依存する。当業者は、異なる方法を特定の用途ごとに使用することによって、記載される機能を実施することができる。
便宜上及び簡単な記載のために、上記のシステム、装置、及びユニットの具体的な作動プロセスについては、上記の方法実施形態における対応するプロセスが参照されてもよいことは、当業者によって明らかに理解され得る。詳細は、ここで再びは記載されない。
本願で提供されるいくつかの実施形態において、開示されるシステム、装置、及び方法は、他の方法で実施されてもよいことが理解されるべきである。例えば、記載される装置実施形態は、単に例である。例えば、ユニット分割は、論理機能分割に過ぎず、実際の実施では他の分割であってもよい。例えば、複数のユニット又はコンポーネントが他のシステムに結合又は一体化されてもよく、あるいは、いくつかの機能は無視されるか又は実施されなくてもよい。その上、表示又は議論されている相互結合又は直接的な結合若しくは通信接続は、いくつかのインターフェイスを通じて実施されてもよい。装置又はユニットの間の間接的な結合又は通信接続は、電気的な、機械的な、又は他の形で実施されてもよい。
別個のユニットとして記載されるユニットは、物理的に別個であってもなくてもよく、ユニットとして表示されている部分は物理的な部分であってもなくてもよく、一箇所に位置付けられても、あるいは、複数のネットワークユニット上に分配されてもよい。ユニットの一部又は全ては、実施形態の解決法の目的を達成すべく実際の要件に応じて選択されてよい。
上記の記載は、本発明の具体的な実施に過ぎず、本発明の保護範囲を制限する意図はない。如何なる変形又は置換も、本発明の具体的な実施に基づき当業者によって考え出され得る。

Claims (15)

  1. 外観特徴の記述属性を認識する方法であって、
    前記方法は、画像処理デバイスによって実行され、
    対象を含む標的画像を取得するステップと、
    前記標的画像の外観特徴の位置特徴を取得するステップであって、前記外観特徴は、前記対象の外観の特徴が属するタイプを示すために使用され、前記外観特徴の前記位置特徴は、前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される部分の位置を示すために使用され、前記外観特徴は局所属性又は大域属性の少なくとも1つを有し、前記局所属性は、前記画像処理デバイスに局所処理方法で前記標的画像を処理するように指示するために使用され、前記大域属性は、前記画像処理デバイスに大域的処理方法で前記標的画像を処理するよう指示するために使用される、ステップと、
    前記対象の前記外観特徴が局所属性を有する場合に、前記対象の前記部分を含む標的領域を前記位置特徴に基づき認識し、該標的領域に対して特徴解析を実行し、前記標的画像における前記対象の前記外観特徴の記述属性を認識するステップと
    前記対象の前記外観特徴が大域属性を有する場合に、前記標的画像に対して特徴解析を実行し、前記標的画像における前記対象の前記外観特徴の前記記述属性を認識するステップと
    を有する、前記方法。
  2. 前記外観特徴の位置属性を受け取るステップを更に有し、
    前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される、
    請求項1に記載の方法。
  3. 前記外観特徴と位置属性との間の事前に記憶された対応から、前記対象の前記外観特徴の前記位置属性を取得するステップを更に有し、
    前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される、
    請求項1に記載の方法。
  4. 1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かすステップと、
    前記オフセット領域に対して特徴解析を実行し、前記対象の前記外観特徴の他の記述属性を認識するステップと、
    前もってセットされたアルゴリズムに従って、前記記述属性及び前記他の記述属性から目標記述属性を決定するステップと
    を更に有し、
    前記目標記述属性は、前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である、
    請求項1乃至3のうちいずれか一項に記載の方法。
  5. 1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かす前記ステップは、
    形状が同じであって連続的である複数のブロックに前記標的領域を分割することと、
    前記1つ以上のオフセット領域を取得するよう、前記標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向で前記標的領域を1以上のオフセット単位だけ動かすことと
    を有し、
    各オフセット領域のサイズは、前記標的領域のサイズと同じであり、
    前記オフセット単位の数量は、正の整数である、
    請求項4に記載の方法。
  6. 前記位置特徴は、前記対象の外観特徴の第1位置特徴及び第2位置特徴を有し、前記第1位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第1部分の位置を示すために使用され、前記第2位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第2部分の位置を示すために使用され、
    標的領域を前記位置特徴に基づき認識するステップの前に、当該方法は、
    前記第1位置特徴及び前記第2位置特徴に基づき前記第1部分と前記第2部分との間の最大距離を求めるステップを更に有し、
    標的領域を前記位置特徴に基づき認識するステップは、
    前記第1部分及び前記第2部分を含む標的領域を前記最大距離に基づき認識することを有する、
    請求項1乃至5のうちいずれか一項に記載の方法。
  7. 外観特徴の記述属性を認識する装置であって、
    処理ユニット及び取得ユニットを有し、前記処理ユニットが前記取得ユニットへ接続され、
    前記取得ユニットは、対象を含む標的画像を取得するよう構成され、
    前記取得ユニットは、前記標的画像の外観特徴の位置特徴を取得するよう更に構成され、前記外観特徴は、前記対象の外観の特徴が属するタイプを示すために使用され、前記外観特徴の前記位置特徴は、前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される部分の位置を示すために使用され、前記外観特徴は局所属性又は大域属性の少なくとも1つを有し、前記局所属性は、前記処理ユニットに局所処理方法で前記標的画像を処理するように指示するために使用され、前記大域属性は、前記画像処理デバイスに大域的処理方法で前記標的画像を処理するよう指示するために使用され、
    前記処理ユニットは、前記対象の前記外観特徴が局所属性を有する場合に、前記対象の前記部分を含む標的領域を前記位置特徴に基づき認識し、該標的領域に対して特徴解析を実行し、前記標的画像における前記対象の前記外観特徴の記述属性を認識するよう構成され
    前記処理ユニットは、前記対象の前記外観特徴が大域属性を有する場合に、前記標的画像に対して特徴解析を実行し、前記標的画像における前記対象の前記外観特徴の前記記述属性を認識するよう更に構成される、
    前記装置。
  8. 前記取得ユニットは、前記外観特徴の位置属性を受け取るよう更に構成され、
    前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される、
    請求項7に記載の装置。
  9. 前記取得ユニットは、前記外観特徴と位置属性との間の事前に記憶された対応から、前記対象の前記外観特徴の前記位置属性を取得するよう更に構成され、
    前記位置属性は、前記外観特徴が前記局所属性を有していることを示すために使用される、
    請求項7に記載の装置。
  10. 前記処理ユニットは、1つ以上のオフセット領域を取得するように、前記標的領域を中心として使用することによって、指定された方向で前記標的領域を動かすよう更に構成され、
    前記処理ユニットは、前記オフセット領域に対して特徴解析を実行し、前記対象の前記外観特徴の他の記述属性を認識するよう更に構成され、
    前記処理ユニットは、前もってセットされたアルゴリズムに従って、前記記述属性及び前記他の記述属性から目標記述属性を決定するよう更に構成され、
    前記目標記述属性は、前記記述属性及び前記他の記述属性の中で目標データに最も近い記述属性である、
    請求項7乃至9のうちいずれか一項に記載の装置。
  11. 前記処理ユニットは、形状が同じであって連続的である複数のブロックに前記標的領域を分割するよう更に構成され、
    前記処理ユニットは、前記1つ以上のオフセット領域を取得するように、前記標的領域を中心として使用することによって、且つ、1つのブロックをオフセット単位として使用することによって、1つ以上の方向で前記標的領域を1以上のオフセット単位だけ動かすよう更に構成され、
    各オフセット領域のサイズは、前記標的領域のサイズと同じであり、
    前記オフセット単位の数量は、正の整数である、
    請求項10に記載の装置。
  12. 前記位置特徴は、前記対象の外観特徴の第1位置特徴及び第2位置特徴を有し、前記第1位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第1部分の位置を示すために使用され、前記第2位置特徴は、前記前もってセットされた対象モデルにおいて前記対象のものであって前記外観特徴によって指し示される第2部分の位置を示すために使用され、
    標的領域を前記位置特徴に基づき認識する前に、前記処理ユニットは、前記第1位置特徴及び前記第2位置特徴に基づき前記第1部分と前記第2部分との間の最大距離を求めるよう構成され、
    前記処理ユニットは、前記第1部分及び前記第2部分を含む標的領域を前記最大距離に基づき認識するよう更に構成される、
    請求項7乃至11のうちいずれか一項に記載の装置。
  13. 外観特徴の記述属性を認識する装置であって、
    プロセッサ及びメモリを有し、
    前記メモリはコンピュータ命令を記憶し、前記プロセッサはメモリへ接続され、
    前記プロセッサは、前記メモリ内の前記コンピュータ命令を実行して、請求項1乃至6のうちいずれか一項に記載の外観特徴の記述属性を認識する方法を実行するよう構成される、
    前記装置。
  14. コンピュータで実行されるときに、該コンピュータに、請求項1乃至6のうちいずれか一項に記載の外観特徴の記述属性を認識する方法を実行させるコンピュータプログラム。
  15. コンピュータで実行されるときに請求項1乃至6のうちいずれか一項に記載の外観特徴の記述属性を認識する方法を実行するプログラムコードを有するコンピュータプログラムを記憶している非一時的な記憶媒体。
JP2019551650A 2017-03-20 2017-03-20 外観特徴の記述属性を認識する方法及び装置 Active JP6936866B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/077366 WO2018170695A1 (zh) 2017-03-20 2017-03-20 一种表观特征的描述属性识别方法及装置

Publications (2)

Publication Number Publication Date
JP2020510264A JP2020510264A (ja) 2020-04-02
JP6936866B2 true JP6936866B2 (ja) 2021-09-22

Family

ID=63583976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019551650A Active JP6936866B2 (ja) 2017-03-20 2017-03-20 外観特徴の記述属性を認識する方法及び装置

Country Status (7)

Country Link
US (1) US11410411B2 (ja)
EP (1) EP3591580A4 (ja)
JP (1) JP6936866B2 (ja)
KR (1) KR102331651B1 (ja)
CN (1) CN110678878B (ja)
BR (1) BR112019019517A8 (ja)
WO (1) WO2018170695A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109598176A (zh) * 2017-09-30 2019-04-09 佳能株式会社 识别装置和识别方法
CN108921022A (zh) * 2018-05-30 2018-11-30 腾讯科技(深圳)有限公司 一种人体属性识别方法、装置、设备及介质
CN110060252B (zh) * 2019-04-28 2021-11-05 重庆金山医疗技术研究院有限公司 一种图片内目标提示处理方法、装置及内窥镜系统
CN110287856A (zh) * 2019-06-21 2019-09-27 上海闪马智能科技有限公司 一种执勤人员行为分析系统、方法及装置
CN111274945B (zh) * 2020-01-19 2023-08-08 北京百度网讯科技有限公司 一种行人属性的识别方法、装置、电子设备和存储介质
CN114663646A (zh) * 2020-06-02 2022-06-24 支付宝(杭州)信息技术有限公司 一种扫码过程中的提示方法、装置及设备
CN113989284B (zh) * 2021-12-29 2022-05-10 广州思德医疗科技有限公司 一种幽门螺杆菌辅助检测系统及检测装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3938005B2 (ja) 2002-10-23 2007-06-27 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法
GB0607143D0 (en) 2006-04-08 2006-05-17 Univ Manchester Method of locating features of an object
JP2012173761A (ja) * 2011-02-17 2012-09-10 Nifty Corp 情報処理装置、情報処理方法及びプログラム
EP2697775A4 (en) * 2011-04-11 2015-03-04 Intel Corp METHOD FOR DETECTING FACE FEATURES
KR101302638B1 (ko) 2011-07-08 2013-09-05 더디엔에이 주식회사 머리의 제스처 및 손의 제스처를 감지하여 컨텐츠를 제어하기 위한 방법, 단말 장치 및 컴퓨터 판독 가능한 기록 매체
JP5950296B2 (ja) * 2012-01-27 2016-07-13 国立研究開発法人産業技術総合研究所 人物追跡属性推定装置、人物追跡属性推定方法、プログラム
CN103324907B (zh) * 2012-03-22 2016-09-07 中国科学院计算技术研究所 一种用于人体重现检测的人体表观模型的学习方法及系统
CN103390150B (zh) * 2012-05-08 2019-01-08 北京三星通信技术研究有限公司 人体部件检测方法和装置
JP5712968B2 (ja) * 2012-05-31 2015-05-07 株式会社デンソー 人検出装置
US9278255B2 (en) 2012-12-09 2016-03-08 Arris Enterprises, Inc. System and method for activity recognition
CN103970771B (zh) * 2013-01-29 2016-12-28 中国科学院计算技术研究所 一种人体的检索方法和系统
CN104685540B (zh) * 2013-09-27 2017-04-26 华为技术有限公司 图像语义分割的方法和装置
US10120879B2 (en) * 2013-11-29 2018-11-06 Canon Kabushiki Kaisha Scalable attribute-driven image retrieval and re-ranking
CN103810490B (zh) 2014-02-14 2017-11-17 海信集团有限公司 一种确定人脸图像的属性的方法和设备
CN103984919A (zh) * 2014-04-24 2014-08-13 上海优思通信科技有限公司 基于粗糙集与混合特征的人脸表情识别方法
CN104036231B (zh) * 2014-05-13 2017-11-17 深圳市菲普莱体育发展有限公司 人体躯干识别装置及方法、终点影像检测方法、装置
CN104751454B (zh) 2015-03-11 2018-05-11 百度在线网络技术(北京)有限公司 一种用于确定图像中的人物轮廓的方法和装置
CN105160317B (zh) 2015-08-31 2019-02-15 电子科技大学 一种基于区域分块行人性别识别方法
US9460613B1 (en) * 2016-05-09 2016-10-04 Iteris, Inc. Pedestrian counting and detection at a traffic intersection based on object movement within a field of view
CN106203296B (zh) * 2016-06-30 2019-05-07 北京小白世纪网络科技有限公司 一种属性辅助的视频动作识别方法
CN106127173B (zh) * 2016-06-30 2019-05-07 北京小白世纪网络科技有限公司 一种基于深度学习的人体属性识别方法

Also Published As

Publication number Publication date
US11410411B2 (en) 2022-08-09
KR20190137815A (ko) 2019-12-11
JP2020510264A (ja) 2020-04-02
EP3591580A1 (en) 2020-01-08
BR112019019517A8 (pt) 2023-04-04
KR102331651B1 (ko) 2021-11-30
CN110678878A (zh) 2020-01-10
US20200012880A1 (en) 2020-01-09
CN110678878B (zh) 2022-12-13
EP3591580A4 (en) 2020-03-18
BR112019019517A2 (pt) 2020-04-22
WO2018170695A1 (zh) 2018-09-27

Similar Documents

Publication Publication Date Title
JP6936866B2 (ja) 外観特徴の記述属性を認識する方法及び装置
US11176406B2 (en) Edge-based recognition, systems and methods
US20210209851A1 (en) Face model creation
US8761459B2 (en) Estimating gaze direction
CN109063560B (zh) 图像处理方法、装置、计算机可读存储介质和终端
Reale et al. Nebula feature: A space-time feature for posed and spontaneous 4D facial behavior analysis
US9542003B2 (en) Image processing device, image processing method, and a computer-readable non-transitory medium
US9141873B2 (en) Apparatus for measuring three-dimensional position, method thereof, and program
CN114616588A (zh) 图像处理装置、图像处理方法以及存储图像处理程序的非暂时性计算机可读介质
JP5598751B2 (ja) 動作認識装置
CN109348731A (zh) 一种图像匹配的方法及装置
CN106875465B (zh) 基于rgbd图像的三维操控空间的建立方法及设备
Unzueta et al. Efficient generic face model fitting to images and videos
JP2018088049A (ja) 画像処理装置、画像処理方法、及びプログラム
Juang et al. Stereo-camera-based object detection using fuzzy color histograms and a fuzzy classifier with depth and shape estimations
JP5930808B2 (ja) 画像処理装置、画像処理装置の制御方法、およびプログラム
JP6090162B2 (ja) 部位分離位置抽出装置、プログラム、方法
JP5840074B2 (ja) 画像処理装置
CN112183155B (zh) 动作姿态库建立、动作姿态生成、识别方法及装置
JP7435781B2 (ja) 画像選択装置、画像選択方法、及びプログラム
WO2022079794A1 (ja) 画像選択装置、画像選択方法、及びプログラム
CN113658233A (zh) 三维人脸模型的非刚性配准方法、装置、设备及存储介质
CN107341476A (zh) 一种基于系统计算原理的无监督人体模型构建方法
JP7152651B2 (ja) プログラム、情報処理装置、及び情報処理方法
JP2021174537A (ja) 画像処理装置、画像処理方法及びマシン可読記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191029

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210827

R150 Certificate of patent or registration of utility model

Ref document number: 6936866

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150