JP2015507271A - オブジェクト認識方法及びオブジェクト認識装置 - Google Patents
オブジェクト認識方法及びオブジェクト認識装置 Download PDFInfo
- Publication number
- JP2015507271A JP2015507271A JP2014551513A JP2014551513A JP2015507271A JP 2015507271 A JP2015507271 A JP 2015507271A JP 2014551513 A JP2014551513 A JP 2014551513A JP 2014551513 A JP2014551513 A JP 2014551513A JP 2015507271 A JP2015507271 A JP 2015507271A
- Authority
- JP
- Japan
- Prior art keywords
- contour
- specific
- pixel
- color
- object recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/11—Hand-related biometrics; Hand pose recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
Description
(外1)
(以降、「ベクトルDR」と称する。)上の投影値に基づき、非肌色ピクセルから最大限に区別され得る。よって、軸ベクトルDR上へのベクトル
(外2)
(以降、「ベクトルOX」と称する。)の投影は、ピクセルXが黄色い肌の肌色カテゴリに属するとの確かさを反映することができ、このとき、ピクセルXのピクセル値は、(r,g,b)であり、軸ベクトルDRは、点D(0,−k2/k1,−k3/k1)及び点R(r,0,0)並びにDからRまでの点を通る。ベクトルOXは、RGB空間の原点(0,0,0)で始まり、ピクセルXに対応する点(r,g,b)で終わり、このとき、係数k1、k2及びk3は、0.8≦k1≦1.2、−0.4≦k2≦−0.6、及び−0.4≦k3≦−0.6を満足する。望ましくは、k1=1、k2=−0.5及びk3=−0.5である。
特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識方法であって、
入力画像における輪郭をその前記色分布特性に従って抽出し、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定し、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定する
オブジェクト認識方法。
(付記2)
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、ピクセルXの色応答値vを該ピクセルXの色値(r,g,b)の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値vに基づき抽出することを含む、
付記1に記載のオブジェクト認識方法。
(付記3)
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、色値(r,g,b)を有するピクセルXについてRGB空間における軸ベクトルDRへのベクトルOXの投影を計算し、候補となるオブジェクト輪郭を投影値vに基づき抽出することを含み、
前記ベクトルOXは、前記RGB空間の原点(0,0,0)で始まり、前記ピクセルXに対応する点(r,g,b)で終わり、
前記軸ベクトルDRは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値vに基づき最大限に区別され得る投影軸を表す、
付記1に記載のオブジェクト認識方法。
(付記4)
Tは所定の閾値を表すとして、次の式:
付記2又は3に記載のオブジェクト認識方法。
(付記5)
前記走査窓を決定することは、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
ことを含む、付記1に記載のオブジェクト認識方法。
(付記6)
前記特定の輪郭特性は、前記抽出された輪郭と前記走査窓との特定の位置関係が存在することを含み、
前記特定の色分布特性は、前記走査窓における特定の領域が特定の色を有するか否かを含む、
付記5に記載のオブジェクト認識方法。
(付記7)
前記オブジェクトは、開いた手を有し、
前記特定の位置関係は、前記走査窓の中心点との特定の位置関係を有する点が前記抽出された輪郭内にあることを含み、
前記色分布特性は、前記中心点に対応するピクセルが肌色を有することを含む、
付記6に記載のオブジェクト認識方法。
(付記8)
P1が前記開いた点の中指の先端点に対応するとして、w×hピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Cからの距離d1=(3/8)hで前記走査窓の前記中心点Cの上に位置するピクセルP1を有する、
付記7に記載のオブジェクト認識方法。
(付記9)
P2が前記開いた手の人差し指及び中指の結合点に対応するとして、w×hピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Cからの距離d2=(1/8)hで前記走査窓の前記中心点Cの上に位置するピクセルP2を有する、
付記7に記載のオブジェクト認識方法。
(付記10)
前記オブジェクトは、握り拳、人の顔、工場における製品若しくは半製品、交通カメラ、交通信号ランプ、又は車両のライセンスプレートを有する、
付記5又は6に記載のオブジェクト認識方法。
(付記11)
前記分類の結果に従って前記オブジェクトの位置を出力する、
付記1に記載のオブジェクト認識方法。
(付記12)
特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識装置であって、
入力画像における輪郭をその前記色分布特性に従って抽出するよう構成される輪郭抽出手段と、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するよう構成される走査窓決定手段と、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定するよう構成されるオブジェクト決定手段と
を有するオブジェクト認識装置。
(付記13)
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、ピクセルXの色応答値vを該ピクセルXの色値(r,g,b)の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値vに基づき抽出するよう構成される、
付記12に記載のオブジェクト認識装置。
(付記14)
前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、色値(r,g,b)を有するピクセルXについてRGB空間における軸ベクトルDRへのベクトルOXの投影を計算し、候補となるオブジェクト輪郭を投影値vに基づき抽出するよう構成され、
前記ベクトルOXは、前記RGB空間の原点(0,0,0)で始まり、前記ピクセルXに対応する点(r,g,b)で終わり、
前記軸ベクトルDRは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値vに基づき最大限に区別され得る投影軸を表す、
付記12に記載のオブジェクト認識装置。
(付記15)
前記走査窓決定手段は、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
よう構成される、付記12に記載のオブジェクト認識装置。
(付記16)
前記分類の結果に従って前記オブジェクトの位置を出力するよう構成されるオブジェクト位置出力手段
を更に有する、付記12に記載のオブジェクト認識装置。
(付記17)
付記12乃至16のうちいずれか一項に記載のオブジェクト認識装置を有するモバイル端末。
Claims (17)
- 特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識方法であって、
入力画像における輪郭をその前記色分布特性に従って抽出し、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定し、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定する
オブジェクト認識方法。 - 前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、ピクセルXの色応答値vを該ピクセルXの色値(r,g,b)の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値vに基づき抽出することを含む、
請求項1に記載のオブジェクト認識方法。 - 前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭を抽出することは、色値(r,g,b)を有するピクセルXについてRGB空間における軸ベクトルDRへのベクトルOXの投影を計算し、候補となるオブジェクト輪郭を投影値vに基づき抽出することを含み、
前記ベクトルOXは、前記RGB空間の原点(0,0,0)で始まり、前記ピクセルXに対応する点(r,g,b)で終わり、
前記軸ベクトルDRは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値vに基づき最大限に区別され得る投影軸を表す、
請求項1に記載のオブジェクト認識方法。 - Tは所定の閾値を表すとして、次の式:
請求項2又は3に記載のオブジェクト認識方法。 - 前記走査窓を決定することは、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
ことを含む、請求項1に記載のオブジェクト認識方法。 - 前記特定の輪郭特性は、前記抽出された輪郭と前記走査窓との特定の位置関係が存在することを含み、
前記特定の色分布特性は、前記走査窓における特定の領域が特定の色を有するか否かを含む、
請求項5に記載のオブジェクト認識方法。 - 前記オブジェクトは、開いた手を有し、
前記特定の位置関係は、前記走査窓の中心点との特定の位置関係を有する点が前記抽出された輪郭内にあることを含み、
前記色分布特性は、前記中心点に対応するピクセルが肌色を有することを含む、
請求項6に記載のオブジェクト認識方法。 - P1が前記開いた点の中指の先端点に対応するとして、w×hピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Cからの距離d1で前記走査窓の前記中心点Cの上に位置するピクセルP1を有する、
請求項7に記載のオブジェクト認識方法。 - P2が前記開いた手の人差し指及び中指の結合点に対応するとして、w×hピクセルのサイズを有する夫々の候補走査窓について、前記走査窓の前記中心点との前記特定の位置関係を有する点は、前記中心点Cからの距離d2で前記走査窓の前記中心点Cの上に位置するピクセルP2を有する、
請求項7に記載のオブジェクト認識方法。 - 前記オブジェクトは、握り拳、人の顔、工場における製品若しくは半製品、交通カメラ、交通信号ランプ、又は車両のライセンスプレートを有する、
請求項5又は6に記載のオブジェクト認識方法。 - 前記分類の結果に従って前記オブジェクトの位置を出力する、
請求項1に記載のオブジェクト認識方法。 - 特定の色分布特性及び特定の輪郭特性を有するオブジェクトを認識するオブジェクト認識装置であって、
入力画像における輪郭をその前記色分布特性に従って抽出するよう構成される輪郭抽出手段と、
前記輪郭特性及び前記色分布特性に従って前記抽出された輪郭を用いて走査窓を決定するよう構成される走査窓決定手段と、
前記決定された走査窓に対応する前記画像の部分を分類し、前記画像の前記部分が前記オブジェクトを含むかどうかを決定するよう構成されるオブジェクト決定手段と
を有するオブジェクト認識装置。 - 前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、ピクセルXの色応答値vを該ピクセルXの色値(r,g,b)の線形結合によって計算し、候補となるオブジェクト輪郭を前記色応答値vに基づき抽出するよう構成される、
請求項12に記載のオブジェクト認識装置。 - 前記オブジェクトは、比較的安定している色分布範囲を伴うオブジェクトであり、
前記輪郭抽出手段は、色値(r,g,b)を有するピクセルXについてRGB空間における軸ベクトルDRへのベクトルOXの投影を計算し、候補となるオブジェクト輪郭を投影値vに基づき抽出するよう構成され、
前記ベクトルOXは、前記RGB空間の原点(0,0,0)で始まり、前記ピクセルXに対応する点(r,g,b)で終わり、
前記軸ベクトルDRは、オブジェクトピクセル及び非オブジェクトピクセルが前記投影値vに基づき最大限に区別され得る投影軸を表す、
請求項12に記載のオブジェクト認識装置。 - 前記走査窓決定手段は、
様々なサイズ及び位置を有する候補走査窓の夫々に対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすかどうかを決定し、
対応するピクセル領域が前記特定の色分布特性及び前記特定の輪郭特性を満たすところの候補走査窓を前記決定された走査窓としてリザーブする
よう構成される、請求項12に記載のオブジェクト認識装置。 - 前記分類の結果に従って前記オブジェクトの位置を出力するよう構成されるオブジェクト位置出力手段
を更に有する、請求項12に記載のオブジェクト認識装置。 - 請求項12乃至16のうちいずれか一項に記載のオブジェクト認識装置を有するモバイル端末。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210011347.7 | 2012-01-13 | ||
CN2012100113477A CN103208005A (zh) | 2012-01-13 | 2012-01-13 | 对象识别方法和对象识别设备 |
PCT/CN2013/070312 WO2013104322A1 (en) | 2012-01-13 | 2013-01-10 | Object recognizing method and object recognizing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015507271A true JP2015507271A (ja) | 2015-03-05 |
JP5958557B2 JP5958557B2 (ja) | 2016-08-02 |
Family
ID=48755222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014551513A Expired - Fee Related JP5958557B2 (ja) | 2012-01-13 | 2013-01-10 | オブジェクト認識方法及びオブジェクト認識装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5958557B2 (ja) |
CN (1) | CN103208005A (ja) |
WO (1) | WO2013104322A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846419B (zh) * | 2015-12-03 | 2020-06-05 | 阿里巴巴集团控股有限公司 | 一种图像中人像轮廓的确定方法和装置 |
WO2018058593A1 (zh) * | 2016-09-30 | 2018-04-05 | 富士通株式会社 | 目标颜色识别方法、装置以及计算机系统 |
CN114581418A (zh) * | 2021-12-31 | 2022-06-03 | 深圳科亚医疗科技有限公司 | 对医学图像进行对象分析的方法、装置和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0935058A (ja) * | 1995-07-17 | 1997-02-07 | Nec Corp | 画像認識方法 |
JP2001309225A (ja) * | 2000-02-28 | 2001-11-02 | Eastman Kodak Co | 顔を検出するためのカメラ及び方法 |
JP2002216129A (ja) * | 2001-01-22 | 2002-08-02 | Honda Motor Co Ltd | 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体 |
JP2005044330A (ja) * | 2003-07-24 | 2005-02-17 | Univ Of California San Diego | 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置 |
JP2005228042A (ja) * | 2004-02-13 | 2005-08-25 | Honda Motor Co Ltd | 顔識別装置、顔識別方法及び顔識別プログラム |
JP2008117391A (ja) * | 2006-11-02 | 2008-05-22 | Seiko Epson Corp | デジタル画像における顔を検出する方法、およびデジタル画像における顔を検出する装置 |
JP2010117981A (ja) * | 2008-11-14 | 2010-05-27 | Mitsubishi Electric Corp | 顔検出装置 |
JP2011044044A (ja) * | 2009-08-21 | 2011-03-03 | Sony Ericsson Mobile Communications Ab | 情報端末、情報端末の情報制御方法及び情報制御プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010056672A (ja) * | 2008-08-26 | 2010-03-11 | Oki Data Corp | 画像処理装置 |
CN101493892B (zh) * | 2009-02-27 | 2012-03-28 | 中国农业大学 | 图像特征提取方法及装置 |
CN101593022B (zh) * | 2009-06-30 | 2011-04-27 | 华南理工大学 | 一种基于指端跟踪的快速人机交互方法 |
CN101996307A (zh) * | 2009-08-10 | 2011-03-30 | 上海理视微电子有限公司 | 智能视频人体识别方法 |
CN102043950B (zh) * | 2010-12-30 | 2012-11-28 | 南京信息工程大学 | 基于canny算子和边缘点统计的车辆轮廓识别方法 |
-
2012
- 2012-01-13 CN CN2012100113477A patent/CN103208005A/zh active Pending
-
2013
- 2013-01-10 JP JP2014551513A patent/JP5958557B2/ja not_active Expired - Fee Related
- 2013-01-10 WO PCT/CN2013/070312 patent/WO2013104322A1/en active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0935058A (ja) * | 1995-07-17 | 1997-02-07 | Nec Corp | 画像認識方法 |
JP2001309225A (ja) * | 2000-02-28 | 2001-11-02 | Eastman Kodak Co | 顔を検出するためのカメラ及び方法 |
JP2002216129A (ja) * | 2001-01-22 | 2002-08-02 | Honda Motor Co Ltd | 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体 |
JP2005044330A (ja) * | 2003-07-24 | 2005-02-17 | Univ Of California San Diego | 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置 |
JP2005228042A (ja) * | 2004-02-13 | 2005-08-25 | Honda Motor Co Ltd | 顔識別装置、顔識別方法及び顔識別プログラム |
JP2008117391A (ja) * | 2006-11-02 | 2008-05-22 | Seiko Epson Corp | デジタル画像における顔を検出する方法、およびデジタル画像における顔を検出する装置 |
JP2010117981A (ja) * | 2008-11-14 | 2010-05-27 | Mitsubishi Electric Corp | 顔検出装置 |
JP2011044044A (ja) * | 2009-08-21 | 2011-03-03 | Sony Ericsson Mobile Communications Ab | 情報端末、情報端末の情報制御方法及び情報制御プログラム |
Non-Patent Citations (1)
Title |
---|
JPN6016007788; 木下 晶雄、外3名: '"カラー濃淡画像からの手領域の抽出と指先位置の特定方法"' 電子情報通信学会技術研究報告 Vol.96, No.492, 19970124, pp.99-104, 社団法人電子情報通信学会 * |
Also Published As
Publication number | Publication date |
---|---|
WO2013104322A1 (en) | 2013-07-18 |
CN103208005A (zh) | 2013-07-17 |
JP5958557B2 (ja) | 2016-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230117712A1 (en) | Feature density object classification, systems and methods | |
US9367766B2 (en) | Text line detection in images | |
US9978003B2 (en) | Utilizing deep learning for automatic digital image segmentation and stylization | |
Radman et al. | Automated segmentation of iris images acquired in an unconstrained environment using HOG-SVM and GrowCut | |
WO2018103608A1 (zh) | 一种文字检测方法、装置及存储介质 | |
Tan et al. | Efficient and robust segmentation of noisy iris images for non-cooperative iris recognition | |
US8792722B2 (en) | Hand gesture detection | |
US9576210B1 (en) | Sharpness-based frame selection for OCR | |
CN106960181B (zh) | 一种基于rgbd数据的行人属性识别方法 | |
CN105144239A (zh) | 图像处理装置、程序及图像处理方法 | |
US9418316B1 (en) | Sharpness-based frame selection for OCR | |
JP2003030667A (ja) | イメージ内で目を自動的に位置決めする方法 | |
Ye et al. | Scene text detection via integrated discrimination of component appearance and consensus | |
CN109271848B (zh) | 一种人脸检测方法及人脸检测装置、存储介质 | |
US20160170492A1 (en) | Technologies for robust two-dimensional gesture recognition | |
CN103824090A (zh) | 一种自适应的人脸低层特征选择方法及人脸属性识别方法 | |
US20210012503A1 (en) | Apparatus and method for generating image | |
Tsai et al. | Robust in-plane and out-of-plane face detection algorithm using frontal face detector and symmetry extension | |
Lahiani et al. | Hand pose estimation system based on Viola-Jones algorithm for android devices | |
JP2019220014A (ja) | 画像解析装置、画像解析方法及びプログラム | |
JP5958557B2 (ja) | オブジェクト認識方法及びオブジェクト認識装置 | |
US20170300514A1 (en) | Method and terminal for implementing image sequencing | |
WO2016192213A1 (zh) | 一种图像特征提取方法和装置、存储介质 | |
Kedia et al. | MAVI: An embedded device to assist mobility of visually impaired | |
Zhang et al. | A multi-view camera-based anti-fraud system and its applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5958557 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |