JP2016186703A - 画像認識方法、画像認識装置および画像認識プログラム - Google Patents
画像認識方法、画像認識装置および画像認識プログラム Download PDFInfo
- Publication number
- JP2016186703A JP2016186703A JP2015066302A JP2015066302A JP2016186703A JP 2016186703 A JP2016186703 A JP 2016186703A JP 2015066302 A JP2015066302 A JP 2015066302A JP 2015066302 A JP2015066302 A JP 2015066302A JP 2016186703 A JP2016186703 A JP 2016186703A
- Authority
- JP
- Japan
- Prior art keywords
- block
- image
- feature amount
- target
- roi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/28—Indexing scheme for image data processing or generation, in general involving image processing hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
Abstract
Description
上述の課題を解決するために、本実施形態1では、注目領域(ROI)を構成するブロックに着目する。図2に示したように、1個のROIは同一サイズの複数のブロックから構成されている。ROI単位の特徴量はブロックの特徴量を、予め定義された順番に従って連結することで導出される。ここで、ブロックごとの特徴量は数十〜数百個のデータ配列で構成され、ROI単位の特徴量データはそのブロック数倍の百〜千数百個データ配列で構成される。上述の特徴量マップ作成による画像認識処理方式(比較例1)において生成される「特徴量マップ」は、入力画像全体のデータをこのブロック特徴量データに変換したデータ配列である。本実施形態1は、中間データとして、この特徴量マップではなく、ブロックごとに導出されたスコア(スカラー値)をROI単位スコアマップとして保存する方法である。
実施形態1で説明した画像認識処理は、一般的なシングルプロセッサで実装することが可能である。図20は、実施形態1の画像認識処理が実行されるシングルプロセッサの構成例を示す概念図である。1個のCPUとRAMやROM等のメモリで構成される。ブロック探索部S1、特徴量記述部S2、ブロック・ROI対応決定部S3、ブロックスコア値算出部S4、スコア検定部S7は、RAMやROM等のメモリにプログラムとして保存する。また、入力画像、辞書データ、しきい値、ROI単位スコアマップもメモリに保存し、入出力処理に応じて読み書きを行う。上記データ及びプログラムを基に、1個のCPUが搭載されているシングルプロセッサで実施形態1の画像認識処理を実現することができる。
実施形態1の画像認識処理は、画像処理のアクセラレータとして利用されるSIMD(Single Instruction Multiple Data)構成プロセッサにおいて、その並列性を活かした処理を実装することが可能となる。図21は、実施形態1の画像認識処理が実行されるSIMDプロセッサの構成例を示す概念図である。SIMDプロセッサは、それぞれがローカルメモリを持つ4個のプロセッシングエレメントPE(Processing Element)0〜3と、全てのPEから参照可能な共有メモリとを備える。データ保存方法の具体例としては、プログラムや入力画像データは全PE参照可能な共有メモリに保存し、辞書データやしきい値などのデータは全PEのローカルメモリに同一の値をそれぞれ保存する。ROI単位スコアマップはPE数で分割し、それぞれローカルで保存する。SIMDプロセッサに実装する場合、1PEに対して1ブロックの特徴量計算と部分評価値計算を割り当て、部分評価値を各PE間で転送することで、ROI単位スコアマップを生成する。一般的なCPUでは単一の部分ブロックにおける特徴量計算から部分評価値計算を行う作業をシーケンシャルに行う必要があるが、SIMDプロセッサで実装した場合、PEの並列数分の部分特徴量計算及び評価値計算を並列に実行することで、さらなる高速化が可能となる。
roi_score 注目領域(ROI)単位スコアマップ
S1 ブロック探索部
S2 ブロック特徴量記述部
S3 ブロック・ROI対応決定部
S4 ブロックスコア値算出部
S5 算出終了判定ブロック
S6 ROI判定部
S11、S22 特徴量記述部
S13、S21 ROI探索部
S14、S24 ROIスコア値算出部
S7、S16、S26 スコア検定部
Claims (18)
- プロセッサとメモリとを備え、前記プロセッサによって実行されるプログラムによって、1画面の画像内に複数の注目領域が設定され、認識対象画像を含む領域を探索する、画像認識処理を実行する、画像認識装置であって、
前記画像認識処理において、複数の画素からなるブロックが定義され、
前記認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出される複数の特徴量からなる辞書データが、前記メモリに保持され、
前記画像認識処理において、前記複数の注目領域のそれぞれは、前記認識対象領域を構成するブロックの数と同数のブロックから成り、
前記プロセッサは、前記1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とし、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとして前記メモリに一時的に保持し、前記注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する、
画像認識装置。 - 請求項1において、前記特徴量はベクトルデータであり、
前記スコアは、前記辞書データにおいて当該ブロックに対応するブロックから算出された前記特徴量と前記注目ブロック特徴量との内積である、
画像認識装置。 - 請求項2において、
前記特徴量は、対応するブロック内の画像におけるエッジの傾きの頻度分布である、
画像認識装置。 - 請求項1において、
前記注目ブロック特徴量を算出する対象のブロックは、前記1画面内の順次走査によって選択される、
画像認識装置。 - 請求項4において、
前記順次走査は、前記ブロックのサイズを刻み幅とする1画面分の走査と、前記走査とは始点が前記ブロックのサイズの整数分の1ずつ異なり刻み幅が同じである1画面分の他の複数の走査とを含む、
画像認識装置。 - 請求項1において、前記プロセッサと前記メモリとが単一の半導体基板上に形成された、
画像認識装置。 - 請求項4において、前記プロセッサは、同一命令を並列に実行可能な複数のプロセッサエレメントで構成され、前記メモリは、前記複数のプロセッサエレメントにそれぞれ接続される複数のローカルメモリと前記複数のプロセッサエレメントから共通にアクセス可能な共有メモリとで構成され、
前記辞書データは前記共有メモリに保持され、
前記中間データは、対応する注目領域毎に、前記複数のローカルメモリに分散して保持され、
前記順次走査によって、複数のブロックが並列に選択され、前記複数のプロセッサエレメントにそれぞれ割り当てられ、前記複数のプロセッサエレメントはそれぞれ、割り当てられたブロックについて、前記注目ブロック特徴量を算出し、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを算出し、算出された前記スコアを対応する中間データが保持されるローカルメモリに接続されるプロセッサエレメントに転送する、
画像認識装置。 - 請求項7において、前記複数のプロセッサエレメントと前記複数のローカルメモリと前記共有メモリとが単一の半導体基板上に形成された、
画像認識装置。 - メモリが接続されたプロセッサによって実行されることによって、1画面の画像から認識対象画像を含む領域を探索する、画像認識プログラムであって、
前記1画面の画像内に複数の注目領域を設定し、複数の画素からなるブロックを定義し、
前記認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出された複数の特徴量からなる辞書データを前記メモリ上に保持し、
前記複数の注目領域のそれぞれは、前記認識対象領域を構成するブロックの数と同数のブロックから成り、
前記1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とし、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとして前記メモリ上に保持し、前記注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する、
画像認識プログラム。 - 請求項9において、前記特徴量はベクトルデータであり、
前記スコアは、前記辞書データにおいて当該ブロックに対応するブロックから算出された前記特徴量と前記注目ブロック特徴量との内積である、
画像認識プログラム。 - 請求項10において、前記特徴量は、対応するブロック内の画像におけるエッジの傾きの頻度分布である、
画像認識プログラム。 - 請求項9において、
前記注目ブロック特徴量を算出する対象のブロックは、前記1画面内の順次走査によって選択される、
画像認識プログラム。 - 請求項12において、
前記順次走査は、前記ブロックのサイズを刻み幅とする1画面分の走査と、前記走査とは始点が前記ブロックのサイズの整数分の1ずつ異なり刻み幅が同じである1画面分の他の複数の走査とを含む、
画像認識プログラム。 - 1画面の画像内に複数の注目領域が設定され、認識対象画像を含む領域を探索する、画像認識方法であって、
複数の画素からなるブロックが定義され、
前記認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出される複数の特徴量からなる辞書データを有し、
前記複数の注目領域のそれぞれは、前記認識対象領域を構成するブロックの数と同数のブロックから成り、
前記1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とし、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとし、前記注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する、
画像認識方法。 - 請求項14において、前記特徴量はベクトルデータであり、
前記スコアは、前記辞書データにおいて当該ブロックに対応するブロックから算出された前記特徴量と前記注目ブロック特徴量との内積である、
画像認識方法。 - 請求項15において、前記特徴量は、対応するブロック内の画像におけるエッジの傾きの頻度分布である、
画像認識方法。 - 請求項14において、
前記注目ブロック特徴量を算出する対象のブロックは、前記1画面内の順次走査によって選択される、
画像認識方法。 - 請求項17において、
前記順次走査は、前記ブロックのサイズを刻み幅とする1画面分の走査と、前記走査とは始点が前記ブロックのサイズの整数分の1ずつ異なり刻み幅が同じである1画面分の他の複数の走査とを含む、
画像認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015066302A JP2016186703A (ja) | 2015-03-27 | 2015-03-27 | 画像認識方法、画像認識装置および画像認識プログラム |
US15/064,472 US10026148B2 (en) | 2015-03-27 | 2016-03-08 | Image recognition method, image recognition device and image recognition program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015066302A JP2016186703A (ja) | 2015-03-27 | 2015-03-27 | 画像認識方法、画像認識装置および画像認識プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016186703A true JP2016186703A (ja) | 2016-10-27 |
Family
ID=56975467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015066302A Pending JP2016186703A (ja) | 2015-03-27 | 2015-03-27 | 画像認識方法、画像認識装置および画像認識プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10026148B2 (ja) |
JP (1) | JP2016186703A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120277A (ja) * | 2017-01-23 | 2018-08-02 | コニカミノルタ株式会社 | 画像処理装置、物体検出方法および物体検出プログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229248A (zh) * | 2016-12-14 | 2018-06-29 | 贵港市瑞成科技有限公司 | 基于车底阴影的车辆检测方法 |
CN110019891B (zh) * | 2017-12-29 | 2021-06-01 | 浙江宇视科技有限公司 | 图像存储方法、图像检索方法及装置 |
CN109145763B (zh) * | 2018-07-27 | 2021-07-13 | 天津大学 | 基于自然语言描述的视频监控行人搜索图像文本融合方法 |
CN109523591A (zh) * | 2018-11-21 | 2019-03-26 | 北京锐安科技有限公司 | 图片的处理方法、装置、设备和存储介质 |
FR3094122A1 (fr) * | 2019-03-22 | 2020-09-25 | Stmicroelectronics (Grenoble 2) Sas | Dispositif électronique de traitement d’images |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099722A (ja) * | 1998-09-22 | 2000-04-07 | Toshiba Corp | 人物顔認識装置及び人物顔認識方法 |
JP2000259838A (ja) * | 1999-03-12 | 2000-09-22 | Fujitsu Ltd | 画像追跡装置及び記録媒体 |
JP2009011005A (ja) * | 2008-10-10 | 2009-01-15 | Panasonic Corp | 画像処理装置 |
JP2013134609A (ja) * | 2011-12-26 | 2013-07-08 | Toyota Central R&D Labs Inc | 縁石検出装置及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002140706A (ja) | 2000-11-01 | 2002-05-17 | Mitsubishi Heavy Ind Ltd | 画像識別装置および画像データ処理装置 |
JP4867620B2 (ja) | 2006-11-28 | 2012-02-01 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP5975598B2 (ja) * | 2010-08-26 | 2016-08-23 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
KR101395094B1 (ko) * | 2010-09-29 | 2014-05-16 | 안동대학교 산학협력단 | 개체 검출 방법 및 시스템 |
SG11201506229RA (en) * | 2013-02-27 | 2015-09-29 | Hitachi Ltd | Image analysis device, image analysis system, and image analysis method |
-
2015
- 2015-03-27 JP JP2015066302A patent/JP2016186703A/ja active Pending
-
2016
- 2016-03-08 US US15/064,472 patent/US10026148B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099722A (ja) * | 1998-09-22 | 2000-04-07 | Toshiba Corp | 人物顔認識装置及び人物顔認識方法 |
JP2000259838A (ja) * | 1999-03-12 | 2000-09-22 | Fujitsu Ltd | 画像追跡装置及び記録媒体 |
JP2009011005A (ja) * | 2008-10-10 | 2009-01-15 | Panasonic Corp | 画像処理装置 |
JP2013134609A (ja) * | 2011-12-26 | 2013-07-08 | Toyota Central R&D Labs Inc | 縁石検出装置及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120277A (ja) * | 2017-01-23 | 2018-08-02 | コニカミノルタ株式会社 | 画像処理装置、物体検出方法および物体検出プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20160283801A1 (en) | 2016-09-29 |
US10026148B2 (en) | 2018-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
JP2016186703A (ja) | 画像認識方法、画像認識装置および画像認識プログラム | |
US10489913B2 (en) | Methods and apparatuses, and computing devices for segmenting object | |
US11315253B2 (en) | Computer vision system and method | |
CN106570453B (zh) | 用于行人检测的方法、装置和系统 | |
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN113516659B (zh) | 一种基于深度学习的医学影像自动分割方法 | |
Schrieber et al. | Dotmark–a benchmark for discrete optimal transport | |
US20060029276A1 (en) | Object image detecting apparatus, face image detecting program and face image detecting method | |
US9053387B2 (en) | Image processing circuit and image detection device | |
US8098963B2 (en) | Resolution conversion apparatus, method and program | |
US20180181816A1 (en) | Handling Perspective Magnification in Optical Flow Proessing | |
CN108292367B (zh) | 图像处理装置、半导体装置、图像识别装置、移动体装置以及图像处理方法 | |
TWI701608B (zh) | 用於圖片匹配定位的神經網路系統、方法及裝置 | |
JP2012511756A (ja) | 検出窓走査により画像内の物体を認識および位置特定するためのデータストリームパイプラインアーキテクチャを有する装置 | |
CN113223078B (zh) | 标志点的匹配方法、装置、计算机设备和存储介质 | |
KR20150114950A (ko) | 이미지 스트림의 프레임 레이트 증가 | |
CN116310688A (zh) | 基于级联融合的目标检测模型及其构建方法、装置及应用 | |
CN111008630A (zh) | 一种基于弱监督学习的目标定位方法 | |
CN112614108B (zh) | 基于深度学习检测甲状腺超声图像中结节的方法和装置 | |
Yonehara et al. | A line-based connected component labeling algorithm using GPUs | |
CN111967408A (zh) | 基于“预测-恢复-识别”的低分辨率行人重识别方法及系统 | |
JP5310402B2 (ja) | 画像変換パラメータ算出装置、画像変換パラメータ算出方法およびプログラム | |
US20230401670A1 (en) | Multi-scale autoencoder generation method, electronic device and readable storage medium | |
JP2005228150A (ja) | 画像照合装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20170330 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181120 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190521 |