JP2016186703A - 画像認識方法、画像認識装置および画像認識プログラム - Google Patents

画像認識方法、画像認識装置および画像認識プログラム Download PDF

Info

Publication number
JP2016186703A
JP2016186703A JP2015066302A JP2015066302A JP2016186703A JP 2016186703 A JP2016186703 A JP 2016186703A JP 2015066302 A JP2015066302 A JP 2015066302A JP 2015066302 A JP2015066302 A JP 2015066302A JP 2016186703 A JP2016186703 A JP 2016186703A
Authority
JP
Japan
Prior art keywords
block
image
feature amount
target
roi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015066302A
Other languages
English (en)
Inventor
俊介 奥村
Shunsuke Okumura
俊介 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Electronics Corp
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Priority to JP2015066302A priority Critical patent/JP2016186703A/ja
Priority to US15/064,472 priority patent/US10026148B2/en
Publication of JP2016186703A publication Critical patent/JP2016186703A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

【課題】1画面の画像内に複数の注目領域が設定され、認識対象画像を含む領域を探索する、画像認識において、特徴量を算出する演算量の増大と算出された特徴量の記憶容量とをともに抑える。【解決手段】認識対象画像を含み複数のブロックから成る認識対象領域について、その領域を構成するブロックから算出される特徴量からなる辞書データを備える。画面内の1ブロックに着目して特徴量を算出し注目ブロック特徴量とする。当該ブロックを含む複数の注目領域のそれぞれについて、辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と注目ブロック特徴量の内積を累積加算して、当該注目領域の評価値の中間データとする。注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する。着目するブロックは、画面内で順次走査する。【選択図】図10

Description

本発明は、画像認識方法、画像認識装置および画像認識プログラムに関し、特に対象画像の探索に好適に利用できるものである。
撮像された画像から対象物を高速に探索する画像認識技術が、注目されている。例えば、例えば、先進運転支援システム(ADAS: Advanced Driving Assistant System)において、自動車に搭載されたカメラで撮影される画像から、歩行者や他の車両を認識する。そのためには、撮像された画像から注目画像領域を選び、その領域の画像データから算出される特徴量データと、探索対象画像について予め算出された特徴量データである、辞書データとを比較することによって、一致の程度を評価する。このとき、特徴量を抽出するアルゴリズムとして、HOG(Histogram of Oriented Gradients)が知られている。HOGでは、画像を複数のブロックに分割し、輝度の勾配方向と濃度勾配を算出してヒストグラムを作成する。
このような画像認識処理について本発明者が検討した結果、以下のような新たな課題があることがわかった。
対象物を探索する画像認識処理において、撮像された画像の1画面(例えば1フレーム、1フィールド)内に複数の注目領域を設定し、注目領域から算出される特徴量と辞書データと照合することによって評価値を算出して、探索対象画像との一致の程度を評価する。このときの画像処理には、具体的には2通りの実装態様がある。
第1の実装態様では、注目領域を画面内で走査しながら、順次、注目領域における特徴量を算出し、辞書データとともに評価関数に入力して評価値を算出する。評価値が所定の閾値を超える注目領域を、探索対象画像を含む画像として抽出する。このとき、特徴量を算出するために必要な演算量が非常に多く、全体の性能を圧迫する恐れがある。これに対して第2の実装態様は、撮像された画面を複数のブロックに分けて、画面全体についてブロック毎の特徴量を予め算出してメモリに記憶しておく。これにより、特徴量を算出するための演算量を抑えることができる一方、算出した特徴量を記憶するためのメモリ容量が非常に大きい。
以上のように、特徴量を算出する演算量の増大を抑えるという課題と、算出された特徴量を記憶するメモリの記憶容量を抑えるという課題とを同時に解決することが重要であることがわかった。
このような課題を解決するための手段を以下に説明するが、その他の課題と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。
一実施の形態によれば、下記の通りである。
すなわち、1画面の画像内に複数の注目領域が設定され、認識対象画像を含む領域を探索する、画像認識方法であって、以下のように構成される。
複数の画素からなるブロックが定義されており、認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出される複数の特徴量からなる辞書データを備えている。また、複数の注目領域のそれぞれは、認識対象領域を構成するブロックの数と同数のブロックから成る。
本画像認識方法では、1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とする。当該ブロックを含む複数の注目領域のそれぞれについて、辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとする。注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する。
前記一実施の形態によって得られる効果を簡単に説明すれば下記のとおりである。
すなわち、特徴量を算出する演算量の増大を抑えながらも、算出された特徴量を記憶するメモリの記憶容量を抑えることができる。
図1は、画像認識処理のフローを模式的に示す説明図である。 図2は、特徴量と辞書データの対応関係を模式的に示す説明図である。 図3は、特徴量マップ作成による画像認識処理方式(比較例1)のフローを模式的に示す説明図である。 図4は、特徴量マップ作成による画像認識処理方式(比較例1)のフローチャートである。 図5は、注目領域単位の特徴量作成による画像認識処理方式(比較例2)のフローを模式的に示す説明図である。 図6は、注目領域単位の特徴量作成による画像認識処理方式(比較例2)のフローチャートである。 図7は、評価値(ROIスコア)を算出するための中間データであるブロックスコアの計算方法を模式的に示す説明図である。 図8は、ROIスコアの中間データを記憶するROI単位スコアマップのデータ形式を模式的に示す説明図である。 図9は、ROI単位スコアマップの計算方法を模式的に示す説明図である。 図10は、実施形態1に係る画像認識処理の一例を示すフローチャートである。 図11は、各種パラメータの定義を示す説明図である。 図12は、HOGによる特徴量抽出に関わるパラメータの数値例を示す説明図である。 図13は、ROIの構成例を示す説明図である。 図14は、HOGを実装するときの各種パラメータの数値例を示す説明図である。 図15は、各方式における演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。 図16は、特徴量マップ作成による画像認識処理方式(比較例1)のフローにおける、演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。 図17は、注目領域単位の特徴量作成による画像認識処理方式(比較例2)のフローにおける、演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。 図18は、実施形態1のフローにおける演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。 図19は、各方式の画像認識処理をソフトウェアで実装するときのAPIを比較する説明図である。 図20は、実施形態1の画像認識処理が実行されるシングルプロセッサの構成例を示す概念図である。 図21は、実施形態1の画像認識処理が実行されるSIMDプロセッサの構成例を示す概念図である。
実施の形態について詳述するに先立って、上述の「発明が解決しようとする課題」について、より詳しく説明する。第1の実装態様の一例として特徴量マップ作成による画像認識処理方式(比較例1)、及び、第2の実装態様の一例として注目領域単位の特徴量作成による画像認識処理方式(比較例2)をそれぞれ引用して説明する。
図1は、画像認識処理のフローを模式的に示す説明図である。撮像された1画面(例えば1フレーム、1フィールド)の画像(入力画像)が入力される。入力画像は例えば車載カメラによって撮像された動画像に含まれる1フレームの画像であって、車道の両脇を示す白線と車両と歩行者が写っているものとして描かれている。画像認識処理では、入力画像の1画面内に注目領域(ROI: Region Of Interest)を順次設定し、その注目領域に認識対象が存在するか否かを検定する。ROIは入力画像を走査する形で複数回設定される、即ち、複数個のROIが順次設定される。認識対象の画像に対応して、辞書データが準備されている。辞書データは、例えば、事前の機械学習によって得られる。画像認識処理では、入力画像の中に設定されたROIを切出し(ステップ1)、切り出されたROIを複数のブロックに分割する(ステップ2)。ここでブロックとは互いに隣接する複数の画素からなる領域であり、例えば、1ブロックは8画素×8画素の領域であり、1個のROIは横4ブロック×縦8ブロックの32個のブロックに分割される。次にブロック毎の特徴量を記述し(ステップ3)、注目領域(ROI)単位の特徴量Xを算出する(ステップ4)。ここで、特徴量Xは、n個の要素(x1, x2, …, xn)であり(nは正の整数)、例えばHOGのような特徴量抽出アルゴリズムを用いて算出される。一方、辞書データも特徴量と同じくn個の要素(w1, w2, …, wn)で構成される。検定処理において、ROI単位の特徴量Xと辞書データWを評価関数f(x, w)に代入し、評価値(スコア)sを算出して認識対象がROI内に存在するか否かの判定を行う(ステップ5)。
図2は、特徴量と辞書データの対応関係を模式的に示す説明図である。事前に用意された辞書データW(w1, w2, …, wn)の要素数と、順次設定される注目領域(ROI)毎に算出されるROI単位の特徴量データX(x1, x2, …, xn)の要素数とは同数である。認識対象の画像が横iブロック×縦jブロックで規定される領域に含まれ(iとjはそれぞれ正の整数)、その領域で辞書データW(w1, w2, …, wn)が準備されているときには、注目領域(ROI)も同じ横iブロック×縦jブロックで規定される領域とされる。即ち、特徴量データ及び辞書データはROI内におけるブロック単位の画像データを基に算出された値を連結したデータである。このとき、ROI単位の特徴量データX(x1, x2, …, xn)の各要素は、辞書データW(w1, w2, …, wn)の各要素と1:1対応する。評価関数が線形SVM(Support Vector Machine)の場合、データの配列順に基づいて内積が計算され、評価値s = f(x, w)とされる。
図3は、特徴量マップ作成による画像認識処理方式(比較例1)のフローを模式的に示す説明図である。この比較例1の実装態様では、入力画像全体を複数のブロックに分割し、ブロック毎に特徴量を算出して、特徴量マップを作成する(ステップ1)。次に、作成された特徴量マップから、入力画像の中に設定されたROIに対応する範囲を選択して、その範囲のブロック毎の特徴量を参照することにより、その注目領域(ROI)単位の特徴量データX1を生成する(ステップ2)。次に、ROI単位の特徴量X1と辞書データWを評価関数f(x1, w)に代入し、評価値(ROIスコア)s1を算出して認識対象がROI内に存在するか否かの判定を行う(ステップ3)。下式に評価値s1を算出するための評価関数の一例を示す。
Figure 2016186703
評価値s1は、例えば、上に示す式のように、特徴量データXと辞書データWの内積値として算出される。
図4は、この比較例1のフローチャートである。入力画像、特徴量マップ、辞書データ、ROIスコア、しきい値、検定結果は入出力または中間生成データであり、コンピュータ内のメモリ(ROM: Read Only MemoryまたはRAM: Random Access Memory)に記録される。特徴量記述部S11、ROI探索部S13、ROIスコア値算出部S14、スコア検定部S16は、ROMまたはRAMに保存されたプログラムをCPU(Central Processing Unit)などのプロセッサで実行することにより、その機能が実現される。まず、入力画像の輝度データを基に特徴量記述部S11において、HOG等のアルゴリズムを用い、画像の輝度データからブロック毎の特徴量を求め、特徴量マップに保存する。入力画像内の全てのブロックについて、特徴量記述が終了するまで繰り返す(S12)。ROIごとの特徴量データは、そのROIを構成するブロックの特徴量を連結したものであるから、特徴量マップには入力画像全体のROIの特徴量データが保存されていることになる。次にROI探索部S13にて特徴量マップから検定対象のROIを選択し、その特徴量データをROIスコア値算出部S14に渡す。ROIスコア値算出部S14は、辞書データとスコア探索部S13から選択された単一のROI特徴量データを受け取り、その演算結果をROIスコアとして保存する。ROIスコアは、ROIの特徴量データと辞書データとの一致の程度を評価する評価値であって、例えば上述の数1に例示した数式によって算出される。スコア検定部S16は、算出されたROIスコアとしきい値を入力として、選択されたROIに認識対象の画像が存在するか否かの検定を行い、その結果を検定結果に保存としてメモリに記録する。入力画像内における次のROIに対して同様の処理を繰り返し(S17)、入力画像の画面全体に対して検定を行う。
図5は、注目領域(ROI)単位の特徴量作成による画像認識処理方式(比較例2)のフローを模式的に示す説明図である。この比較例2の実装態様では、まず、入力画像の中に検定対象のROIを設定する。ROIは入力画像の画面内を走査されるような形で、順次設定される。図5にはROI-1が設定された場合(ステップ1−1)と、ROI-2が設定された場合(ステップ1−2)とが示される。ROI-1が設定された場合(ステップ1−1)、その領域内がブロック分割されてブロック毎の特徴量が算出され、それらが連結されて特徴量データX1(x11, x12, …, x1n)が求められる(ステップ2−1)。次に、ROI単位の特徴量X1と辞書データWを評価関数f(x1, w)に代入し、評価値(ROIスコア)s1を算出して認識対象がROI-1内に存在するか否かの判定を行う(ステップ3−1)。その後、次の探索対象としてROI-2が設定された場合(ステップ1−2)、その領域内がブロック分割されてブロック毎の特徴量が算出され、それらが連結されて特徴量データX2(x21, x22, …, x2n)が求められる(ステップ2−2)。次に、ROI単位の特徴量X2と辞書データWを評価関数f(x2, w)に代入し、評価値(ROIスコア)s2を算出して認識対象がROI-2内に存在するか否かの判定を行う(ステップ3−2)。
図6は、比較例2のフローチャートである。入力画像、ROI特徴量、辞書データ、ROIスコア、しきい値、検定結果は入出力または中間生成データであり、コンピュータ内のメモリに記録される。ROI探索部S21、特徴量記述部S22、ROIスコア値算出部S24、スコア検定部S26は、ROMまたはRAMに保存されたプログラムをCPUなどのプロセッサで実行することにより、その機能が実現される。まず、入力画像から、ROI探索部S21が検定対象のROIを選択し、選択した領域の画像データを特徴量記述部S22の入力とする。次に特徴量記述部S22は、選択されたROIを構成するブロックの特徴量の算出を繰り返す(S23)ことにより、そのROI単位の特徴量データを生成し、ROI特徴量として保存する。ROIスコア値算出部S24はROI特徴量と辞書データを受け取り、その演算結果をROIスコアとして保存する。ROIスコアは、ROIの特徴量データと辞書データとの一致の程度を評価する評価値であって、例えば上述の数1に例示した数式によって算出される。スコア検定部S26は、導出されたROIスコアとしきい値を入力として、選択されたROIに認識対象の画像が存在するか否かの検定を行い、その結果を検定結果に保存としてメモリに記録する。入力画像内における次のROIに対して同様の処理を繰り返し(S27)、入力画像の画面全体に対して検定を行う。
以上説明したように、図3と図4に示した特徴量マップ作成による画像認識処理方式(比較例1)では、中間データとして作成される「特徴量マップ」を保存するためのメモリサイズが大きく、大容量のワークメモリが必要となる。このため、ワークメモリをLSI(Large Scale Integrated circuit)にオンチップ実装するとチップ面積を著しく増大させ、チップコストを上昇させる。または、外部メモリをワークメモリとして、中間データを保存する場合には、外部アクセスのための余計な転送サイクルが必要となり、画像認識演算に要する時間を著しく増加させることになる。一方、図5と図6に示した、注目領域(ROI)単位の特徴量作成による画像認識処理方式(比較例2)は、比較例1のように入力画像全体に対して前もって一括して特徴量計算処理をするのではなく、ROIを選択する度に選択されたROIに対して特徴量計算を行い、画像全体を探索する方式である。このため、大量の中間データが発生せず、メモリ容量またはデータ転送量を抑えることができるという特徴を持つ。しかし、探索において複数のROIの画像領域が部分的にオーバーラップしており(図5参照)、オーバーラップした領域のブロックに対する特徴量計算は複数回行われ、冗長となるため処理時間の増大につながる。
例えば、先進運転支援システムADAS等の画像認識処理は、限られたハードウェアリソースでの実時間動作が求められるため、ワークメモリに格納される中間データの量を抑えることと、冗長な演算を省くことの両立が求められる。
次に、実施の形態について詳述する。なお、発明を実施するための形態を説明するための全図において、同一の機能を有する要素には同一の符号を付して、その繰り返しの説明を省略する。
〔実施形態1〕
上述の課題を解決するために、本実施形態1では、注目領域(ROI)を構成するブロックに着目する。図2に示したように、1個のROIは同一サイズの複数のブロックから構成されている。ROI単位の特徴量はブロックの特徴量を、予め定義された順番に従って連結することで導出される。ここで、ブロックごとの特徴量は数十〜数百個のデータ配列で構成され、ROI単位の特徴量データはそのブロック数倍の百〜千数百個データ配列で構成される。上述の特徴量マップ作成による画像認識処理方式(比較例1)において生成される「特徴量マップ」は、入力画像全体のデータをこのブロック特徴量データに変換したデータ配列である。本実施形態1は、中間データとして、この特徴量マップではなく、ブロックごとに導出されたスコア(スカラー値)をROI単位スコアマップとして保存する方法である。
図7は、評価値(ROIスコア)を算出するための中間データであるブロックスコアの計算方法を模式的に示す説明図である。選択されたROIの特徴量データと、周辺のROIの特徴量データとの関係が示される。ROIは縦8ブロック×横4ブロックの合計32ブロックで構成されるものとし、左上から行方向、さらには列方向に順次、第1ブロックblock1、第2ブロックblock2、…、第32ブロックblock32で構成されるものとする。ブロック単位の特徴量はm個のデータ列で構成され、ROI単位の特徴量データは、そのROIを構成するすべてのブロックの特徴量が連結されたもので、合計n=32m個で構成される。辞書データW(w1, w2, …, wn)も同数であり、w1, w2, …, wmは第1ブロックblock1に、次のwm+1, wm+2, …, w2mは第2ブロックblock2に、その後順次、最後のwn-m+1,wn-m+2, …, wnは第32ブロックblock32に、それぞれ対応する。
着目する注目領域をROI-0とし、その左上のブロック(第1ブロックblock1)に着目する。このブロック(着目ブロック)の特徴量を(x01, x02, …, x0m)とする。ROI-0においてこの着目ブロックは第1ブロックblock1なので、ROI-0の特徴量データX0においてはblock1の位置に連結される。即ち、X0=(x01, x02, …, x0m,xm+1, xm+2, …, x2m,…, xn)となる。ここで、着目ブロックの特徴量(x01, x02, …, x0m)を算出し、合せてROI-0についての評価値(ROIスコア)の計算を開始する。ROI-0の評価値(ROIスコア)は下式で表される。
Figure 2016186703
このうち、着目ブロックに関する項のみを下式で計算しブロックスコア(blkscore)を得る。
Figure 2016186703
評価値(ROIスコア)は、ROIを構成する全てのブロックのブロックスコア(blkscore)の合計として算出することができる。
着目ブロックは、ROI-0の周辺の他のROIにも含まれる。例えば、ROI-1の第2ブロックであり、ROI-2の第15ブロックであり、ROI-3の第32ブロックであるとする。着目ブロックの特徴量(x01, x02, …, x0m)が算出された時、上述のようにROI-0の評価値(ROIスコア)の計算を開始するのと合せて、周辺の他のROIの評価値(ROIスコア)の計算を行う。即ち、ROI-1については、着目ブロックの特徴量(x01, x02, …, x0m)を第2ブロックblock2の特徴量として、辞書データの第2ブロックに対応するデータ列との間の内積を取ってブロックスコアを算出し、ROI-1のROIスコアの一部として既に算出されている中間データに累積的に加算する。同様にROI-2については、着目ブロックの特徴量(x01, x02, …, x0m)を第15ブロックblock15の特徴量として、辞書データの第15ブロックに対応するデータ列との間の内積を取ってブロックスコアを算出し、ROI-2のROIスコアの一部として既に算出されている中間データに累積的に加算する。またROI-3については、着目ブロックの特徴量(x01, x02, …, x0m)を第32ブロックblock32の特徴量として、辞書データの第32ブロックに対応するデータ列との間の内積を取ってブロックスコアを算出し、ROI-2のROIスコアの一部として既に算出されている中間データに累積的に加算する。
図8は、ROIスコアの中間データを記憶するROI単位スコアマップのデータ形式を模式的に示す説明図である。ROI単位スコアマップ(roi_score)は、入力画像の1画面内の全てのROIについて、1個のROIに1個の中間データの記憶領域が割り付けられる。図8ではこれを入力画像の1画面内の横方向のROIの数と縦方向のROIの数により2次元的に表現している。プログラム上では2次元配列でも1次元配列でも良い。上述したように、ブロック特徴量は一般的に数十〜百数十程度の要素で構成されたベクトルデータであり、単一のROIが数十程度のブロック特徴量で構成されているので、図3に示した特徴量マップを保存するには、大容量のワークメモリが必要となる。これに対して、本実施形態1では、生成されたROIスコアは1個のROIに対して1個のスカラ値として保存される。すなわち、ブロック特徴量が生成された直後にROI単位のスコアマップを更新することにより、保持すべき中間データの量を大幅に削減することが可能となる。
ROI単位スコアマップの更新方法についてさらに詳しく説明する。図9は、ROI単位スコアマップの計算方法を模式的に示す説明図である。入力画像内の1個のブロックを着目ブロックとして、そのブロックのブロック特徴量を算出する(ステップ1)。算出されたブロック特徴量から、着目ブロックを含むすべてのROIについて、ブロックスコアを算出する(ステップ2)。ブロックスコアは下式によって算出される。
Figure 2016186703
着目ブロックのブロック特徴量をx_blk、辞書データにおけるj番目のブロックに対応するデータ列をw_blk_j、ROI内のブロック数をk個とする。ブロックスコアblkscore[j]はブロック内の要素の内積として算出される。
ROIスコアは下式によって算出される。
Figure 2016186703
探索によって発生するROI座標のオフセットをlとし、roi_socreにはブロックスコアの値が累積加算される。
例えば、着目ブロックがROI-iの第1ブロックであるとすると、ブロックスコアblkscore1は、算出されたブロック特徴量と辞書データのうちの第1ブロックに対応するデータ列との内積として算出される。算出されたブロックスコアblkscore1は、ROI単位スコアマップにおけるROI-iに対応する中間データroi_score[i]に、累積加算される。同じ着目ブロックがROI-i-1の第2ブロックでもあるとすると、ブロックスコアblkscore2が、算出されたブロック特徴量と辞書データのうちの第2ブロックに対応するデータ列との内積として算出される。算出されたブロックスコアblkscore2は、ROI単位スコアマップにおけるROI-i-1に対応する中間データroi_score[i-1]に、累積加算される。同じ着目ブロックがさらに、ROI-i-2の第3ブロックでもあるとすると、ブロックスコアblkscore3が、算出されたブロック特徴量と辞書データのうちの第3ブロックに対応するデータ列との内積として算出される。算出されたブロックスコアblkscore3は、ROI単位スコアマップにおけるROI-i-2に対応する中間データroi_score[i-2]に、累積加算される。以下同様に、当該着目ブロックを含むすべてのROIについて、それぞれブロックスコアが算出され、ROI単位スコアマップにおける当該着目ブロックに対応する中間データに、累積加算される。
図10は、本実施形態1に係る画像認識処理の一例を示すフローチャートである。入力画像、ブロック特徴量、辞書データ、ROI単位スコアマップ、しきい値、検定結果は入出力または中間生成データであり、コンピュータ内のメモリに記録される。ブロック探索部S1、特徴量記述部S2、ブロック・ROI対応決定部S3、ブロックスコア値算出部S4、スコア検定部S7は、ROMまたはRAMに保存されたプログラムをCPUなどのプロセッサで実行することにより、その機能が実現される。
ブロック探索部S1により、着目ブロックが選択される。例えば、入力画像をブロック分割し、走査によって順次選択されるブロックを着目ブロックとする。始点となるブロックの位置を任意の刻み幅でずらしながら、同じ入力画面を複数回に渡って走査して、順次、着目ブロックを選択する。刻み幅を細かくする程、画像認識の精度を向上することができる。ただし、これに伴って保存すべき中間データの容量と演算量は増大するので、トレードオフを考慮して適切に設定する。或いは、入力画像の状態や動作環境に応じて適宜変更しても良い。例えば、この画像認識システムが自動車に搭載される場合に、高速道路を巡航走行していることが想定される高速走行中と、混雑した雑踏を走行していることが想定される低速走行中とで刻み幅を変更することができる。
ブロック特徴量記述部S2は、ブロック探索部S1によって指定される着目ブロックの輝度データを入力データから読み出し、HOG等のアルゴリズムを用いて、読み出した輝度データを特徴量データに変換し、ブロック特徴量として保存する。ブロック特徴量にはROIの中の一部分であるブロックの特徴量が保存される。次にブロック・ROI対応決定部S3が、ブロック特徴量から検定時に参照されるROIの座標及び各ROI内における着目ブロックの座標を導出する。ブロックスコア算出部S4はブロック・ROI対応決定部S3から各ROI内における着目ブロックの座標を受け取り、辞書データの中の対応するデータ列と保存されているブロック特徴量からブロックスコアを導出し、ROI単位スコアマップに累積加算していく。算出終了判定ブロックS5にて、ROI単位スコアマップにROI中における全ブロックのスコアが加算されるまでブロックスコア算出は繰り返される。1ROI分のスコア算出が完了したか否かの判定をROI判定部S6にて行う。ROI中の全ブロックのスコアの累積加算が完了したブロックについて、しきい値を入力として、スコア検定部S7にて選択されたROIに認識対象の画像が存在するか否かの検定を行う。スコア検定部S7の結果を検定結果としてメモリに保存し、入力画像内における次のブロックに対して同様の処理を繰り返し(S8)、画面全体に対して検定を行う。
本実施形態1の効果について説明する。上述の特徴量マップ作成による画像認識処理方式(比較例1)、注目領域単位の特徴量作成による画像認識処理方式(比較例2)、及び、本実施形態1について、演算回数とデータ容量(記憶容量または転送量)を評価して比較する。特徴量抽出のためのアルゴリズムをHOGとし、各種パラメータの定義を図11に、HOGによる特徴量抽出に関わるパラメータの数値例を図12に、ROIの構成例を図13に、HOGを実装するときの各種パラメータの数値例を図14に、それぞれ示す。
図11には各種パラメータの定義が示されている。入力画像のサイズを、横Image_width×縦Image_heightとし、ROIのサイズを、横block_widthブロック×縦block_heightブロックとし、探索時のステップ幅として、横方向のステップ幅をstep_I_width、縦方向のステップ幅をstep_I_heightとする。探索時のステップ幅は、例えば、ブロックの幅の整数分の1で規定される。
図12にはHOGを実装するときの各種パラメータの数値例が示される。ROIのサイズを16×32画素(pixel)とし、セルのサイズを4×4画素、ブロックのサイズを2×2cell=8×8画素とする。ここで1個のROIは、図13に示すように、横方向に3個、縦方向に7個のブロックで構成される。1個のROIの横方向のサイズは16画素であるので、8×8画素のブロックを横方向に4画素ずつずらした3種類のブロックが含まれ、縦方向のサイズは32画素であるので、8×8画素のブロックを縦方向に4画素ずつずらした7種類のブロックが含まれる。したがって、1個のROIを構成するブロックの数は21(=3×7)個となる。ここでHOGにおける、勾配方向を8方向に量子化する(# of bins = 8)ものとすると、特徴量次元数(feature-dimension)は672(=8×2×2×21)となる。
図14にはHOGを実装するときの各種パラメータの数値例が示される。入力画像のサイズを、横(Image_width)1920画素×縦(Image_height)1080画素とし、横方向の探索ステップを2、縦方向の探索ステップを4とする。このとき、ROIの数は、行方向に953個、列方向に5個、合計4765個となり、ブロックの数は、行方向に957個、列方向11個、合計10527個となる。
図15には、特徴量マップ作成による画像認識処理方式(比較例1)、注目領域単位の特徴量作成による画像認識処理方式(比較例2)、及び、本実施形態1それぞれにおける演算回数とデータ容量(記憶容量または転送量)の評価結果が表形式で示される。1段目にはループ構成が高級言語による記述を使って例示され、2段目にはループによる演算回数が示され、3段目には生成される中間データのデータ量が示され、4段目と5段目には、それぞれの比較結果が示される。
特徴量マップ作成による画像認識処理方式(比較例1)のループは、特徴量記述と特徴量マップの作成・書込みための2重のループと、特徴量マップを読込み、スコアを導出するための4重のループによって構成される。前段の2重のループは、入力画像の走査を横方向のステップ幅step_I_widthと、縦方向のステップ幅step_I_heightそれぞれ繰り返す2重のループである。後段の4重のループは、ブロックの走査を横方向と縦方向にそれぞれ1画素のステップ幅で繰り返す2重のループと、入力画像の走査を横方向のステップ幅step_I_widthと、縦方向のステップ幅step_I_heightでそれぞれ繰り返す、外側の2重ループで構成される。なお、判定は内側の2重ループの外、外側の2重ループ内で行う。その結果、ブロック特徴量を作成するための演算回数はA×B、スコア導出のための演算回数はA×B×C×D、判定のための演算回数はA×Bとなる。また、生成される中間データ(この比較例1では特徴量マップ)のデータ量は、673,728Byte(=10527×31×2)である。ここでA=Image_hight/step_I_h、B=Image_width/step_I_w、C=Block_height、D=Block_widthである。
図16は、特徴量マップ作成による画像認識処理方式(比較例1)のフローにおける、演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。図4と同様のフローチャートが示され、合せて演算回数と中間データのデータ容量(記憶容量または転送量)が示される。各ステップは図4と同様であるのでその説明を省略する。特徴量記述部S11を含むループは、上述した前段の2重ループであり、演算回数はA×Bである。ROIスコア算出部S14を含むループは、上述した後段の4重ループであり、演算回数はA×B×C×Dである。スコア検定部S16を含むループは、上述した後段の4重ループの外側の2重ループであり、演算回数はA×Bである。このとき、全ブロック数(10,527)に対して1ブロックを構成する次元数(ここでは32)分のデータが必要となるため、1次元あたりの特徴量を2Bとすると、特徴量マップのデータ容量は673,728Byteである。
注目領域単位の特徴量作成による画像認識処理方式(比較例2)のループは、ブロック特徴量作成のための4重ループで構成される。スコア導出と判定は、この4重ループを構成する内側の2重ループの外側に配置される。外側の2重ループは、入力画像の走査を横方向のステップ幅step_I_widthと、縦方向のステップ幅step_I_heightとでそれぞれ繰り返す2重ループである。内側の2重ループは、ブロックの走査を横方向と縦方向にそれぞれ1画素のステップ幅で繰り返す2重ループである。その結果、ブロック特徴量を作成するための演算回数はA×B×C×D、スコア導出のための演算回数はA×B×C×D、判定のための演算回数はA×Bとなる。また、生成される中間データ(この比較例2ではROI特徴量)のデータ量は、ブロック特徴量のデータサイズ×C×Dで算出され、1,344Byte(=10527×31×2)である。
図17は、注目領域単位の特徴量作成による画像認識処理方式(比較例2)のフローにおける、演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。図6と同様のフローチャートが示され、合せて演算回数と中間データのデータ容量(記憶容量または転送量)が示される。各ステップは図6と同様であるのでその説明を省略する。特徴量記述部S21を含むループは、上述した4重ループ内にあり、演算回数はA×B×C×Dである。ROIスコア値算出部S24を含むループも、上述した4重ループ内にあり、演算回数はA×B×C×Dである。スコア検定部S28を含むループは、上述した4重ループの外側の2重ループであり、演算回数はA×Bである。また、上述のようにROI特徴量のデータ量は1,344Byteである。
本実施形態1のループは、スコア導出のための2重ループと、その外側のブロック特徴量作成と判定を含む2重ループで構成される。外側の2重ループは、入力画像の走査を横方向のステップ幅step_I_widthと、縦方向のステップ幅step_I_heightとでそれぞれ繰り返す2重ループである。内側の2重ループは、ブロックの走査を横方向と縦方向にそれぞれ1画素のステップ幅で繰り返す2重ループである。その結果、ブロック特徴量を作成するための演算回数はA×B、スコア導出のための演算回数はA×B×C×D、判定のための演算回数はA×Bとなる。また、生成される中間データ(本実施形態1ではROI単位スコアマップ)のデータ量は、スコアデータサイズ×ROI数で算出され、19,060Byte(=4765×4)である。
図18は、実施形態1のフローにおける演算回数とデータ容量(記憶容量または転送量)の評価結果を示す説明図である。図10と同様のフローチャートが示され、合せて演算回数と中間データのデータ容量(記憶容量または転送量)が示される。各ステップは図10と同様であるのでその説明を省略する。ブロック特徴量記述部S2を含むループは、上述した内側の2重ループの外にあり、演算回数はA×Bである。ブロックスコア値算出部S4を含むループは、上述した内側の2重ループ内にあり、演算回数はA×B×C×Dである。スコア検定部S28を含むループは、上述した内側の2重ループの外側の2重ループであり、演算回数はA×Bである。また、上述のようにROI単位スコアマップのデータ量は19,060Byteである。
以上のように、本実施形態1の演算量は、ブロック特徴量を作成するための演算回数A×Bが、比較例2の場合のA×B×C×Dよりも大幅に抑えられ、比較例1と同等である。本実施形態1のデータ容量(記憶容量または転送量)は、比較例2の場合のROI特徴量のデータ量は1,344Byteよりは多いが、比較例1の場合の特徴量マップのデータ容量は673,728Byteと比較して、ROI単位スコアマップのデータ量19,060Byteとなり、生成される中間データのサイズを2.8%にまで縮小することが可能となる。
以上の各方式の画像認識処理をソフトウェアで実装するときの、API(Application Programming Interface)の一例について説明する。APIは、要素的な処理を実行する各種の関数と、その関数を呼び出して実行する全体のプログラムで把握される。例えば各関数はライブラリとして提供され、それを呼び出して実行する全体のプログラムをユーザが作成する。
図19は、各方式の画像認識処理をソフトウェアで実装するときのAPIを比較する説明図である。
特徴量マップ作成による画像認識処理方式(比較例1)では、特徴量マップを作成する関数[1]と、特徴量マップからROI領域のデータを取り出し、連結する関数[2]と、ROI特徴量と辞書データを入力として、評価値を導出する関数[3]とを備え、それらを[1][2][3]の順に呼び出して実行する。関数[1]は、入力画像から特徴量マップを作成する関数であって、例えば、「create_feature_map(<入力画像>,<特徴量マップ>,<その他>)」と記述される。関数[2]は、特徴量マップからROI領域のデータを取り出し、連結する関数であって、例えば、「create_roi_feature(<特徴量マップ>,<ROI特徴量>,<その他>)」と記述される。関数[3]は、ROI特徴量と辞書データを入力として、評価値を導出する関数であって、例えば、「detector(<ROI特徴量>,<辞書データ>,<評価値>,<その他>)」と記述される。比較例1では、特徴量マップを作成する関数(群)を実行後、特徴量マップから探索を行うROIの領域に対応する特徴量を計算・連結し、最後に辞書データを用いた検定処理を行う関数を呼び出す流れとなる。
注目領域単位の特徴量作成による画像認識処理方式(比較例2)では、ROI特徴量を作成する関数[1]と評価値を導出する関数[2]とを備え、それらを[1][2]の順に呼び出して実行する。関数[1]は、画像および画像中における切り取り座標を入力として、ROI特徴量を作成する関数であり、例えば、「create_roi_feature(<入力画像>、<座標>,<ROI特徴量>,<その他>)」と記述される。関数[2]は、ROI特徴量と辞書データを入力として、評価値を導出する関数であり、例えば、「detector(<ROI特徴量>,<辞書データ>,<評価値>,<その他>)」と記述される。比較例2では、矩形領域の画像を入力として特徴量を計算する関数を呼び出したのち、辞書データを用いた検定処理を行う関数を呼び出す流れとなる。
これに対して本実施形態1では、関数としてはROI単位での切り分けは行わず、画像の探索範囲全体を指定し、特徴量抽出、ROI毎の検定を並列で行う関数を一度呼び出すようなユーザインターフェイスとなる。画像および辞書データを入力として、検出された座標を返す関数[1]を備えそれを実行する。関数[1]は、例えば、「scan_detector(<入力画像>,<辞書データ>,<検出結果の座標データ配列>,<ROI単位スコアマップ>)」と記述される。
〔実施形態2〕
実施形態1で説明した画像認識処理は、一般的なシングルプロセッサで実装することが可能である。図20は、実施形態1の画像認識処理が実行されるシングルプロセッサの構成例を示す概念図である。1個のCPUとRAMやROM等のメモリで構成される。ブロック探索部S1、特徴量記述部S2、ブロック・ROI対応決定部S3、ブロックスコア値算出部S4、スコア検定部S7は、RAMやROM等のメモリにプログラムとして保存する。また、入力画像、辞書データ、しきい値、ROI単位スコアマップもメモリに保存し、入出力処理に応じて読み書きを行う。上記データ及びプログラムを基に、1個のCPUが搭載されているシングルプロセッサで実施形態1の画像認識処理を実現することができる。
このようなシングルプロセッサは、特に制限されないが、例えば、公知のCMOS(Complementary Metal-Oxide-Semiconductor)LSIの製造技術を用いて、シリコンなどの単一半導体基板上に形成される。
〔実施形態3〕
実施形態1の画像認識処理は、画像処理のアクセラレータとして利用されるSIMD(Single Instruction Multiple Data)構成プロセッサにおいて、その並列性を活かした処理を実装することが可能となる。図21は、実施形態1の画像認識処理が実行されるSIMDプロセッサの構成例を示す概念図である。SIMDプロセッサは、それぞれがローカルメモリを持つ4個のプロセッシングエレメントPE(Processing Element)0〜3と、全てのPEから参照可能な共有メモリとを備える。データ保存方法の具体例としては、プログラムや入力画像データは全PE参照可能な共有メモリに保存し、辞書データやしきい値などのデータは全PEのローカルメモリに同一の値をそれぞれ保存する。ROI単位スコアマップはPE数で分割し、それぞれローカルで保存する。SIMDプロセッサに実装する場合、1PEに対して1ブロックの特徴量計算と部分評価値計算を割り当て、部分評価値を各PE間で転送することで、ROI単位スコアマップを生成する。一般的なCPUでは単一の部分ブロックにおける特徴量計算から部分評価値計算を行う作業をシーケンシャルに行う必要があるが、SIMDプロセッサで実装した場合、PEの並列数分の部分特徴量計算及び評価値計算を並列に実行することで、さらなる高速化が可能となる。
図21には4個のPEを備えるSIMDプロセッサを例示したが、PEの数は任意である。また、MIMD (Multiple Instruction Multiple Data)プロセッサなど他のアーキテクチャを採用する並列プロセッサに実装しても良い。このようなSIMDプロセッサも、特に制限されないが、例えば、公知のCMOSLSIの製造技術を用いて、シリコンなどの単一半導体基板上に形成される。
以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
ROI 注目領域(Region Of Interest)
roi_score 注目領域(ROI)単位スコアマップ
S1 ブロック探索部
S2 ブロック特徴量記述部
S3 ブロック・ROI対応決定部
S4 ブロックスコア値算出部
S5 算出終了判定ブロック
S6 ROI判定部
S11、S22 特徴量記述部
S13、S21 ROI探索部
S14、S24 ROIスコア値算出部
S7、S16、S26 スコア検定部

Claims (18)

  1. プロセッサとメモリとを備え、前記プロセッサによって実行されるプログラムによって、1画面の画像内に複数の注目領域が設定され、認識対象画像を含む領域を探索する、画像認識処理を実行する、画像認識装置であって、
    前記画像認識処理において、複数の画素からなるブロックが定義され、
    前記認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出される複数の特徴量からなる辞書データが、前記メモリに保持され、
    前記画像認識処理において、前記複数の注目領域のそれぞれは、前記認識対象領域を構成するブロックの数と同数のブロックから成り、
    前記プロセッサは、前記1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とし、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとして前記メモリに一時的に保持し、前記注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する、
    画像認識装置。
  2. 請求項1において、前記特徴量はベクトルデータであり、
    前記スコアは、前記辞書データにおいて当該ブロックに対応するブロックから算出された前記特徴量と前記注目ブロック特徴量との内積である、
    画像認識装置。
  3. 請求項2において、
    前記特徴量は、対応するブロック内の画像におけるエッジの傾きの頻度分布である、
    画像認識装置。
  4. 請求項1において、
    前記注目ブロック特徴量を算出する対象のブロックは、前記1画面内の順次走査によって選択される、
    画像認識装置。
  5. 請求項4において、
    前記順次走査は、前記ブロックのサイズを刻み幅とする1画面分の走査と、前記走査とは始点が前記ブロックのサイズの整数分の1ずつ異なり刻み幅が同じである1画面分の他の複数の走査とを含む、
    画像認識装置。
  6. 請求項1において、前記プロセッサと前記メモリとが単一の半導体基板上に形成された、
    画像認識装置。
  7. 請求項4において、前記プロセッサは、同一命令を並列に実行可能な複数のプロセッサエレメントで構成され、前記メモリは、前記複数のプロセッサエレメントにそれぞれ接続される複数のローカルメモリと前記複数のプロセッサエレメントから共通にアクセス可能な共有メモリとで構成され、
    前記辞書データは前記共有メモリに保持され、
    前記中間データは、対応する注目領域毎に、前記複数のローカルメモリに分散して保持され、
    前記順次走査によって、複数のブロックが並列に選択され、前記複数のプロセッサエレメントにそれぞれ割り当てられ、前記複数のプロセッサエレメントはそれぞれ、割り当てられたブロックについて、前記注目ブロック特徴量を算出し、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを算出し、算出された前記スコアを対応する中間データが保持されるローカルメモリに接続されるプロセッサエレメントに転送する、
    画像認識装置。
  8. 請求項7において、前記複数のプロセッサエレメントと前記複数のローカルメモリと前記共有メモリとが単一の半導体基板上に形成された、
    画像認識装置。
  9. メモリが接続されたプロセッサによって実行されることによって、1画面の画像から認識対象画像を含む領域を探索する、画像認識プログラムであって、
    前記1画面の画像内に複数の注目領域を設定し、複数の画素からなるブロックを定義し、
    前記認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出された複数の特徴量からなる辞書データを前記メモリ上に保持し、
    前記複数の注目領域のそれぞれは、前記認識対象領域を構成するブロックの数と同数のブロックから成り、
    前記1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とし、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとして前記メモリ上に保持し、前記注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する、
    画像認識プログラム。
  10. 請求項9において、前記特徴量はベクトルデータであり、
    前記スコアは、前記辞書データにおいて当該ブロックに対応するブロックから算出された前記特徴量と前記注目ブロック特徴量との内積である、
    画像認識プログラム。
  11. 請求項10において、前記特徴量は、対応するブロック内の画像におけるエッジの傾きの頻度分布である、
    画像認識プログラム。
  12. 請求項9において、
    前記注目ブロック特徴量を算出する対象のブロックは、前記1画面内の順次走査によって選択される、
    画像認識プログラム。
  13. 請求項12において、
    前記順次走査は、前記ブロックのサイズを刻み幅とする1画面分の走査と、前記走査とは始点が前記ブロックのサイズの整数分の1ずつ異なり刻み幅が同じである1画面分の他の複数の走査とを含む、
    画像認識プログラム。
  14. 1画面の画像内に複数の注目領域が設定され、認識対象画像を含む領域を探索する、画像認識方法であって、
    複数の画素からなるブロックが定義され、
    前記認識対象画像を含み、複数のブロックから成る認識対象領域に対応して、当該認識対象領域を構成するブロックからそれぞれ算出される複数の特徴量からなる辞書データを有し、
    前記複数の注目領域のそれぞれは、前記認識対象領域を構成するブロックの数と同数のブロックから成り、
    前記1画面内のブロック毎に特徴量を算出して注目ブロック特徴量とし、当該ブロックを含む複数の注目領域のそれぞれについて、前記辞書データにおいて当該ブロックに対応するブロックから算出された特徴量と前記注目ブロック特徴量から算出されるスコアを累積加算して、当該注目領域毎の評価値の中間データとし、前記注目領域毎に、当該注目領域を構成するすべてのブロックについての前記累積加算を終えた評価値に基づいて、当該注目領域が前記認識対象画像を含むか否かを判定する、
    画像認識方法。
  15. 請求項14において、前記特徴量はベクトルデータであり、
    前記スコアは、前記辞書データにおいて当該ブロックに対応するブロックから算出された前記特徴量と前記注目ブロック特徴量との内積である、
    画像認識方法。
  16. 請求項15において、前記特徴量は、対応するブロック内の画像におけるエッジの傾きの頻度分布である、
    画像認識方法。
  17. 請求項14において、
    前記注目ブロック特徴量を算出する対象のブロックは、前記1画面内の順次走査によって選択される、
    画像認識方法。
  18. 請求項17において、
    前記順次走査は、前記ブロックのサイズを刻み幅とする1画面分の走査と、前記走査とは始点が前記ブロックのサイズの整数分の1ずつ異なり刻み幅が同じである1画面分の他の複数の走査とを含む、
    画像認識方法。
JP2015066302A 2015-03-27 2015-03-27 画像認識方法、画像認識装置および画像認識プログラム Pending JP2016186703A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015066302A JP2016186703A (ja) 2015-03-27 2015-03-27 画像認識方法、画像認識装置および画像認識プログラム
US15/064,472 US10026148B2 (en) 2015-03-27 2016-03-08 Image recognition method, image recognition device and image recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015066302A JP2016186703A (ja) 2015-03-27 2015-03-27 画像認識方法、画像認識装置および画像認識プログラム

Publications (1)

Publication Number Publication Date
JP2016186703A true JP2016186703A (ja) 2016-10-27

Family

ID=56975467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015066302A Pending JP2016186703A (ja) 2015-03-27 2015-03-27 画像認識方法、画像認識装置および画像認識プログラム

Country Status (2)

Country Link
US (1) US10026148B2 (ja)
JP (1) JP2016186703A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120277A (ja) * 2017-01-23 2018-08-02 コニカミノルタ株式会社 画像処理装置、物体検出方法および物体検出プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229248A (zh) * 2016-12-14 2018-06-29 贵港市瑞成科技有限公司 基于车底阴影的车辆检测方法
CN110019891B (zh) * 2017-12-29 2021-06-01 浙江宇视科技有限公司 图像存储方法、图像检索方法及装置
CN109145763B (zh) * 2018-07-27 2021-07-13 天津大学 基于自然语言描述的视频监控行人搜索图像文本融合方法
CN109523591A (zh) * 2018-11-21 2019-03-26 北京锐安科技有限公司 图片的处理方法、装置、设备和存储介质
FR3094122A1 (fr) * 2019-03-22 2020-09-25 Stmicroelectronics (Grenoble 2) Sas Dispositif électronique de traitement d’images

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099722A (ja) * 1998-09-22 2000-04-07 Toshiba Corp 人物顔認識装置及び人物顔認識方法
JP2000259838A (ja) * 1999-03-12 2000-09-22 Fujitsu Ltd 画像追跡装置及び記録媒体
JP2009011005A (ja) * 2008-10-10 2009-01-15 Panasonic Corp 画像処理装置
JP2013134609A (ja) * 2011-12-26 2013-07-08 Toyota Central R&D Labs Inc 縁石検出装置及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140706A (ja) 2000-11-01 2002-05-17 Mitsubishi Heavy Ind Ltd 画像識別装置および画像データ処理装置
JP4867620B2 (ja) 2006-11-28 2012-02-01 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5975598B2 (ja) * 2010-08-26 2016-08-23 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
KR101395094B1 (ko) * 2010-09-29 2014-05-16 안동대학교 산학협력단 개체 검출 방법 및 시스템
SG11201506229RA (en) * 2013-02-27 2015-09-29 Hitachi Ltd Image analysis device, image analysis system, and image analysis method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099722A (ja) * 1998-09-22 2000-04-07 Toshiba Corp 人物顔認識装置及び人物顔認識方法
JP2000259838A (ja) * 1999-03-12 2000-09-22 Fujitsu Ltd 画像追跡装置及び記録媒体
JP2009011005A (ja) * 2008-10-10 2009-01-15 Panasonic Corp 画像処理装置
JP2013134609A (ja) * 2011-12-26 2013-07-08 Toyota Central R&D Labs Inc 縁石検出装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120277A (ja) * 2017-01-23 2018-08-02 コニカミノルタ株式会社 画像処理装置、物体検出方法および物体検出プログラム

Also Published As

Publication number Publication date
US20160283801A1 (en) 2016-09-29
US10026148B2 (en) 2018-07-17

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
JP2016186703A (ja) 画像認識方法、画像認識装置および画像認識プログラム
US10489913B2 (en) Methods and apparatuses, and computing devices for segmenting object
US11315253B2 (en) Computer vision system and method
CN106570453B (zh) 用于行人检测的方法、装置和系统
CN109960742B (zh) 局部信息的搜索方法及装置
CN113516659B (zh) 一种基于深度学习的医学影像自动分割方法
Schrieber et al. Dotmark–a benchmark for discrete optimal transport
US20060029276A1 (en) Object image detecting apparatus, face image detecting program and face image detecting method
US9053387B2 (en) Image processing circuit and image detection device
US8098963B2 (en) Resolution conversion apparatus, method and program
US20180181816A1 (en) Handling Perspective Magnification in Optical Flow Proessing
CN108292367B (zh) 图像处理装置、半导体装置、图像识别装置、移动体装置以及图像处理方法
TWI701608B (zh) 用於圖片匹配定位的神經網路系統、方法及裝置
JP2012511756A (ja) 検出窓走査により画像内の物体を認識および位置特定するためのデータストリームパイプラインアーキテクチャを有する装置
CN113223078B (zh) 标志点的匹配方法、装置、计算机设备和存储介质
KR20150114950A (ko) 이미지 스트림의 프레임 레이트 증가
CN116310688A (zh) 基于级联融合的目标检测模型及其构建方法、装置及应用
CN111008630A (zh) 一种基于弱监督学习的目标定位方法
CN112614108B (zh) 基于深度学习检测甲状腺超声图像中结节的方法和装置
Yonehara et al. A line-based connected component labeling algorithm using GPUs
CN111967408A (zh) 基于“预测-恢复-识别”的低分辨率行人重识别方法及系统
JP5310402B2 (ja) 画像変換パラメータ算出装置、画像変換パラメータ算出方法およびプログラム
US20230401670A1 (en) Multi-scale autoencoder generation method, electronic device and readable storage medium
JP2005228150A (ja) 画像照合装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20170330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190521