JP2021096652A - 画像識別装置、方法、及びプログラム - Google Patents

画像識別装置、方法、及びプログラム Download PDF

Info

Publication number
JP2021096652A
JP2021096652A JP2019227587A JP2019227587A JP2021096652A JP 2021096652 A JP2021096652 A JP 2021096652A JP 2019227587 A JP2019227587 A JP 2019227587A JP 2019227587 A JP2019227587 A JP 2019227587A JP 2021096652 A JP2021096652 A JP 2021096652A
Authority
JP
Japan
Prior art keywords
pixels
image
circle
contour
intersection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019227587A
Other languages
English (en)
Inventor
芳 印
Kaoru In
芳 印
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019227587A priority Critical patent/JP2021096652A/ja
Priority to US17/089,919 priority patent/US11275963B2/en
Publication of JP2021096652A publication Critical patent/JP2021096652A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Abstract

【課題】画像から円形状を識別する際の演算量を削減する。【解決手段】輪郭画像からラスタスキャン順に輪郭上の画素を探索し、探索された輪郭上の画素を基準点となる画素P1として検出し、画素P1との縦方向の距離がINTER_Y間隔となるライン毎に、画素P1との横方向の距離が、x−INTER_Xからx(画素P1のX座標)までの範囲内となる領域において、輪郭上の画素P2、P3、P4を検出する。P1〜P3は、円心の座標及び半径の計算に用いられ、P4は、計算された円心の座標及び半径で識別される円の適切性を判定するために用いられる。【選択図】図2

Description

開示の技術は、画像識別装置、画像識別方法、及び画像識別プログラムに関する。
近年、自動車の安全運転支援技術に対する需要が高まっており、例えば、車載カメラ等で撮影された映像から、道路標識や信号等を認識することが行われている。丸い交通標識や信号を認識するためには、入力された画像から、円形状の部分を識別する必要がある。
円形状を識別する方法として、ハフ変換を用いた方法が知られている。ハフ変換では、半径を示すパラメータr、円心の座標を示すパラメータ(a,b)を用いて、r=(x−a)+(y−b)で円を表現する。そして、入力画像に対してエッジ検出を行い、(a,b)及びrをパラメータとして全画素をスキャンし、エッジ上の画素であれば、a、b、及びrの各々を軸とするハフ空間内の点に点数を与え、一つの曲面を生成するように投票を行う。多い票を獲得したハフ空間内の点を、円心(a,b)及び半径rの円周上の画素と認識する。
また、例えば、カラーカメラにより撮影された画像に基づいて標識を認識する方法が提案されている。この方法では、入力された画像の色信号を色相・彩度・明度情報に変換して標識の特定色を入力された画像から抽出して抽出画像とし、抽出画像の形状と基調となる形状とを比較して標識を認識する。
また、円又は楕円のエッジ情報からその中心を求めることにより、ノイズなどの影響を受けずに円又は楕円を認識する画像認識方法が提案されている。この方法では、2値画像信号から対象物の候補領域を抽出し、候補領域内の円又は楕円のエッジを抽出し、その中心を算出する。また、候補領域内をメッシュに分割し、各メッシュ内の黒画素数をメモリ4に保持し、候補領域内の円又は楕円の中心からの複数の同心円に沿って、各円周上のメッシュデータを配列した特徴量データを作成する。そして、辞書内の同一半径の特徴量データとマッチングを行って回転角度を検出し、回転角度の確信度を基に画像を認識する。
また、撮像された画像内に円形対象物以外のパターンが撮像されている場合や、撮像された画像内の円形対象物の一部が欠けた場合であっても、円形対象物の中心位置を検出し得る画像位置計測方法が提案されている。この方法では、円形対象物の画像から対象物とそれ以外の部分とのエッジ部分を抽出し、抽出されたエッジから任意の3点を選び出し、3点の位置情報から予測される円の中心点を算出する。そして、抽出された複数の候補点に対して近接する中心位置データを一まとめとする目標点抽出を実行し、最後にその目標点位置を結果として出力する。
また、カラー画像を用いた看板及び標識を認識する方法が提案されている。この方法では、色情報の中の色相に着目してその範囲を3分割し、各分割領域において彩度情報が所定の閾値を超え、かつ円形度が所定の値となる場合に看板を抽出する。
特開平9−185703号公報 特開平9−114990号公報 特開平9−178427号公報 特開2008−287735号公報
しかしながら、ハフ変換を用いた円形状の検出は、演算量が非常に多いという問題がある。また、上述した従来技術では、抽出画像の重心を求めたり、円周上の全ての点を用いて円心を計算したりする必要があるなど、演算量が多くなる。
一つの側面として、開示の技術は、画像から円形状を識別する際の演算量を削減することを目的とする。
一つの態様として、開示の技術は、入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得する取得部と、前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出する検出部とを含む。また、開示の技術は、前記検出部により検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と前記検出部により検出された画素の内のいずれかの画素との距離とを計算する計算部を含む。さらに、開示の技術は、前記交点を円心、前記距離を半径とする円を前記入力画像から識別する識別部を含む。
一つの側面として、画像から円形状を識別する際の演算量を削減することができる、という効果を有する。
本実施形態に係る画像識別装置の機能ブロック図である。 輪郭上の画素の検出を説明するための図である。 円心の座標の計算を説明するための図である。 識別された円の適切性の判定を説明するための図である。 本実施形態に係る画像識別装置として機能するコンピュータの概略構成を示すブロック図である。 本実施形態における画像識別処理の一例を示すフローチャートである。 検出処理の一例を示すフローチャートである。 検出対象画素探索処理の一例を示すフローチャートである。 計算識別処理の一例を示すフローチャートである。
以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。本実施形態では、車載カメラにより撮影された映像から、丸い信号、標識等の円形状を識別する場合について説明する。
図1に示すように、画像識別装置10には、車載カメラにより撮影された映像が入力される。画像識別装置10は、映像を構成する各フレーム画像から、信号、標識等の円形状を識別し、円識別結果を出力する。
画像識別装置10は、機能的には、図1に示すように、取得部12と、検出部14と、計算部16と、識別部18とを含む。
取得部12は、入力された映像の各フレーム画像から、被写体の輪郭を示す画素が抽出された輪郭画像を取得する。具体的には、取得部12は、各フレーム画像から、識別対象の円を示す色成分を有する画素を抽出して2値化することにより、輪郭画像を取得する。
より具体的には、取得部12は、YUV色空間又はRGB色空間の画像であるフレーム画像を、HSV色空間の画像に変換する。取得部12は、HSV色空間の画像に変換されたフレーム画像から、赤や青など、道路標識や信号に多く含まれる色成分の画素を抽出し、抽出した画素を黒画素、それ以外の画素を白画素とする輪郭画像を取得し、所定の記憶領域に保存する。
道路交通標識や信号の認識では、屋外で撮影された映像が処理対象となるため、YUV色空間又はRGB色空間より光の明るさの影響を受け難いHSV色空間に変換することで、対象の色成分の画素を精度良く抽出することができる。
検出部14は、輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、輪郭上の3点以上の画素を検出する。なお、本実施形態では、4点の画素を検出する場合について説明する。
具体的には、検出部14は、図2に示すように、取得部12で取得された輪郭画像70からラスタスキャン順に輪郭上の画素を探索し、探索された輪郭上の画素を基準点となる画素P1として検出する。検出部14は、画素P1との縦方向(Y軸方向)の距離が予め定めた距離(INTER_Y)間隔となるライン毎に、画素P1との横方向(X軸方向)の距離が予め定めた範囲内となる領域において、他の3点の輪郭上の画素(P2、P3、P4)を検出する。横方向の予め定めた範囲は、画素P1のX座標をx、予め定めた距離をINTER_Xとすると、x−INTER_Xからxまでの範囲である。
INTER_Yの値は、1つの円形状を識別するために、少なくとも3点が必要であることを考慮して、最小値を2画素、最大値を識別対象の円の直径の1/3とする。また、一部が欠けた円も識別対象とする場合、例えば、最小値と最大値との中間値よりも小さい値にするなど、INTER_Yの値は小さめに設定することが望ましい。また、INTER_Xの値は、小さ過ぎると検出漏れが生じ、大き過ぎると演算量が増加するため、識別対象の円の直径に基づいて適切な値を定めておく。
計算部16は、検出部14により検出された画素P1〜P3のうちの2点ずつの画素の組合せ毎の、2点を端点とする線分の垂直二等分線の交点を計算する。これは、3点を通る円の中心は垂直二等分線の交点であることを利用して、円心の座標を求めるためである。
具体的には、図3に示すように、画素P1の座標を(P1_X,P1_Y)、画素P2の座標を(P2_X,P2_Y)、画素P3の座標を(P3_X,P3_Y)、円心の座標を(a,b)とする。計算部16は、P1及びP2を端点とする線分72の傾きT12と、線分72の中心点P12の座標とを、以下のように計算する。
T12=(P2_Y−P1_Y)/(P2_X−P1_X)
P12_X=(P1_X+P2_X)/2
P12_Y=(P1_Y+P2_Y)/2
また、計算部16は、線分72の垂直二等分線74の傾きTAを、以下のように計算する。
TA=−1/T12
計算部16は、下記(1)式に示すように、画素P12と円心とを通る直線の方程式を立てる。
b=TA*a+m ・・・(1)
計算部16は、以下に示すように、上記方程式に画素P12の座標を代入して、下記(2)式に示すように、定数mを求める。
P12_Y=TA*P12_X+m
m=P12_Y−TA*P12_X ・・・(2)
同様に、計算部16は、画素P2及び画素P3を端点とする線分76の傾きTBと、線分76の中心点P23の座標とを計算し、以下に示すように、画素P23と円心とを通る直線の方程式を立てる。
b=TB*a+n ・・・(3)
計算部16は、以下に示すように、上記方程式に画素P23の座標を代入して、下記(4)式に示すように、定数nを求める。
P23_Y=TB*P23_X+n
n=P23_Y−TB*P23_X ・・・(4)
計算部16は、(1)式及び(2)式に示す方程式に、(3)式及び(4)式を代入して、2つの方程式を解くことにより、円心の座標(a,b)を計算する。
また、計算部16は、円心と画素P1〜P3のいずれかの画素(例えば、画素P1)との距離を、半径rとして計算する。
識別部18は、計算部16で計算された円心の座標(a,b)、及び半径rで表される円を、フレーム画像から識別する。識別部18は、検出部14により検出された画素のうち、計算部16により円心の座標の計算に利用された画素以外の画素と円心との距離と、半径との差が予め定めた閾値以下である場合に、識別した円を、最終的に円識別結果として出力する対象の円として識別する。円心の座標の計算に利用された画素以外の画素と円心との距離と、半径とがほぼ一致していれば、その画素は識別された円上の点であるとみなすことができ、誤識別ではなく、適切に識別された円である確度が高いと言える。すなわち、円心の座標の計算に利用された画素以外の画素を用いて、識別された円の適切性を判定するものである。
例えば、上記のように、画素P1〜P4が検出され、画素P1〜P3を利用して円心の座標を計算した場合において、図4に示すように、画素P4と円心との距離をP4_dとし、閾値をαとする。この場合、|P4_d−r|≦αであれば、識別部18は、計算部16で計算された円心の座標(a,b)、及び半径rで表される円を、フレーム画像から識別する。
識別部18は、円識別結果として、円心の座標(a,b)、及び半径rの値を出力する。出力された円識別結果は、車載カメラで撮影された映像上に重畳表示してもよいし、標識や信号等を認識するシステム等、他のシステムへ入力してもよい。
画像識別装置10は、例えば図5に示すコンピュータ40で実現することができる。コンピュータ40は、CPU(Central Processing Unit)41と、一時記憶領域としてのメモリ42と、不揮発性の記憶部43とを備える。また、コンピュータ40は、入力部、表示部等の入出力装置44と、記憶媒体49に対するデータの読み込み及び書き込みを制御するR/W(Read/Write)部45とを備える。また、コンピュータ40は、インターネット等のネットワークに接続される通信I/F(Interface)46を備える。CPU41、メモリ42、記憶部43、入出力装置44、R/W部45、及び通信I/F46は、バス47を介して互いに接続される。
記憶部43は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部43には、コンピュータ40を、画像識別装置10として機能させるための画像識別プログラム50が記憶される。画像識別プログラム50は、取得プロセス52と、検出プロセス54と、計算プロセス56と、識別プロセス58とを有する。
CPU41は、画像識別プログラム50を記憶部43から読み出してメモリ42に展開し、画像識別プログラム50が有するプロセスを順次実行する。CPU41は、取得プロセス52を実行することで、図1に示す取得部12として動作する。また、CPU41は、検出プロセス54を実行することで、図1に示す検出部14として動作する。また、CPU41は、計算プロセス56を実行することで、図1に示す計算部16として動作する。また、CPU41は、識別プロセス58を実行することで、図1に示す識別部18として動作する。これにより、画像識別プログラム50を実行したコンピュータ40が、画像識別装置10として機能することになる。なお、プログラムを実行するCPU41はハードウェアである。
なお、画像識別プログラム50により実現される機能は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)等で実現することも可能である。
次に、本実施形態に係る画像識別装置10の作用について説明する。画像識別装置10に、車載カメラで撮影された映像の入力が開始されると、画像識別装置10において、図6に示す画像識別処理が実行される。なお、画像識別処理は、開示の技術の画像識別方法の一例である。
ステップS12で、検出部14が、ユーザにより入力されたINTER_X及びINTER_Yの値を設定する。例えば、INTER_X=30(画素)、INTER_Y=5(画素)のような値が設定される。
次に、ステップS14で、取得部12が、画像識別装置10に入力された映像の最初のフレーム画像を処理対象フレーム画像に設定する。
次に、ステップS16で、取得部12が、YUV色空間又はRGB色空間の画像であるフレーム画像を、HSV色空間の画像に変換する。
次に、ステップS18で、取得部12が、HSV色空間の画像に変換された処理対象フレーム画像から、赤や青など、道路標識や信号に多く含まれる色成分の画素を抽出する。そして、取得部12が、抽出した画素を黒画素、それ以外の画素を白画素とする輪郭画像を取得し、所定の記憶領域に保存する。
次に、ステップS20で、検出処理が実行される。ここで、図7を参照して、検出処理について説明する。
ステップS22で、検出部14が、処理対象フレーム画像から取得された輪郭画像の最初の画素(例えば、左上角の画素)を処理対象画素(x,y)に設定する。
次に、ステップS24で、検出部14が、処理対象画素(x,y)が黒画素か否かを判定する。黒画素の場合には、処理はステップS28へ移行し、白画素の場合には、処理はステップS26へ移行する。
ステップS26では、検出部14が、ラスタスキャン順に次の画素を処理対象画素に設定し、処理はステップS24に戻る。一方、ステップS28では、検出部14が、処理対象画素(x,y)を、基準点となる画素P1として検出する。
次に、ステップS30で、検出部14が、変数iを1に設定する。そして、次のステップS32で、検出対象画素探索処理が実行される。ここで、図8を参照して、検出対象画素探索処理について説明する。
ステップS322で、検出部14が、探索画素(xi,yi)を(x−INTER_X,y+INTER_Y*i)に設定する。
次に、ステップS324で、検出部14が、探索画素(xi,yi)が黒画素、かつ左隣の画素(xi−1,yi)が白画素か否かを判定する。肯定判定の場合、処理はステップS326へ移行し、否定判定の場合、処理はステップS328へ移行する。
ステップS326では、検出部14が、探索画素(xi,yi)の座標値を一旦所定の記憶領域に記憶し、処理はステップS328へ移行する。
ステップS328では、検出部14が、xiがxを超えたか否かを判定する。xi≦xの場合には、処理はステップS330へ移行し、検出部14が、探索画素を右隣の画素に移して、処理はステップS324に戻る。xi>xの場合には、処理はステップS332へ移行する。
ステップS332では、検出部14が、所定の記憶領域に、探索画素(xi,yi)の座標値が記憶されているか否かを判定する。記憶されている場合には、処理はステップS334へ移行し、記憶されていない場合には、処理はステップS336へ移行する。
ステップS334では、検出部14が、所定の記憶領域に記憶されている座標値のうち、X座標(xi)が、画素P1のX座標(x)に最も近い座標値(xi,yi)の画素を、検出対象の画素と判定する。一方、ステップS336では、検出部14が、検出対象の画素は存在しないと判定する。そして、処理は検出処理(図7)に戻る。
次に、検出処理(図7)のステップS34で、検出部14が、上記ステップS32の検出対象画素探索処理により、探索画素(xi,yi)が探索されたか否かを判定する。探索画素(xi,yi)が検出対象の画素として判定された場合には、処理はステップS36へ移行し、検出対象の画素は存在しないと判定された場合には、処理はステップS26へ移行する。
ステップS36では、検出部14が、探索画素(xi,yi)を、画素Pi+1として検出する。
次に、ステップS38で、検出部14が、i+1が、検出する画素数nとなったか否かを判定する。i+1=nの場合には、処理は画像識別処理(図6)に戻る。i+1<nの場合には、処理はステップS40へ移行し、検出部14が、iを1インクリメントし、処理はステップS32に戻る。
次に、画像識別処理(図6)のステップS50で、計算識別処理が実行される。ここで、図9を参照して、計算識別処理について説明する。
ステップS52で、計算部16が、検出部14により検出された画素P1〜P3のうちの2点ずつの画素の組合せ毎の、2点を端点とする線分の垂直二等分線の交点を、円心の座標(a,b)として計算する。
次に、ステップS54で、計算部16が、円心と画素P1〜P3のいずれかの画素(例えば、画素P1)との距離を、半径rとして計算する。
次に、ステップS56で、識別部18が、変数kに4を設定する。次に、ステップS58で、識別部18が、画素Pkと円心との距離Pk_dと、半径rとの差が閾値α以下か否かを判定する。|P4_d−r|≦αの場合には、処理はステップS60へ移行し、|P4_d−r|>αの場合には、処理はステップS66へ移行する。
ステップS60では、識別部18が、変数kが、検出された画素数nとなったか否かを判定する。k=nの場合には、処理はステップS64へ移行する。k<nの場合には、処理はステップS62へ移行し、識別部18が、kを1インクリメントし、処理はステップS58に戻る。
ステップS64では、識別部18が、円心の座標(a,b)、及び半径rの値を円識別結果として出力する。
次に、ステップS66で、識別部18が、処理対象フレーム画像の全ての画素について、処理対象画素に設定して処理を終了したか否かを判定する。未処理の画素が存在する場合には、処理は検出処理(図7)のステップS26へ移行し、全ての画素について処理が終了した場合には、画像識別処理(図6)に戻る。
次に、画像識別処理(図6)のステップS70で、取得部12が、入力された映像の全てのフレーム画像について、処理対象フレーム画像に設定して処理を終了したか否かを判定する。未処理のフレーム画像が存在する場合には、処理はステップS72へ移行し、取得部12が、次のフレーム画像を処理対象フレーム画像に設定して、処理はステップS16に戻る。全てのフレーム画像について処理が終了した場合には、画像識別処理は終了する。
以上説明したように、本実施形態に係る画像識別装置によれば、輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、輪郭上の3点以上の画素を検出する。そして、検出された画素のうちの2点ずつの画素の組合せ毎の、2点を端点とする線分の垂直二等分線の交点を円心、円心と検出されたいずれかの画素との距離半径とする円を識別する。これにより、画像から円形状を識別する際の演算量を削減することができる。
また、画像から4点以上の画素を検出した場合、円心の計算に利用した画素以外の画素と円心との距離と、半径との差に基づいて、識別する円の適切性を判定するため、誤識別を防止して、精度良く画像から円形状を識別することができる。
また、輪郭画像として、HSV色空間の画像から識別対象の色成分の画素を抽出して2値化した画像を用いることで、識別対象の円形状を含む輪郭が精度良く抽出された輪郭画像を取得することができる。したがって、精度良く画像から円形状を識別することができる。
上述した、抽出画像と基調となる形状とを比較する従来技術では、抽出画像の形状の重心を求める必要があり、演算量が多くなる。また、円周上のメッシュデータを配列した特徴量データを用いる従来技術では、円周上の全ての点を用いて円心を計算するため、演算量が多くなる。また、抽出されたエッジから選出した3点の位置情報から円の中心点を算出する従来技術では、既知の半径を事前に入力する必要があり、半径が未知の場合に適用することができない。また、色相に着目して分割した各分割領域における円形度を用いる従来技術では、円形度を計算するために1画面分の画像データをメモリに保持することが必要である。
上記のような従来技術の問題点に鑑み、演算量及びメモリ消費量の観点から、本実施形態の効果をより具体的に説明する。
ハフ変換を用いた円識別手法では、入力画像(W*H)について、エッジ検出を行い、エッジの各画素に対して円心のあらゆる座標までの距離を半径として計算するため、演算量は、O(W*H*W*H)であり、非常に多い。
また、三次元のカウンターで円心座標と半径とを記憶するため、(W*H*識別対象の円の最大半径を記憶するためのビット数)のメモリが必要である。
本実施形態の手法によれば、演算量を、O(W*H*3*INTER_X)に削減することができる。例えば、FULL HD画像でINTER_X=30の場合、演算量は、O(1920*1080*1920*1080)からO(1920*1080*3*30)になり、99%削減することができる。
メモリ消費量については、FULL HD画像で最大半径50画素の円を検出する場合、従来手法ではエッジ検出を行った後のモノクロ画像の保持メモリ(1byte*1920*1080=1.98MB)と投票に必要な3次元カウンター(1byte*1920*1080=1.98MB)で合計3.96MBのメモリが必要である。本実施形態の手法では、色空間変換後及び輪郭抽出後の画像保持メモリ(1byte*1920*1080=1.98MB)が必要である。また、輪郭上の画素の検出処理のために、1920画素*100ラインを保持するメモリ(1byte*1920*100=0.18MB)が必要である。すなわち、合わせて2.16MBのメモリが必要で、従来手法に比べて、メモリ消費量は45.5%削減することができる。
演算量を削減することができることにより、円の識別処理時間を大幅に短縮することができ、標識や信号の認識処理の高速化が図れる。また、メモリ消費量を削減することができるため、車載カメラや監視カメラに本実施形態に係る画像識別装置を組み込む場合、カメラのコストを削減することができる。また、車載カメラと本実施形態に係る画像識別装置とを含む車載装置として構成する場合も同様に、車載装置のコストを削減することができる。さらに、本実施形態に係る画像識別装置をクラウド上に配備し、カメラから転送される映像に対して、円の識別処理を行うようにしてもよい。この場合も、クラウド上に構成する画像識別装置のコストを削減することができる。
なお、カメラとクラウド上のサーバとで構成されるシステムにおいて、本実施形態に係る画像識別装置の機能部の一部をカメラに組み込み、又はカメラと共に動作する情報処理装置として構成し、他の機能部をクラウド上のサーバとして構成してもよい。例えば、取得部及び検出部をカメラ側に配備し、計算部及び識別部をサーバ側に配備することにより、上記のメモリ消費量の削減の効果と同様に、カメラからサーバへのデータ転送の際の帯域圧迫を抑制することができる。
また、上記実施形態では、輪郭上の画素を4点検出する場合について説明したが、円心の座標及び半径を計算するためには、少なくとも3点の画素が検出されればよい。
また、計算された円心の座標及び半径の適切性を判定するために利用される画素は、上記実施形態のように1点(4点目の画素)に限定されない。2点以上の画素を適切性の判定に用いてもよい。ただし、適切性の判定に用いる画素の数を多くし過ぎると、画素の検出処理のための演算量が多くなると共に、円の一部が欠けて検出できない画素が生じた場合に処理が中断してしまう等の問題が生じる可能性がある。適切性の判定に用いる画素は、1点又は2点であっても、識別精度の向上に十分寄与し得る。
また、上記実施形態では、輪郭画像として、HSV色空間に変換した画像から対象の色成分を抽出して2値化した画像を用いる場合について説明したが、これに限定されない。一般的なエッジ検出により取得された輪郭画像を用いてもよい。
また、上記実施形態では、車載カメラで撮影された映像から標識や信号等の円形状を識別する場合について説明したが、これに限定されない。例えば、上空から撮影した道路の画像からマンホールを識別する等、他の用途にも適用することができる。
また、上記実施形態では、画像識別プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD−ROM、DVD−ROM、USBメモリ等の記憶媒体に記憶された形態で提供することも可能である。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得する取得部と、
前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出する検出部と、
前記検出部により検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と前記検出部により検出された画素の内のいずれかの画素との距離とを計算する計算部と、
前記交点を円心、前記距離を半径とする円を前記入力画像から識別する識別部と、
を含む画像識別装置。
(付記2)
前記検出部は、4点以上の画素を検出し、
前記計算部は、前記4点以上の画素のうちの3点を用いて前記交点を計算し、
前記識別部は、前記検出部により検出された画素のうち、前記計算部により前記交点の計算に利用された画素以外の画素と前記交点との距離と、前記半径との差が予め定めた閾値以下である場合に、前記入力画像から識別する前記円であると判定する
付記1に記載の画像識別装置。
(付記3)
前記検出部は、前記輪郭画像からラスタスキャン順に前記輪郭上の基準点となる画素を検出し、前記基準点との縦方向の距離が所定距離間隔となるライン毎に、他の2点以上の画素を検出する付記1又は付記2に記載の画像識別装置。
(付記4)
前記所定距離間隔の最小値を2画素、最大値を識別対象の円の直径の1/3とする付記3に記載の画像識別装置。
(付記5)
一部が欠けた円も識別対象とする場合、前記所定距離間隔を、前記最小値と前記最大値との中間値よりも小さい値とする付記4に記載の画像識別装置。
(付記6)
前記検出部は、前記基準点との横方向の距離が所定範囲内となる画素を、前記他の2点以上の画素として検出する付記3〜付記5のいずれか1項に記載の画像識別装置。
(付記7)
前記所定範囲を、識別対象の円の直径に基づいて定めた付記6に記載の画像識別装置。
(付記8)
前記取得部は、前記入力画像から、識別対象の円を示す色成分を有する画素を抽出して2値化することにより、前記輪郭画像を取得する付記1〜付記7のいずれか1項に記載の画像識別装置。
(付記9)
入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得し、
前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出し、
検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と検出された画素の内のいずれかの画素との距離とを計算し、
前記交点を円心、前記距離を半径とする円を前記入力画像から識別する
ことを含む処理をコンピュータが実行する画像識別方法。
(付記10)
前記輪郭上から画素を検出する際、4点以上の画素を検出し、
前記4点以上の画素のうちの3点を用いて前記交点を計算し、
検出された画素のうち、前記交点の計算に利用された画素以外の画素と前記交点との距離と、前記半径との差が予め定めた閾値以下である場合に、前記入力画像から識別する前記円であると判定する
付記9に記載の画像識別方法。
(付記11)
前記輪郭画像からラスタスキャン順に前記輪郭上の基準点となる画素を検出し、前記基準点との縦方向の距離が所定距離間隔となるライン毎に、他の2点以上の画素を検出する付記9又は付記10に記載の画像識別方法。
(付記12)
前記所定距離間隔の最小値を2画素、最大値を識別対象の円の直径の1/3とする付記11に記載の画像識別方法。
(付記13)
一部が欠けた円も識別対象とする場合、前記所定距離間隔を、前記最小値と前記最大値との中間値よりも小さい値とする付記12に記載の画像識別方法。
(付記14)
前記基準点との横方向の距離が所定範囲内となる画素を、前記他の2点以上の画素として検出する付記11〜付記13のいずれか1項に記載の画像識別方法。
(付記15)
前記所定範囲を、識別対象の円の直径に基づいて定めた付記14に記載の画像識別方法。
(付記16)
前記入力画像から、識別対象の円を示す色成分を有する画素を抽出して2値化することにより、前記輪郭画像を取得する付記9〜付記15のいずれか1項に記載の画像識別方法。
(付記17)
入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得し、
前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出し、
検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と検出された画素の内のいずれかの画素との距離とを計算し、
前記交点を円心、前記距離を半径とする円を前記入力画像から識別する
ことを含む処理をコンピュータに実行させるための画像識別プログラム。
(付記18)
前記輪郭上から画素を検出する際、4点以上の画素を検出し、
前記4点以上の画素のうちの3点を用いて前記交点を計算し、
検出された画素のうち、前記交点の計算に利用された画素以外の画素と前記交点との距離と、前記半径との差が予め定めた閾値以下である場合に、前記入力画像から識別する前記円であると判定する
付記17に記載の画像識別プログラム。
(付記19)
前記輪郭画像からラスタスキャン順に前記輪郭上の基準点となる画素を検出し、前記基準点との縦方向の距離が所定距離間隔となるライン毎に、他の2点以上の画素を検出する付記17又は付記18に記載の画像識別プログラム。
(付記20)
入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得し、
前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出し、
検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と検出された画素の内のいずれかの画素との距離とを計算し、
前記交点を円心、前記距離を半径とする円を前記入力画像から識別する
ことを含む処理をコンピュータに実行させるための画像識別プログラムを記憶した記憶媒体。
10 画像識別装置
12 取得部
14 検出部
16 計算部
18 識別部
40 コンピュータ
41 CPU
42 メモリ
43 記憶部
49 記憶媒体
50 画像識別プログラム

Claims (10)

  1. 入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得する取得部と、
    前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出する検出部と、
    前記検出部により検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と前記検出部により検出された画素の内のいずれかの画素との距離とを計算する計算部と、
    前記交点を円心、前記距離を半径とする円を前記入力画像から識別する識別部と、
    を含む画像識別装置。
  2. 前記検出部は、4点以上の画素を検出し、
    前記計算部は、前記4点以上の画素のうちの3点を用いて前記交点を計算し、
    前記識別部は、前記検出部により検出された画素のうち、前記計算部により前記交点の計算に利用された画素以外の画素と前記交点との距離と、前記半径との差が予め定めた閾値以下である場合に、前記入力画像から識別する前記円であると判定する
    請求項1に記載の画像識別装置。
  3. 前記検出部は、前記輪郭画像からラスタスキャン順に前記輪郭上の基準点となる画素を検出し、前記基準点との縦方向の距離が所定距離間隔となるライン毎に、他の2点以上の画素を検出する請求項1又は請求項2に記載の画像識別装置。
  4. 前記所定距離間隔の最小値を2画素、最大値を識別対象の円の直径の1/3とする請求項3に記載の画像識別装置。
  5. 一部が欠けた円も識別対象とする場合、前記所定距離間隔を、前記最小値と前記最大値との中間値よりも小さい値とする請求項4に記載の画像識別装置。
  6. 前記検出部は、前記基準点との横方向の距離が所定範囲内となる画素を、前記他の2点以上の画素として検出する請求項3〜請求項5のいずれか1項に記載の画像識別装置。
  7. 前記所定範囲を、識別対象の円の直径に基づいて定めた請求項6に記載の画像識別装置。
  8. 前記取得部は、前記入力画像から、識別対象の円を示す色成分を有する画素を抽出して2値化することにより、前記輪郭画像を取得する請求項1〜請求項7のいずれか1項に記載の画像識別装置。
  9. 入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得し、
    前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出し、
    検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と検出された画素の内のいずれかの画素との距離とを計算し、
    前記交点を円心、前記距離を半径とする円を前記入力画像から識別する
    ことを含む処理をコンピュータが実行する画像識別方法。
  10. 入力画像から被写体の輪郭を示す画素が抽出された輪郭画像を取得し、
    前記輪郭画像において、縦方向又は横方向に所定距離離れた領域の各々から、前記輪郭上の3点以上の画素を検出し、
    検出された画素のうちの2点ずつの画素の組合せ毎の、前記2点を端点とする線分の垂直二等分線の交点と、前記交点と検出された画素の内のいずれかの画素との距離とを計算し、
    前記交点を円心、前記距離を半径とする円を前記入力画像から識別する
    ことを含む処理をコンピュータに実行させるための画像識別プログラム。
JP2019227587A 2019-12-17 2019-12-17 画像識別装置、方法、及びプログラム Pending JP2021096652A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019227587A JP2021096652A (ja) 2019-12-17 2019-12-17 画像識別装置、方法、及びプログラム
US17/089,919 US11275963B2 (en) 2019-12-17 2020-11-05 Image identification apparatus, image identification method, and non-transitory computer-readable storage medium for storing image identification program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019227587A JP2021096652A (ja) 2019-12-17 2019-12-17 画像識別装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2021096652A true JP2021096652A (ja) 2021-06-24

Family

ID=76318150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019227587A Pending JP2021096652A (ja) 2019-12-17 2019-12-17 画像識別装置、方法、及びプログラム

Country Status (2)

Country Link
US (1) US11275963B2 (ja)
JP (1) JP2021096652A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2934425B1 (ja) * 1998-02-06 1999-08-16 鐘紡株式会社 画像データ圧縮装置および画像データ伸長装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114990A (ja) 1995-10-19 1997-05-02 Ricoh Co Ltd 画像認識方法
JP3675543B2 (ja) 1995-12-27 2005-07-27 Ntn株式会社 画像位置計測方法
JP3006471B2 (ja) 1996-01-08 2000-02-07 三菱自動車工業株式会社 標識の認識方法
DE102006059663B4 (de) * 2006-12-18 2008-07-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Identifizieren eines Verkehrszeichens in einem Bild
CN101567048B (zh) * 2008-04-21 2012-06-06 夏普株式会社 图像辨别装置及图像检索装置
TR200802780A2 (tr) * 2008-04-22 2009-11-23 T�B�Tak- T�Rk�Ye B�L�Msel Ve Teknoloj�K Ara�Tirma Kurumu Kovan dip tablası üzerinde otomatik bölge bölütleme yöntemi ve kovan karşılaştırma için en uygun iz bölgesi seçimi.
JP4336755B2 (ja) 2008-07-28 2009-09-30 国立大学法人秋田大学 カラー画像を用いた看板の認識方法
DE102008052928A1 (de) * 2008-10-23 2010-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung einer Geste in einem Bild, sowie Vorrichtung, Verfahren und Computerprogramm zur Steuerung eines Geräts
JP2013003686A (ja) * 2011-06-13 2013-01-07 Sony Corp 認識装置および方法、プログラム、並びに記録媒体
WO2015149009A1 (en) * 2014-03-27 2015-10-01 Georgia Tech Research Corporation Systems and methods for identifying traffic control devices and testing the retroreflectivity of the same
JP6786035B2 (ja) * 2017-03-27 2020-11-18 三菱重工業株式会社 航空機用部品の欠陥検出システム及び航空機用部品の欠陥検出方法
JP6609345B2 (ja) * 2018-04-27 2019-11-20 株式会社東芝 読取システム、読取方法、プログラム、及び記憶媒体
US20200043072A1 (en) * 2018-08-02 2020-02-06 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for an enterprise pricing solution

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2934425B1 (ja) * 1998-02-06 1999-08-16 鐘紡株式会社 画像データ圧縮装置および画像データ伸長装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
印芳,外2名: "物体検出システムの性能向上に向けた円型標識抽出手法の提案", [ONLINE], JPN7023002287, 5 December 2019 (2019-12-05), ISSN: 0005216114 *

Also Published As

Publication number Publication date
US20210182591A1 (en) 2021-06-17
US11275963B2 (en) 2022-03-15

Similar Documents

Publication Publication Date Title
CN108364010B (zh) 一种车牌识别方法、装置、设备及计算机可读存储介质
KR101617681B1 (ko) 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출
JP4988408B2 (ja) 画像認識装置
CN111179152B (zh) 一种道路标识识别方法及装置、介质、终端
CN105303156B (zh) 字符检测装置、方法及程序
JP2008217347A (ja) ナンバープレート認識装置、その制御方法、コンピュータプログラム
KR101772438B1 (ko) 도로 표지판 인식 시스템에서 막대형 신호를 검출하는 장치 및 방법
JPH11203458A (ja) 道路形状認識装置
JP4762026B2 (ja) 道路標識データベース構築装置
JP2009217832A (ja) ビデオ画像の道路標識自動認識方法及び道路標識自動認識装置並びに道路標識自動認識のプログラムを記憶した記憶媒体
KR101282663B1 (ko) 차량 번호판의 이미지 영역을 검출하기 위한 장치 및 그 방법
CN112926463A (zh) 一种目标检测方法和装置
JP6221283B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP6591257B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5327241B2 (ja) 物体識別装置
JP2021096652A (ja) 画像識別装置、方法、及びプログラム
JP2013254242A (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP6825299B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6874315B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN114359147A (zh) 裂缝检测方法、装置、服务器及存储介质
JP6542407B1 (ja) 読取システム、読取方法、プログラム、及び記憶媒体
JPH11219435A (ja) 自動車用白線検出装置
JP2006172262A (ja) 車両用道路標示検出装置
CN109644236B (zh) 角度检测方法
JP3419968B2 (ja) 画像認識装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220809

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20230206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231212