図10は、本発明の実施例にかかる画像の道路標識を確認するための発明のデバイスのブロック図を示す。図10のデバイスは、全体が1000で示される。デバイス1000は、画像1010を受信する。さらに、デバイス1000は、オプションとして、エッジ検出器1020を含む。エッジ検出器1020は、画像1010を受信して、エッジ画像1022を画像1010からつくり出す。さらに、デバイス1000は、ハフ変換器1030を含む。ハフ変換器1030は、エッジ画像1022を受信する。エッジ検出器1020が省略される場合、ハフ変換器1030が直接画像1010を受信する。さらに、ハフ変換器1030が、画像またはそこから得られるエッジ画像において、異なる方向において画像を通る複数の線部分を確認することが示される。従って、ハフ変換器は、形状検出器1040に画像を通る直線部分に関する情報1032を提供する。形状検出器1040は、確認された線部分に関する情報に基づいて、画像1010、またはそこから得られるエッジ画像1022の所定の形状を確認する。形状検出器1040は、画像において検出される形状に関する情報1042を提供する。
さらに、デバイス1000は、画像1010とともに、画像における形状に関する情報1042を受信するパターン識別器1050を含む。パターン識別器1050は、所定の形状に基づいて、検出された所定の形状に対応する画像部分を選択して、選択された画像部分に基づいて道路標識を確認する。このように、パターン識別器1050は、画像または画像部分において確認される道路標識に関する情報1052を提供する。
上記の構造記述に基づいて、デバイス1000の動作モードについて以下に述べる。
デバイス1000は、画像の道路標識の多段識別を実行する。これは、初めに道路標識の外縁の形状を評価することを含む。ハフ変換器1030は、画像1010から、またはエッジ画像1022から、例えば道路標識の縁部を定める直線部分または線に関する情報を抽出する。画像1010またはハフ変換器1030によるエッジ画像1022において確認される複数または多数の直線部分のために、道路標識の所定の形状(例えば三角形、長方形または正方形)に対応する形状を共に定めるこの種の線または直線部分は、形状検出器1040によって確認される。このように、全体的に見て、道路標識に対応する形状は、画像において確認される。画像またはエッジ画像において検出された形状に関する情報は、パターン識別器に供給される。画像において検出された形状に関する情報は、縁部が道路標識に対応する形状を有する画像の部分を検出する。このように、潜在的に道路標識を含む画像部分は、確認されて、画像内容が道路標識の描写に対応するものと定められる。このように、パターン識別器は、その縁部が道路標識の形状(すなわち、例えば、その縁部が、三角形、長方形あるいは正方形の形状を有するもの)を有する画像部分のみを処理する。このように、本発明の中心的な考えによれば、道路標識は形状検出器1040によって確認されるかまたは検出される形状の範囲内で与えられるだけであるため、パターン識別器1050は、道路標識に対して全ての画像を検索する作業から開放される。全ての画像との画像比較を実行するときには、比較画像は、例えば全ての画像全体にわたってシフトされなければならないため、形状検出器1040によって検出される形状に対する画像比較の応用は、全ての画像との画像比較より実質的に容易に行うことができる。さらに、後述するように、形状検出器1040の利用も、例えばマッピングの方法によって、画像において検出される形状と道路標識の周知の形状との間にできるだけ完全な一致の生成を可能にする。
要約すると、例えば道路標識の部分的な隠蔽のような画像のいかなる障害もハフ変換器1030の利用で効果的に相殺されることができ、他方で、いかなる必要な計算費用も、形状検出器1040およびパターン識別器1050を用いた二段階方法によって大幅に最小化されることができるため、従来のデバイスと比較すると、デバイス1000がかなり信頼性の高い道路標識の検出を可能にすることと言うことができる。
図11aは、画像の道路標識を確認するためのデバイス1000と連動して利用するための発明のエッジ検出器のブロック図を示す。図11aのエッジ検出器は、全体が1100で示される。エッジ検出器1100は、画像1010を受信する。エッジ検出器1100は、画像に閾値を適用するための閾値発生器1120を含む。この目的のために、カラー画像として与えられる画像1010は、例えば、明暗画像に変換される。換言すれば、画像1010がすでに諧調レベル画像として与えられていない限り、カラー画像から諧調レベル画像がつくり出される。閾値発生器1120は、例えば、画像1010に基づく諧調レベル画像(あるいは、画像1010に基づくカラー画像)の二値化を実行する。この目的で、閾値発生器1120は、好ましくは閾値1122を受信して、それを画像1010から得られる諧調レベル画像またはカラー画像に適用する。このように、閾値発生器1120は、画像1110に基づく二値画像1124を提供する。本発明の実施例によれば、閾値発生器1120によって実行される二値化は、適応可能であってもよい。例えば、二値化は、画像1010から得られる諧調レベル画像の諧調レベルのヒストグラム分布に従って適応されることができる。このように、閾値は、最適に、そして諧調レベルのヒストグラム分布に対応して使用されることができる。
エッジ検出器1100または閾値発生器1120がビデオ、すなわち一連の画像1110を受ける場合、繰り返し(例えば、定期的に)閾値1122を再調整することが好ましい。このように、ビデオの所定の数のx画像フレームの後に、閾値を再調整することが可能である。あるいは、画像ごとに最適閾値または閾値1120を決定することも可能である。例えば、この種の画像処理は、ジェーン(Jaehne)によって記載されている。
さらに、好ましくは、図11のエッジ検出器1100は、輪郭検出器1130を含む。エッジ検出アルゴリズムを用いて、輪郭検出器1130は二値画像1124を受信して、二値画像1124からエッジ画像1132を作成する。このように、輪郭検出器1130は、二値画像1124において、輪郭またはエッジを見つける。例えば、このような状況において用いられるエッジ探知アルゴリズムまたは輪郭探知アルゴリズムは、形態学的オペレータから成る。換言すれば、二値画像1124は、1つ以上の形態学的オペレータによって処理され、その結果、エッジ画像1132が得られる。要約すると、エッジ検出アルゴリズムを用いて、輪郭検出器1130が二値画像1142からエッジ画像1132をつくり出すということができる。
デバイス1000におけるハフ変換器1030を利用することから生じている効果は、図11bおよび11cの図解図によって以下に説明される。例えば、図11bは、画像またはエッジ画像の図解図を示し、例えば木によって、道路標識の一部が部分的にふさがれたものである。図11bの図解図は、全体が1150で示される。さらに、図11cは、ハフ変換器1030によって図11bのエッジ画像1150からつくり出される情報の図解図を示す。図11cの図解図は、全体が1170で示される。
図11のエッジ画像1150は、木1164の枝1162によって部分的にふさがれた道路標識1160を有する交差点または分岐点の表現を示す。このように、道路標識1160の三角形形状は遮られる。これは、特に、道路標識1160の右下端1066において、明らかに見ることができる。
図11cの図解図1170は、ハフ変換器1030によって図11bのエッジ画像1150からつくり出される情報を示す。ハフ変換器1030は、さまざまな角度でエッジ画像1150を通る直線部分を検出して、記述することが可能である。これは、道路標識1160の右下端1166の例のように、直線部分が中断される場合も当てはまることである。ハフ変換器1030のこの能力は、例えば、少なくとも1つの所定の最小数の極値点が直線に沿って位置するときに、ハフ変換器1030が直線部分を検出するという事実に起因する。この状況において、ハフ変換器が正確にエッジ(例えば、エッジ1166)の長さを検出するかどうかは、最初は重要ではない。
しかしながら、直線部分は、概して、ハフ変換器1030によって検出されるために少なくとも所定の最小限の長さを有していなければならない点に注意される。
さらに、直線部分を検出するハフ変換器1030が、例えば、所定の直線または直線部分にある点の数を決定し、直線または直線部分にある点の決定された数に基づいて、エッジが直線または線部分に沿って存在しているのかどうかを決める点に注意される。
例えば、ハフ変換器1030は、異なる方向および/または長さの直線部分または直線のための上述の工程を実行し、従って、異なる長さおよび/または異なる方向の直線部分または直線を決定することが可能である。好ましくは、ハフ変換器1030は、例えば、確認した線部分の長さおよび/または方向および/または始点および/または終点を示すパラメータによって、それぞれの確認された直線部分を記述する。
このように、ハフ変換器1030は、例えば、連続エッジとして、図解図1150に示される道路標識1160の右下端1166を検出する。ハフ変換器1030の実施態様に応じて、この状況におけるハフ変換器1030は、エッジ1166の正確な長さを決定することができるか、またはおよその長さを示すことができる。しかしながら、いずれの場合においても、ハフ変換器1030は、エッジ1166の方向を確認して、更にエッジ1166が位置する直線を記述することが可能である。このように、ハフ変換器1030によって与えられる情報1032は、例えば、図11cの図解図1170において実線として道路標識1180を示す右下端1186を記述する。線1186の正確な始点および終点がわかるか否かは、すでに説明されたように、ハフ変換器1030の実施態様の詳細に依存する。しかしながら、図解図1070において破線で示される直線に沿ってエッジが通ることをハフ変換器が検出することが確実にされる。
要約すると、エッジ1166の部分的な閉塞がハフ変換器1030によって取り消され、道路標識1160のエッジが3つの実線1186、1190、1192によって好ましくは記述されているということができる。
図12に関して、画像を通る直線部分に関してハフ変換器1030によって与えられる情報に基づいて(すなわち、直線部分1186,1190,1192に関する情報に基づいて)、どのようにして形状が検出されるかについて、以下に説明される。
この目的を達成するために、図12は、例えば図10のデバイス1000で使用される発明の形状検出器のブロック図を示す。図12の形状検出器は、全体が1200で示される。
形状検出器1200は、例えば、画像を通る直線部分に関する情報1210を受信し、前記情報はハフ変換器1030によって与えられる。情報1210は、例えば、ハフ変換器1030により画像1010またはエッジ画像1022において検出された直線部分の始点、終点、長さおよび/または方向に関する情報を含む。
オプションとして、形状検出器1200は、画像1010またはエッジ画像1022の円のアーク部分、または楕円のアーク部分に関する情報を受信する。それぞれの情報は、1212で示される。
形状検出器1200は、情報1210、およびオプションとして情報1212を受信するための成分選択器1220を含む。成分選択器1220は、情報1210および/または情報1212によって示される直線部分から、更に、場合により、付加的な円のアークおよび楕円のアークから、複数の成分を選択する。換言すれば、好ましい実施例において、成分選択器1220は、選択された直線部分を得るために情報1210によって記載されている直線部分から所定の数の直線部分を選択する。成分選択器1220は、好ましくは、相互に隣接する線部分(そして、おそらく円のアークまたは楕円のアークも)を選択することができる。このように、成分選択器1220は、好ましくは、共に線の連続した経路(それは、連続する直線部分(そして、おそらく円のアークまたは楕円のアークも)の間の小さな中断を無視することができる)を形成する直線部分(そして、おそらく円のアークまたは楕円のアークも)を選択する。
このように、成分選択器1220は、選択された成分のセット、すなわち選択された直線部分のセット、およびおそらく円のアークまたは楕円のアークのセットを提供する。選択された成分のセットの記載は、1222で示される。相対記述発生器1230は、情報1222を受信して、情報1222に基づいて選択された成分の相対位置記述1232を生成する。相対位置記述1232は、選択された成分、または選択された成分の交点の相互の相対位置を記述する。例えば、相対位置記述1232は、選択された成分のセットからの成分の長さおよび方向の記述を含むことができる。さらに、相対位置記述1232は、選択された直線部分のセット1222の直線部分の間の角度を記述することができる。あるいは、相対位置記述は、選択された直線部分の相対的な長さを記述することができる。さらに、選択された成分が円のアークまたは楕円のアークを含む場合、相対位置記述は、例えば、円のアークまたは楕円のアークの曲率半径または角度に関する情報を含むこともできる。
さらに、形状検出器1200は、相対位置記述1232を受信するためのデータベース比較器1240を含む。さらに、データベース比較器1240は、(例えば、相対位置記述における)直線部分、円のアークおよび/または楕円のアークのセットの記述としての形状の記述を形状データベース1242から受けるために、形状データベース1242に接続される。データベース比較器1240は、相対位置記述1232によって記述される成分および形状データベース1242から読み出される比較成分のセットの間の偏差を示す比較情報1244を提供する。
さらに、形状検出器1200は、データベース比較器1240の結果1244を受信して、相対位置記述1232によって記述されるエレメントのセットおよび形状データベース1242から得られたエレメントのセットの間の適合が十分であるかどうかを判断するための適合検知器1250を含む。
さらに、好ましくは、形状検出器1200は、成分選択器1220と適合検知器1250とを連携させるためのコントローラ1260を含む。例えば、コントローラ1260は、成分選択器1220を選択された成分の異なるセットを選択するために制御する。さらに、好ましくは、コントローラ1260は、適合検知器1250に成分選択器1220によってどの成分が選択されたかについての情報を提供する。適合検知器1250は、好ましくは、コントローラ1260に、相対位置記述1232と、形状データベース1242に含まれる形状または比較形状の記述との間の適合の程度に関する情報を提供する。
さらに、適合検知器1250は、検出された形状に関する情報1262を提供する。検出された形状に関する情報1262は、例えば、検出された形状の位置および検出された形状のタイプ(例えば、三角形、長方形、正方形)を記述する。
上述の構造的記述に基づいて、形状検出器1200の動作モードは後述するが、その動作モードは、いかなるトポロジーによっても付随的に行うことができ、従って、例えば、図12によって示される形状検出器1200のトポロジーと関係なく行うことができる。従って、個々の手段または形状検出器1200のブロックの参照は、実施例と考えられている。
更なる具体例のために、図13a、13b、13c、13d、14aおよび14bも参照される。図13aは、道路標識を含む交差点の図解図を示す。図13bは3つの直線部分の第1のセットの図解図を示し、図13cは3つの直線部分の第2のセットの図解図を示し、図13dは3つの直線部分の第3のセットの図解図を示す。図13b、13cおよび13dの直線部分の3つのセットの直線部分は、図13aの図解図から付随的にとられた。
さらに、図14aは、3つの直線部分の相対位置記述の2つの可能性の概略図を示す。図14bは、正三角形の可能な相対位置記述の概略図を示す。
図13aに関して、例えば、ハフ変換器1030は複数の直線部分の表現として画像の記述を提供すると仮定される。図13aのそれぞれの記述は、全体が1300で示される。図解図1300は道路標識1310を示し、その輪郭は複数の直線部分によって規定されている。例えば、道路標識を支えるパイプは、第1の直線部分1312によって記述されている。基本的に三角形の道路標識の輪郭は、3つの直線部分1314a、1314b、1314cによって記述されている。例えば、沿道は、直線部分1316によって記載されている。直線部分1312、1314a、1314b、1314c、1316の記述は、画像を通る直線部分に関する情報1210を形成する。3つの直線部分(一般的に:直線部分の所定の数、または成分の所定の数)が図13aの画像を通る直線部分から(一般的に:直線、円のアークまたは楕円のアークのように、ハフ変換器によって画像で検出される成分から)選択されることは、例えば、成分選択器1220を用いることによるものである。好ましくは、線部分の連続経路を形成する3つの相互に隣接する直線部分(一般的に:成分)が選択される。例えば、線部分1312、1314a、1314bが選択されると、図13bにおいて表される3つの直線部分のセットが得られる。しかしながら、直線部分1314a、1314b、1316が選択されると、図13cにおいて表される3つの直線部分のセットが得られる。しかしながら、直線部分1314a、1314b、1314cが選択されると、図13dにおいて表される3つの選択された線部分のセットが得られる。
選択された直線部分(一般的に:選択された成分)のセットは、第1の選択された線部分の長さ、第1の選択された線部分と第2の選択された線部分の間の角度、第2の選択された線部分の長さ、第2の選択された線部分と第3の選択された線部分の間の角度および第3の選択された線部分の長さによって記述されることができる。対応する記述は、図14aの第1の図解図1410において模式的に示される。あるいは、長さは、互いに関して、または例えば第1の選択された線部分の長さに関して示されることができ、その結果、表現は、図14aの第2の図解図1420に示される結果となる。
例えば、データベース1242に比較記述として格納される同時に存在する三角形の対応する記述は、図14bに模式的に示される。
選択された直線部分の第1のセットに対応する選択された直線部分に関して、例えば、それらが以下の形で表されることができることが確認される。
「長さ1;右に角度30°;長さ2;左に角度120°;長さ3」
選択された線部分の第3のセットに関する選択された線部分は、例えば、以下の形の記載によって記述されることができる。
「長さ1;左に角度120°;長さ2;左に角度120°;長さ3」
選択された線部分の第3のセットの選択された線部分の正規化された記述は(長さの正規化)、以下の通りである。
「1;左に角度120°;1;左に角度120°;1」
もちろん、例えば、道路標識1310は、わずかに回転することができ、従って、例えば、歪められた方法でマッピングされることができ、その結果、相対的な長さおよび角度が変化するため、角度および相対的な長さはわずかに変化することができる。
例えば、図14bに示す二等辺三角形の記述が形状データベース1242に比較パターンとして格納される場合、選択された成分の第1のセットの3つの直線部分の記述(図13b参照)との間を比較すると、例えば、偏差は大きく、適合は小さい。同様に、直線部分の第2のセットの直線部分の記述(図13c参照)と正三角形の記述との間を比較すると、適合は小さく、偏差は大きい。しかしながら、直線部分の第3の3つの直線部分の記述(図13d参照)と正三角形の記述との間を比較すると、適合は大きく、偏差は小さい。このように、例えば、最初に3つの直線部分の第1のセット(図13b参照)が選択され、次に、形状データベース1242からの正三角形の記述との比較で偏差が容認できないほど大きい(例えば、所定のあるいは動的に調整された最大許容偏差より大きい)ことが明らかになった場合、別の成分のセットまたは直線部分のセット、例えば直線部分の第2のセット(図13c参照)が選択される。直線部分の第2のセットと形状データベース1242に格納される比較形状との間の偏差がまだ許容できないほど大きい場合、成分の第3のセット、例えば(図13d参照)が選択される。従って、選択された成分のセットのうちの1つについて、選択された成分のセットと形状データベース1242に格納された形状との間の偏差が十分に小さい(すなわち、相対位置の違いが十分に小量である)ことがわかった場合、例えば、選択された成分が検出された形状としてマークされ、関連する情報は(例えば、検出された形状に関する情報1262として)提供される。
選択された成分のセットと、形状データベース1242において規定される成分のセットとの偏差が十分に少量であるとすぐに、例えば、選択された成分のセットの選択は終了することができる。しかしながら、終了基準が満たされるまで、検出された形状の識別の後に、さらに別の検出された形状が調査されてもよい。このように、形状検出器は、例えば、正確に1つの検出された形状に関する情報またはいくつかの検出された形状に関する情報を提供することができる。
従って、情報1262は、検出された形状を要求される記述のいかなる形にも記述する。例えば、三角形が確認される場合、情報1262は画像1010、またはエッジ画像1022の三角形の前の位置の座標を示すことができる。しかしながら、それぞれの記述により検出された形状の輪郭を決定することが可能である限り、記述の他の形を選択することも可能である。
図15によって、画像1010の画像部分が形状検出器1050によって検出される形状を使用して選択され、さらにマッピングされるという点で、パターン識別器1050におけるパターン識別がどのようにおこなわれるかについての説明が続けられる。
従って、図15は、道路標識を確認するための手順の概略図を示す。図15の概略図は、全体が1500で示される。画像(例えば画像1010)は、例えば観察者との関連で回転し、したがって歪められた道路標識1510を含む。理想的におよそ二等辺三角形の形状を有する道路標識が歪められた状態で示されるという点において、歪曲が示される。説明の目的で、ここでの歪曲は、誇張された方法で表される。
本発明によれば、例えばエッジ検出器1020におけるエッジ検出は、道路標識の画像に、任意に適用される。次に、画像の直線部分を検出するために、ハフ変換器1330においてハフ変換が実行される。画像を通る直線部分に関する情報1032は、形状検出を実行するために、形状検出器1040に提供される。ここに示した例では、形状検出器は、画像において検出される三角形に関する情報を提供する。画像において検出される三角形は、実際、パターン・データベースに格納される理想的形状(例えば、正三角形)から逸脱するが、偏差は少なく、形状検出器によって使用される許容範囲のために、道路標識1510の歪曲にもかかわらず形状検出器は三角形を検出する。このように、形状検出器1040は、例えば端点の座標を示すことによって、画像において検出された形状に関する情報1042として、画像における三角形の位置を示す情報を提供する。
次に、パターン識別器1050は画像1010の画像部分を選択するが、選択された画像部分は画像において検出された形状に関する情報1042によって定義されている。例えば、パターン識別器1050は、形状検出器1040によって確認される形状の外側に位置する残りの画像をマスキングすることができる。理想的には、パターン識別器1050は、形状が形状検出器1040によって確認される形状に対応する画像部分を得る。ここに示した例では、パターン識別器1050は、三角形画像部分1530を得る。
この点で、三角形画像部分が(例えば、アフィン・マッピングによって)画像データベースに格納される画像に関して歪められる点に留意する必要がある。例えば、画像データベースに格納される画像が、1540で示される。画像データベースに格納された画像1540と画像部分1530との形状の比較で、形状が異なることが分かり、その結果、直接比較は可能でないかまたは信頼できない結果につながる。しかしながら、それを用いて画像データベースに格納された参照画像または比較画像1540と画像部分1530とが同一の形状を有することになるかもしれないマッピング仕様は、画像データベースに格納された比較画像1540および画像部分1530の形状から決定されることができる。例えば、画像部分1530のアフィン歪曲がある場合、それは逆のアフィン・マッピングによって元通りにすることができる。例えば、パターン識別器1050は、画像部分1530をアフィン様式(すなわち、それを回して、それを回転させて、または伸ばしておよび/または歪ませて)でマッピングすることができ、その結果、画像部分1530はおよそ少なくとも参照画像または比較画像1540の形状を有するようにつくられる。アフィン様式にしたがって形成されるかまたは歪められる画像部分1530のバージョンは、図15の1550で示される。このように、アフィン様式でマッピングされた画像部分1550および参照画像1540は同じ形状または輪郭を有し、その結果、特に信頼性が高いパターン検出またはパターン比較が実行されることができる。従って、確認された道路標識に関する情報1052は、パターン検出に基づいて得ることができる。
要約すると、画像部分の形状および比較画像または参照画像1574の形状を互いに適応させることができるように、パターン識別器1050は、例えば、画像において検出される形状に関する情報1050に基づいて、画像部分の選択1570、画像部分のマッピング1572を実行するということができ、確認された道路標識に関する情報1052を得るために、マッピングされた画像部分1550は比較画像または参照画像1540と比較される。
しかしながら、互いにマッピングされた選択された画像部分1530の形状および比較画像または参照画像1540の形状に近づくかまたは適応させるために、選択された画像部分1530のマッピング1572に代わるものとして、パターン識別器は、比較画像または参照画像1540をマッピングすることもできる。
円または楕円の極値点の検出が上述のステップに加えて起こるという点で、どのようにして図10〜15に関して記載されるコンセプトが更に改善されることができるかに関する説明が、以下に示される。
この目的で、図16は、本発明の実施例にかかる画像の道路標識を確認するための発明のデバイスのブロック図を示す。
図16のデバイスは、全体が1600で示される。
デバイス1600は、画像1610を受信する。さらに、オプションとして、デバイス1600は、その機能に関して、デバイス1000のエッジ検出器1020と同等であるエッジ検出器1620を含む。さらに、デバイス1600は、画像1610または任意のエッジ検出器1620によって与えられるエッジ画像1622を受信するためのアップグレードされたハフ変換器1630を含む。アップグレードされたハフ変換器は、画像1610の直線部分、またはエッジ画像1622の直線部分を検出し、それはハフ変換器1030の機能と同等である。さらに、アップグレードされたハフ変換器1630は、画像1610の円または楕円の極値点を検出する能力があり、画像の円のアークまたは楕円のアークの極値点に関する情報を提供する。それぞれの情報は、1634で示される。もちろん、アップグレードされたハフ変換器1630は、画像1610またはエッジ画像1622を通る直線部分に関する情報1632を提供し、前記情報1632がハフ変換器1030の情報1032と基本的に同等である。
さらに、デバイス1600は、ハフ変換器1630から画像を通る線部分に関する情報1632を受信する形状検出器1640を含む。形状検出器1640は、デバイス1000の形状検出器1040と同一であってもよい。あるいは、形状検出器1620は、画像を通る直線部分に関する情報1632に加えて、画像にあるいかなる円のアークまたは楕円のアークに関する情報1634を受信することができる。
従って、形状が情報1632(および、おそらく情報1634)に基づいて画像において検出されるとすると、形状検出器1640は、いずれにせよ、画像において検出される形状に関する情報1642をパターン識別器1650に提供する。パターン識別器1650の基本的な機能はパターン識別器1050の機能を含むが、後述するように、それと比較して、任意にアップグレードされる。
さらに、デバイス1600は、楕円検出器1660を含む。楕円検出器1660は、好ましくは極値点の座標の記述の形で、さらに、関連する曲率半径および湾曲方向の記述の形で、画像の円のアークまたは楕円のアークに関する情報1634を受信する。
楕円検出器1660の機能は、以下で更に詳細に述べる。楕円検出器1660は、通常、画像において検出される楕円形状に関する情報をパターン識別器1650に提供する。
さらに、パターン識別器1650は、画像において検出された(一般的な)形状に関する情報1642に基づいて、または、楕円検出器1660によって与えられる画像において検出された楕円に関する情報に基づいて、確認された道路標識に関する情報1652を提供する。
画像の円のアークまたは楕円のアークに関する情報1634が形状検出器1640により用いられることになっている場合、オプションとして使用されるアップグレードされた形状検出器1640に関して、アップグレードされた形状検出器1640が、選択された成分のセット1222として、一方では、両方の直線部分を含む成分のセットを選択し、他方では、円のアークまたは楕円のアークを選択するものといわれている。
例えば、丸コーナーを有するおよそ三角形の道路標識を確認するための形状検出器1640は、好ましくは、3つの直線と、ハフ変換器によって与えられた情報から3つの円のアークまたは楕円のアークとを選択し、その結果、直線部分および円のアークが交互に並んで、閉線路を形成する。例えば、望ましい丸い端を有する二等辺の三角形道路標識の説明は、以下のようにすることができる。
「直線部分、長さ1;円のアーク120°、左にカーブ、曲率半径0.05;「直線部分、長さ1;円のアーク120°、左にカーブ、曲率半径0.05;「直線部分、長さ1;円のアーク120°、左にカーブ、曲率半径0.05」
したがって、この場合、形状データベース1242は、好ましくは、直線部分と円のアークまたは楕円のアークとの結合による比較形状を記述する。次に、所定のシーケンスにおいて言及される成分(直線部分、円のアーク、楕円のアーク)の特性を結合するベクトルが作成されるという点で、比較は、好ましくはなされることができる。
楕円検出器1660のセットアップは、例証として後述する。この目的で、図17は、本発明の実施例による画像の道路標識を確認するための発明のデバイスの利用のための発明の楕円検出器のブロック図を示す。
図17の楕円検出器は、全体が1700で示される。楕円検出器1700は、画像の円のアークまたは楕円のアークの極値点に関する情報1710を受信する。情報1710は、例えば、ハフ変換器1630によって与えられる情報1634と同等であってもよい。
さらに、楕円検出器1700は、画像の円のアークまたは楕円のアークの極値点に関する情報を受信する極値点選択器1720を含む。極値点選択器1720は、全体として、ハフ変換器1630によって与えられる極値点から選択された極値点のセット1722を選択し、選択された極値点のセット1722(または、選択された極値点のセットを記述する情報)を楕円適合器1730に提供する。
楕円適合器1730は、(選択された極値点のセット1722の)選択された極値点に適合する楕円に関する情報を提供する。それぞれの情報は、1732で示される。偏差決定器1740は、情報1732および別の情報1722を受信する。偏差決定器1740は、選択された極値点のセットの中の選択された極値点と、選択された極値点に適合する楕円との間の偏差を決定し、したがって、選択された極値点のセットの中の極値点から適合した極値点の偏差に関する情報1742を提供する。
さらに、楕円検出器1700は、極値点からの適合した楕円の偏差に関する情報に基づいて極値点と楕円との間の関連付けを実行する極値点楕円関連付け器1750を含む。換言すれば、情報1710がいくつかの楕円に属する極値点の記述を含む場合、極値点楕円関連付け器1750は、どの極値点が同じ楕円に属するかに関する情報1752を提供する。このように、極値点楕円関連付け器1750は、好ましくは、単一の楕円に属する4つの極値点を記述するか、または示す情報を提供する。
さらに、楕円検出器1700は、情報1752に基づいて、画像の円または楕円に関する情報1762を提供し、情報1762は、画像に存在する少なくとも1つの位置パラメータ、好ましくは、楕円の完全な位置の記述を含む。このように、画像の円のアークまたは楕円のアークの極値点に関する情報に基づいて、楕円検出器は、全体的に、画像の円のための、または画像の楕円のための利用できる位置情報1762をつくる。
図18に関して、極値点を楕円と関連付けることに関する方法の詳細に関しては後述する。この状況において、図18は、楕円に属している極値点を確認する方法の図解図を示す。図18の図解図は、全体が1800で示される。
第1の図解図1810は、全体で2つの楕円に属する8つの極値点1812a〜1812hを示す。図解図1820は、4つの楕円点1812a、1812b、1812c、1812dの第1の選択、または第1のセットを示す。別の図解図1830は、4つの楕円点1812a、1812f、1812c、1812dの選択を示す。極値点のセットの中の点の3つが極値点であることが知られている。このように、楕円は、3つの極値点(例えば、極値点1812a、1812c、1812d)に適合させることができる。この状況において、極値点は、明らかに、第1の方向、第1の方向と逆の方向において最も遠くに位置する、または、第2の方向において最も遠くに位置するか、または第2の方向と逆の方向において最も遠くに位置する楕円点であることに留意すべきである。3つの極値点1812a、1812c、1812dを通る楕円は、1840で示される。点1812bが適合する楕円1840に非常に近いことは明らかである。適合する楕円1840および極値点1812dの間の偏差d(距離)は、偶然に、基本的に、適合する楕円1840を計算する際の数値計算の誤差から、または極値点の座標を決定する際の許容誤差から生じる。対照的に、極値点1812fおよび適合する楕円1840の間の距離Dは、距離dよりかなり大きい。概して、距離Dは所定の最大許容距離より大きく、その一方で、距離dは所定の許容距離より小さい。
この状況において、好ましい実施例で、適合する楕円の間の距離が3つの極値点と第4の極値点とで測定され、所定の制限値と比較されると述べられている。距離が所定の制限値より小さい場合、第4の楕円点が楕円に属するとそこから判断される。さもなければ、第4の楕円点が3つの別の楕円点を通る楕円に属しないと仮定される。
このように、示される実施例において、極値点1812a、1812b、1812c、1812dは同じ楕円に属するが、極値点1812a、1812f、1812c、1812dは、同じ楕円に属しないことをはっきりさせることができる。
さらに、パターン識別器1650が、一般の形状が情報1642によって記述されている画像において検出されたか否か、または、楕円形状が情報1662によって記述されている画像において検出されたか否かに基づいて、画像1610の部分を選択することができる点に注意される。換言すれば、パターン識別器1650は、それぞれのアルゴリズムを画像部分を選択するために、そして画像において検出された形状(一般の形状または楕円形状)に基づいて画像部分をマッピングするために(例えば、アフィン歪曲のために)、適応させられる。
図19は、本発明の実施例による画像の道路標識を確認する発明の方法のフロー図を示す。図19の方法は、全体が1900で示される。方法1900は、カメラから画像を受けるステップ1900を含む。しかしながら、好ましくは、カメラから受けるものは、単独画像ではなく、画像のストリーム(また、ビデオストリームとも呼ばれる)である。
方法1900は、画像に適用される閾値形成を有し、望まれていない領域を切り取ることを有する第2ステップ1920を含む。例えば、空は画像から取り除かれ、その結果、全体で処理される情報量は減らされる。更に上ですでに説明された方法で、閾値形成は実行されることもできる。第3ステップにおいて、方法1900は、輪郭抽出を含む。輪郭抽出1930は、カメラ画像1912に基づいてステップ1920で測定される閾値処理画像のエッジまたは輪郭の生成またはマーキングを含む。このように、エッジ画像または輪郭画像1932は、輪郭抽出のステップ1930において形成される。次のステップ1940において、道路標識は、ハフ変換手段によってマスキングされる。換言すれば、ステップ1940は、例えば三角形の形状、長方形の形状、正方形の形状、丸い形状および/または楕円形状を検出するステップを含み、それぞれの形状を示す情報を提供するステップを備えている。その後、記述された形状が検出された領域はマスキングされ、その結果、確認された形状の周囲の画像内容がマスキングされ、隠されるのに対して、例えば1つの確認された形状の中の画像内容のみが存在する画像が形成される。好ましい実施例において、例えば大きさが減らされた画像を得るために、マスキングされる領域は、例えば、検出された形状の範囲内の画像領域を含み、オリジナルのカメラ画像1912におけるより検出された形状の周囲の小さい一部だけが含まれる画像から切り取られる。このように、マスキングされた領域1942は、マスキングのステップ1940から生じる。
それから、更なるステップ1950は、マスキングされた領域1942の中で道路標識を得るために、マスキングされた領域をデータベースまたは道路標識データベースの入力と比較するステップを含む。データベースの入力との比較1950は、マスキングされた領域1952とデータベースに格納されたさまざまな道路標識との間の類似点を示す情報1952という結果になる。例えば、(マスキングされた領域の画像内容に対するそれらの類似性の順で)さまざまな道路標識の配置および関連する類似性に関する情報1952は、1970で示される。データベースとの比較1950は、このように、結果1952として、マスキングされた領域1942の画像内容および画像データベースの道路標識(または道路標識の画像)の間の類似性の確率を提供する。その結果、最もあり得る道路標識に関する情報が形成される。それぞれの情報は、1960で示される。
図19の方法1900の詳細は、以下で取扱われる。この目的で、図20aは、道路標識を含むカメラ画像の図解図を示す。図20aにおいて表されるカメラ画像は、全体が2000で示され、例えば、方法1900の画像1912と同等であることができる。
図20bは、図19の方法1900を適用するときに発生するようなエッジ画像または輪郭画像の図解図を示す。図20のエッジ画像または輪郭画像は、全体が2050で示され、基本的に輪郭画像1932に対応する。
エッジ画像2050に関して、本発明が安定したエッジ画像1932を記録されたビデオストリーム1912からつくり出すことが可能な点に留意する必要がある。さらに、道路上に描かれるマーク(例えば、道路上へ描かれる速度制限または警告標識)および道路規制も、エッジ画像を作成する際に考慮される。エッジ画像を作成する際の特定の課題は、エッジ画像が光条件とは無関係であるということである。このような課題は、例えば、自動的に閾値形成1920で閾値を設定することによって解決されることができる。さらに、速いカメラ動作も、考慮されなければならない。
図21aは、そこにおいてマークされる円形のまたは楕円形状を有するエッジ画像の図解図を示す。図21aのマークされたエッジ画像は、全体が2100で示される。円形または楕円形状は、例えば、ハフ変換を用いてマークされることができる。特に、ハフ変換を用いて、曲線は、エッジ画像において見出すことができる。さらに、円形の対象を有する形状検出は可能である。
図21bは、(例えば、カメラ画像1912の)マークされる円形または楕円形状を有する画像の図解図を示す。図21のマークされたカメラ画像は、全体が2140で示される。マークされたカメラ画像2140に関して、検出された形状が興味を引くか関連する画像のそれらの領域を表す点に注意される。
図21cは、マスキングされたカメラ画像の図解図を示す。図21cのマスキングされたカメラ画像は、全体が2180で示される。マスキングされたカメラ画像において、検出された円形または楕円形状の外側の領域は、抑制されるかまたは、例えば、黒または他の所定の明度に設定される。このように、円形または楕円形の検出領域または検出範囲は、例えば、マスキングされる。検出範囲は、このようにマスキングすることができ、さらに分離することができる。このように、図解図2180が、例えば、マスキング1940から生じているマスキングされた画像1942を記述するものということができる。
続いて、どのようにして道路標識データベースの比較が実行されることができるかについて説明する。この目的で、図22aは、例えば、画像が道路標識データベースに格納されることができるさまざまな道路標識の図解図を示す。道路標識データベースは、さまざまな形状を有する標識を含むことができる。道路標識の典型的形状は、三角形、長方形、正方形、円形、および八角形(例えば、停止標識)である。
特徴がマスキングされた範囲から抽出されるという点で、そして抽出された特徴がデータベースに格納される特徴と比較されるという点で、例えば、方法1900のステップ1950において実行される道路標識データベースとの比較は実行されることができる。
好ましい実施例において、道路標識データベースは、例えば、格納される道路標識のカラー・ヒストグラムを含む。この状況において、カラー・ヒストグラムは、個々の色が道路標識において取り上げられる相互の関係を示す。この状況において、例えば、カラー分布の方向依存性は考慮されることができ、例えば、カラー分布は位置に依存して重み付けされてもよい。
カラー・ヒストグラムの例は図22bに示され、図22bのファジー・カラー・ヒストグラムが、全体として2250で示される。横軸2260は、例えば、色を説明している色基準インデックスを示す。例えば、縦軸2262は、標準化ピクセル数を示す。このように、ファジー・カラー・ヒストグラム2250は、全体の画像の相対的比率が特定色のカラー・ピクセルによって取り上げられることを示す。
例えば、格納されたカラー・ヒストグラム2250は、データベースの入力または特徴との複数の比較を実行することを可能にし、データベースは格納された道路標識のカラー・ヒストグラムを含む。
特徴抽出および特徴比較のさまざまな方法が、一致を決定するために使用されることができる点に注意される。
−桁検出のためのハフ変換;
−カラー・ヒストグラム:色定数の指標付け(参照〔1〕、〔2〕)またはファジー・カラー・ヒストグラム(参照〔3〕);
−空間カラー・ヒストグラム:空間色彩のヒストグラム(参照〔1〕)、空間的なファジー・カラー・ヒストグラム(参照〔3〕)。
道路標識の典型的な画像は、以下で簡単に説明される。例えば、図23aは、影になる道路標識の図解図を表す。図23aの図解図は、閾値形成を考慮する。しかしながら、ハフ変換によって、道路標識の形状または輪郭が影になっているにもかかわらず検出されることができて、マークされることができることは明らかである。道路標識の検出は、円形のまたは楕円形マーク(白色線)から明らかである。
図23bは、輪郭画像と同じ道路標識の図解図を示す。輪郭画像は、再び、そこにおいて、道路標識のマークされる円形または楕円形状(白色線参照)を有する。
図24aは、半分影になる道路標識の図解図を示す。図24aの図解図は、全体が2400で示される。
図24bは、可動カメラによって撮られたカメラ画像に基づく輪郭画像またはエッジ画像の図解図を示す。図24bの図解図は、全体が2450で示される。
道路標識の丸い形状が、いかなる場合においても、すなわち道路標識が部分的に影になっている場合、および、道路標識の画像が可動カメラで撮られている場合のいずれにおいても、ハフ変換によって検出されることができることは、図解図2400および2450から明らかである。
図25aは、少なくともおよそ楕円の一部がハフ変換によってマークされる、直角であるか正方形の道路標識の図解図を示す。なお、図25aの図解図は、全体が2500で示される。
図25bは、長方形または正方形の道路標識の輪郭またはエッジの図解図を示す。図25bの図解図は、全体が2550で示される。
図解図2500、2550は、明らかに、長方形または正方形の道路標識に関して得られ、例えば、発明の形状検出器によって解決される課題を示す。
図26は、本発明の実施例による道路標識を検出する発明の方法のフロー図を示す。
図26の方法は、全体が2600で示される。方法2600は、画像またはエッジ画像2612をハフ変換するステップを有する第1ステップ2610を含む。抽出された画像またはエッジ画像をハフ変換するステップ2610は、画像を通る直線部分に関する情報2614を提供する。さらに、方法2600は、確認された直線部分に基づいて、または情報2614に基づいて、抽出された画像またはエッジ画像の所定の形状を検出するステップを含む。所定の形状を検出するステップ2620は、検出された形状に関する情報2622を提供する。さらに、方法2600は、第3のステップ2630において、検出された所定の形状に対応する画像部分の道路標識を確認するステップを含む。確認は、このように、検出された道路標識に関する情報2632という結果になる。方法2600がこの開示の状況において記載されている発明のデバイスによって実行されるこれらのステップの全てによって補完されることができる点に留意すべきである。同様に、方法2600は、方法1900に関して説明されたステップによって補完されることができる。
画像の楕円形を検出するために使用できるアルゴリズムと同様に、パラレル・ハフ変換の方法が、図1〜9を参照して更に詳細に下で説明される。この状況において、FPGAの中で行うことができるパラレル・ハフ変換のハードウェア実行も、例えば、記載されている。
図1は、本発明の第1実施例にかかる図解図の楕円の形状および/または位置に関する情報を決定するための発明のデバイスのブロック図を示す。図1のブロック図は、全体が100で示される。基本的に、発明のデバイス100は、画像データ112を受信するための座標判定手段110を含む。座標決定手段110は、画像データ112に含まれる楕円の特定の楕円点の座標114を抽出して、次に楕円計算手段120に前記座標114を利用可能にする。楕円計算手段120は、座標決定手段110によって与えられる座標114から楕円パラメータ122を計算して、更なる処理のために楕円パラメータ122を出力する。
上記の構造的な記述に基づいて、発明のデバイスの動作モードが、以下において更に詳細に説明される。この状況において、グラフィック画像を示す画像データ112が楕円を含むと仮定される。さらに、第1の方向130および第2の方向132が、画像データ112において定められると仮定される。画像データ112に含まれる楕円134は、関連した座標(x1´、y1´)を有する第1の楕円点136を含み、第1の楕円点136が第1の方向の最も遠くに位置するその楕円点を表す。ここの位置は、例えば、優先方向として、または座標軸として第1の方向130および第2の方向132を含む直角または斜交座標系によって定義される。さらに、楕円134は、第1の方向130の反対の方向において最も遠くに位置する楕円の位置を表す関連した座標(x3´、y3´)を有する第2の楕円点138を含む。さらに、楕円は、第2の方向132の最も遠くに位置する楕円の位置を表す座標(x4´、y4´)を有する第3の楕円点140を含む。最後に、楕円134は、第2の方向132の反対の方向において最も遠くに位置する楕円の位置を表す座標(x2´、y2´)を有する第4の楕円点142を含む。
さらに、それぞれ曲がった線分146、148、150、152によって、前に記載された4つの特定の楕円点136、138、140、142において、楕円134が近似されることができる点に注意すべきである。曲がった線分146、148、150、152は、いずれの場合においても複数のパラメータによって記載されることができる。例えば、第1の線分146は、例えばx座標およびy座標のような2つのスカラー位置パラメータ、および例えば曲率半径のような曲率パラメータによって記述されることができる。さらに、例えば、第1の線分146は、第1の楕円点136で楕円を接触させることができる。しかしながら、第1の線分136が第1の楕円点136で楕円134と交差することも可能であり、その場合、楕円134および第1の曲がった線分146が第1の楕円点136で好ましくは共通の接線を含む。共通の接線は、その位置が第1の方向において一定の座標を含むというような方法でつくられる線によって特定されることができる。これは、第1の方向の最も遠くに位置する楕円のその位置としての第1の楕円点の定義に対応する。さらに、第1の線分146が好ましくはパラメータ化された曲がった線分の群に属し、パラメータは、例えば、群の個々の線分の位置および/または曲率を記述している点に注意すべきである。
第1の線分146のパラメータ、すなわち第1の線分146の位置および/または曲率は、従って、楕円134の位置および/または形状に密接に関連がある。
要約すると、それが第1の楕円点の周囲の範囲内で距離測度に関して楕円と十分に類似している場合、線分は、第1の楕円点136で楕円134に近い第1の線分146と考えられる点に注意すべきである。さらに、更なる基準が満たされる、すなわちそれが第1の楕円点136で楕円134の線と共通の接線を有する場合だけ、線分が、例えば、第1の線分146と確認されることが必要であるかもしれない。
第2の曲がった線分148、第3の曲がった線分150および第4の曲がった線分142も同様に定められ、第2の曲がった線分148は第2の楕円点138で楕円に近い曲がった線分であり、第3の曲がった線分140は第3の楕円点150で楕円に近い曲がった線分であり、第4の曲がった線分第4の楕円点142で楕円134に近い曲がった線分である。
さらに、座標決定手段110は、第1の曲がった線分146の少なくとも1つの決定されたパラメータに基づいて、第1の楕円点136の座標(x1´、y1´)を決定するように、第1の曲がった線分146の少なくとも1つのパラメータを決定する。さらに、座標決定手段110は、第2の曲がった線分148の少なくとも1つのパラメータを決定して、第2の曲がった線分148の少なくとも1つのパラメータに基づいて、第2の楕円点138の座標(x3´、y3´)を決定する。
例えば、第1の曲がった線分146が曲がった線分のパラメータ化された群に属する場合、第1の曲がった線分のパラメータを決定することは、曲がった線分の群から、十分におよび/またはできるだけ第1の楕円点136で楕円134に近い曲がった線分を確認することに対応する。例えば、近似の品質は数学的距離尺度で決定されることができ、閾値は距離尺度に対して設定されることができ、閾値を上回るか下回った場合、曲がった線分のパラメータ化された群の中の曲がった線分が十分によく第1の楕円点136で楕円134に近いとみなされる。
同様にして、座標決定手段110は、第2の楕円点138の周囲の楕円134に近い第2の曲がった線分148のパラメータを決定することができる。例えば第2の曲がった線分148のパラメータを決定するのに用いられる曲がった線分のパラメータ化された群は、第1の曲がった線分146のパラメータを決定するために用いられる線分のパラメータ化された群と同一でもよく、または、例えば湾曲方向に関して、それはそれとは異なっていてもよい。
いったん、座標決定手段110が第1の曲がった線分146の少なくとも1つのパラメータ、および第2の曲がった線分148の少なくとも1つのパラメータが線分148を決定すると、座標決定手段110はこれから第1の楕円点136の座標(x1´、y1´)とともに、第2の楕円点138の座標(x3´、y3´)を導き出すことができる。座標判定手段110は、第1の楕円点136の座標(x1´、y1´)とともに第2の楕円点138の座標(x3´、y3´)を楕円計算手段120に伝達する。
第1の楕円点136の座標(x1´、y1´)および第2の楕円点138の座標(x3´、y3´)に基づいて、楕円計算手段120は、少なくとも、楕円134の中心の座標(xm´、ym´)を計算することができる。このように、楕円134の中心点160は公知である。
さらに、座標決定手段110は、好ましくは、第3の楕円点140から楕円を近づける第3の曲がった線分150の少なくとも1つのパラメータを決定する。この状況において、再び、曲がった線分の群からどの曲がった線分が第3の楕円点140における楕円134に最も近いのかを決定することができる。関連する群パラメータは、例えば、確認された第3の線分150のパラメータを示し、第3の楕円点140の少なくとも1つの座標x4´またはy4´を決定するために、座標決定手段により用いられてもよい。座標決定手段110は、楕円計算手段120にこの座標x4´またはy4´を送ることができ、それは楕円計算手段120に、第1の楕円点136および第2の楕円点138の座標(x1´、y1´)および(x3´、y3´)と関連して、全ての楕円のパラメータ、すなわち、楕円中心点160の両方の座標(xm´、ym´)、楕円134の2つの半軸の長さa´,b´、回転角α´を決定させることができ、および/または解析公式を用いてそれらを算出させることができる。
第1の線分146のパラメータを決定するために、第1の線分146の形状についての先験的な知識が使われることができる点にこの点でもう一度明示的に注意される。実は、第1の線分146が第1の楕円点136で楕円134に近くなければならない、すなわち第1の線分146が、第1の楕円点136で楕円134によって示される同じ曲率特性または少なくとも同じ湾曲方向を有しなければならないことは、すでに知られていた。さらに、好ましくは、それが第1の楕円点136における楕円の接線であるという点で、または第1の楕円点136で少なくとも接線を楕円134と共有するという点で、第1の線分146は定められる。このように、通常、座標決定手段は、好ましくは、グラフィック画像において、第1の曲がった線分として上述の条件(曲率特性、接線方向)を満たす曲線の経路を確認する。パラメータ化された曲線群の使用は、例えば、ここで一例として見られるだけであるが、むしろ、使用は所定の湾曲方向および所定の接線方向を有する曲がった線分のパラメータを確認して、少なくとも1つの位置パラメータによってそれらを記述することが可能であるいかなるパターン検出アルゴリズムでできていてもよい。
類似した定義は、さらに任意に使われる第2の曲がった線分148、第3の曲がった線分150、および第4の曲がった線分152にも適用される。第1の曲がった線分を確認することに関しては対応するアルゴリズムを用いることができ、前記アルゴリズムが湾曲方向および接線方向に関してのみ適応することを必要とする。
楕円の形状および/または位置に関する情報を決定するための発明のデバイスの本質的効果は、確認される楕円の「極値点」、すなわち、いくつかの所定の方向の最も遠くに位置する楕円の点が決定される。第1の楕円点136、第2の楕円点138、第3の楕円点140および第4の楕円点143は、実は、上述の定義に従う極値点と考えることができる。この状況において、極値点は、それぞれの極値点で楕円に近い曲がった線分を確認することによって決定される。ここで、使用は、それぞれの極値点の楕円上の接線の方向についての先験的な知識と同様にそれぞれの極値点の楕円の曲率についての先験的な知識でできていてもよい。このように、極値点を決定するためにグラフィック画像の、または、画像データ112のいかなる画像点も使用しないことが好ましいが、むしろ、それぞれの回転中心で楕円に近くなることができる曲がった線(または曲がった線分)を示すような画像点だけを使用することが好ましい。
この状況において、極値点の1つで楕円134に近い適切な曲がった線分は、先験的な知識、すなわち楕円134に接触する(または、少なくとも楕円と接線を共有する)点における曲がった線分の曲率および曲がった線分の接線方向の知識が、非常に効率的な方法で見つかることができる。いったん、楕円の逆の極値点、すなわち、例えば第1の楕円点136および第2の楕円点138がわかると、楕円計算手段120は、第2ステップにおいて、少なくともコンピュータ的に非常に効率的な方法で楕円の中心点160を確定することができる。
さらに、第1の楕円点136の2つの座標(x1´、y1´)、第2の楕円点138の2つの座標(x3´、y3´)および第3の楕円点140のたった1つの座標(x4´、y4´)を決定することは、全ての楕円パラメータ(xm´、ym´)、a´、b´、α´を計算するのに充分である。
続く具体例の理解を容易にするために、楕円パラメータのために使用する定義は、以下で示される。従って、図2aは、楕円の図解図、および第1の楕円点の、第2の楕円点の、第3の楕円点の、第4の楕円点の、および楕円の中心点の座標の図解図を示す。図2aの図解図は、全体が200で示される。図解図200はx軸210およびy軸212を有する直交座標系を示し、x軸210およびy軸212は互いに直交する。x軸210およびy軸212によって形成される座標系は、そこに配置される楕円220を有する。楕円220は、関連する座標(x3、y3)を有する第1の楕円点226を含む。第1の楕円点226は、x軸210によって定義されるx方向の最も遠くに位置する楕円220の点を示す。関連する座標(x1、y1)を有する第2の楕円点228は、逆のx方向の最も遠くに位置する楕円220の点を形成する。さらに、関連する座標(x2、y2)を有する第3の楕円点230は、y軸212によって定義されるy方向の最も遠くに位置する楕円220の点を示し、関連する座標(x0、y0)を有する第4の楕円点232は負のy方向の最も遠くに位置する楕円220の点を形成する。さらに、楕円の中心点240は、中心の座標(xm、ym)を含む。さらに、図解図200は、楕円の第1の半軸242を示し、示されている場合、楕円の大きい半軸を示し、その長さはパラメータaで示される。楕円220の第2の半軸244は、示される場合には、楕円220の小さい半軸を形成する。楕円の第2の半軸244の長さは、パラメータbによって示される。
さらに、図2bは楕円の図解図を示し、特性楕円点の変換された座標とともに、原点に移されている。図2bの図解図は、全体が250で示される。図解図250は、原点264において直交するx軸260およびy軸262を表す。さらに、図解図250は原点に移された楕円270を示し、その中心点272が原点264と一致する。示されているのは、関連する座標(xx、yx)を有する変換された第1の楕円点276である。変換された第1の楕円点276は、x軸260によって定義されるx方向の最も遠くに位置する楕円270の点を形成する。なお、変換された第1の楕円点276が、シフトによって第1の楕円点226から生じる点に注意されるべきである。そこにおいて:
xx=x3−xm; yx=y3−ym
さらに、図解図250は、関連する座標(xy、yy)を有する変換された第3の楕円点280を含む。変換された第3の楕円点280は、y軸262によって定義されるy方向の最も遠くに位置する楕円270の点を形成する。さらに、変換された第3の楕円点280は、シフトによって第3の楕円点230から生じる。そこにおいて:
xy=x2−xm; yy=y2−ym
さらに、図解図250は、示された実施例においては、その長さがaで示される大きい半軸を表している楕円270の第1の半軸292、および示された実施例においては、その長さがbで示される小さい半軸を表している楕円270の第2の半軸294を示す。さらに、示されているのは、回転角αである。このように、ここの回転角αは、x軸260および楕円270の第2の半軸294間の鋭角として示される。
このように、図解図250は、関連する楕円パラメータa,b,αと同様に、原点にシフトされた(すなわち、変換された)楕円270の変換された極値点276,280を示す。
図3は、楕円の典型的なラスタ画像の図解図を示す。図3の図解図は、全体が300で示される。この状況において、示されることは、複数のラスタ位置312を有するラスタ画像310である。ラスタポイント312について示されているように、ラスタポイントは不活性であるか白であってもよい。さらに、例えば、ハッチングによってラスタポイント314について示されているように、ラスタポイントは活性であるか黒であってもよい。ラスタ画像310は、複数のラスタ行および複数のラスタ列を含む点に注意される。この状況において、例えば、領域320で例示されているように、ラスタ行は複数のラスタ位置を集約し、それは太い縁取りでラスタ行を示している。ラスタ列も、いくつかのラスタポイントの組合せを定める。ラスタ列の1つの実施例は太い縁取り領域322によって示され、それはラスタ列を表す。ラスタ行およびラスタ列は、好ましくは、互いに直交している。さらに、もちろん、ラスタ行およびラスタ列が重複することができる点に注意される。例えば、ラスタ行320およびラスタ列322は、324で示される共通の画像点を有する。画像または画像部分が、複数のラスタ行によって、および複数のラスタ列によって完全に記述されることができる点にも注意される。その理由は、次のことにある。明らかに、各ラスタ領域はラスタ行によって、およびラスタ列によって記述されることができるからである。定義上、ラスタ画像310は、第1のラスタ行320、第2のラスタ行330、好ましくは連続的に番号をつけられるいくつかの更なるラスタ行332、および最後のラスタ行334を含む点に注意される。対応する行番号は、335で示される。同様に、ラスタ画像310は、第1のラスタ列322、第2のラスタ列336、好ましくは連続的に番号をつけられる更なるラスタ列338、および最後のラスタ列340を含む。
さらに、図解図300は活性であるか黒いラスタポイント(または画像点)の形でラスタ画像310によって表される楕円350を示し、活性なラスタ位置がハッチングによってマークされる。
さらに、図解図300は、360で示されるラスタ列の第1グループを示す。ラスタ列の第1グループは、包括的に、第1のラスタ列322、第2のラスタ列336および第7のラスタ列362までの以下のラスタ列の全てを含む。ラスタ列の第1グループ360は、このようにラスタ画像310の部分を記述する。
さらに、ラスタ画像の上述の部分は、列の数の制限のため最初のラスタ行と比較して長さにおいて減らされる複数のラスタ行を含む。画像部分の選択のために生じることができる短くされたラスタ行は、以下において短いラスタ行とも呼ばれる。
さらに、364で示されるラスタ列の第2グループは、第2のラスタ列336および第8のラスタ列366まで続くラスタ列を含む。換言すれば、それぞれ、7つの隣接するラスタ列が、それぞれラスタ列の1つのグループに結合され、それは共通処理のために提供される。
同様のグループ化は、ラスタ行に対して実行され、例えば、第1のラスタ行320、第2のラスタ行330および7番目のラスタ行368までの第1グループ370に結合される。同様に、ラスタ行の第2グループは、第2のラスタ行330から8番目のラスタ行372までを含み、ラスタ行の第2グループが374で示される。
この状況において、一群のラスタ行がいかなる数のラスタ行、例えば5本のラスタ行、16本のラスタ行、32本のラスタ行または64本のラスタ行を含むことができる点に注意される。この状況において、ラスタ行のグループに結合されるラスタ行の数は、2より大きいことが好ましい。同様の考慮すべき問題は、一群のラスタ列にもあてはまる。
図4aは、本発明の第2実施例にかかるグラフィック画像の楕円点の座標を決定するための発明のデバイスのブロック図を示す。図4aのデバイスは、全体が400で示される。後述するように、図3に示されているように、デバイス400は特にラスタ画像310を処理することにかなり適している。
デバイス400は、ラスタ画像410を受信する。さらに、任意の画像部分選択手段412を使用する一方で、デバイス400はラスタ画像410から画像部分414を選択する。選択された画像部分414は、例えば、複数のラスタ行および/または複数のラスタ列によって、例えば、図3を参照して述べたように、一群のラスタ行または一群のラスタ列によって定義されることができる。さらに、発明のデバイス400は、ラスタ画像またはラスタ画像部分414を受信するためのパターン検出手段420を含む。さらに、パターン検出手段420は、曲線の経路または曲線の参照経路のセットの中の曲がった線分がラスタ画像または画像部分414に含まれるかどうかをはっきりさせる。
ここの曲線の参照経路のセットの曲線の経路は、例えば、ラスタ画像または画像部分414に含まれる曲線の経路と、曲線の参照経路との類似点を決定するために、メモリ内に格納されることができる。しかしながら、パターン検出手段の構造が曲線の参照経路のセットの中の曲線の参照経路と十分に類似している曲線の経路がラスタ画像または画像部分414に含まれるかどうか検出することは可能である。曲線の参照経路として、使用は、第1の楕円点で、第2の楕円点で、第3の楕円点で、または、第4の楕円点において、楕円に近い曲線のこのような経路で好ましくはできている。従って、パターン検出手段は、通常、第1の楕円点で、第2の楕円点で、第3の楕円点で、または、第4の楕円点で楕円を検出する曲線の経路が、ラスタ画像または画像部分414に含まれるかどうか検出する。
パターン検出手段420は、第1の楕円点、第2の楕円点、第3の楕円点および第4の楕円点の中のどの1つが、曲線の参照経路のセットの中の曲線の参照経路が楕円に近い点であるのかによって、曲線の参照経路のセットの中で、第1の曲がった線分、第2の曲がった線分、第3の曲がった線分、または第4の曲がった線分のように、ラスタ画像または画像部分414に含まれる曲線の経路と十分に類似している曲線の経路を好ましくは確認する。
さらに、パターン検出手段420は、少なくとも1つの位置パラメータを決定するが、好ましくは2つの位置パラメータ、オプションとして、第1の線分の、第2の線分の、第3の線分の、または第4の線分の曲線の経路を記述する別の位置パラメータを決定する。オプションとしての座標計算手段430は、確認された第1の線分、第2の線分、第3の線分または第4の線分の位置から、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点の座標を計算することができる。しかしながら、好ましくは曲がった線分が特定の楕円点を通るような第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点の座標を位置パラメータが直接示すように、パターン検出手段420で決定される曲がった線分の位置パラメータがすでに定義されている場合、座標計算手段430は省略されることもできる。
曲線の参照経路として、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点で(または、それぞれの楕円点の環境において)楕円に近い曲線のこのような経路が好ましくは使用される点に更に注意される。曲線の参照経路として、曲線の対称形の曲がった経路が好ましくは使用される。また、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点において円形の曲線が特に楕円に近いので、例えば、円形の曲線からの部分が、曲線の参照経路として使用されることが好ましい。
図4bは、発明のパターン検出手段の利用のための曲線の参照経路の2つの実施例の図解図である。図4bの図解図は、全体が450で示される。第1の図解図452は、ラスタ画像の形で、第1の曲率半径r1を有する円形の曲線からの部分に近い曲線の第1の参照経路を記載している。第2の図解図454は、ラスタ画像の形で、第2の曲率半径r2を有する円形の線からの部分に近い曲線の第2の参照経路を記載しており、第2の曲率半径r2は第1の曲率半径r1より大きいものである。さらに、第3の図解図456は、ラスタ画像の形で、第3の曲率半径r3を有する円形の線からの部分を記述する曲線の第3の参照経路を示す。この状況において、第3の曲率半径r3は、第1の曲率半径r1より小さい。従って、図4bの3つの図解図452、454、456は、パターン検出手段420における利用のための曲線の3つの可能な参照経路を記述している。換言すれば、パターン検出手段420は、ラスタ画像または画像部分414において、図4bの図解図452,454,456に示された曲線の3つの参照経路を検出し、第1の楕円点において確認されるべき楕円に近い第1の曲がった線としてそれらを確認する。さらに、パターン検出手段420は、好ましくは、位置パラメータによって、ラスタ画像または画像部分414において検出される曲線の参照経路の位置を記述し、上述の位置パラメータが曲線の周知の参照経路が確認される楕円に近い第1の楕円点の座標を直接表さない限り、前記位置パラメータを座標計算手段430に利用できるようにする。
図5aは、そこにおいてマークされる検出された曲がった線分を含む典型的なラスタ画像の第1の図解図を示す。この状況において、図4aのデバイス400のパターン検出手段420が、例えば、画像または画像部分において、第1の図解図452において、第2の図解図454において、および第3の図解図456において示される曲線の参照経路を検出することが可能であると仮定される。図3aの典型的なラスタ画像310が、ラスタ画像414としてパターン検出手段420に供給されると仮定される。一例として、パターン検出手段のラスタ画像310が、行ごとの、または列ごとの形式で出力されると仮定される。パターン検出手段420のラスタ画像310が、第1のラスタ列322から始めて、列ごとの形式で出力されると仮定するならば、パターン検出手段420は、ラスタ画像、例えば図解図456の曲線の第3の参照経路において、検出することができる。図5aの図解図500において、その過程で検出される曲線の経路は、510でマークされる。しかしながら、パターン検出手段420のラスタ画像310が、最後のラスタ列340から始めて、列単位の形式で出力される場合、パターン検出手段は、例えば、図解図500の520で示される曲線の別の経路を検出することができる。
この状況において、パターン検出手段420は、それに供給される画像部分選択手段412によって選択される画像部分を有することができるだけである点に注意される。例えば、第1の処理ステップにおいて、パターン検出手段420は、それに供給されるラスタ行の第1グループ370を含む限定された画像部分を有することができるだけである。換言すれば、第1のラスタ・セル320と7本目のラスタ行368までの隣接するラスタ行とを含む画像部分は、第1の処理ステップにおいて、パターン検出手段420に供給されることができる。例えば、画像部分は、図解図452、454および456に示される曲線の参照経路のいずれかに適合する曲線の経路を含まない。次に、第2の処理ステップにおいて、パターン検出手段420は、それに供給されるラスタ行の第2グループ374を含む画像部分を有することができる。換言すれば、パターン検出手段420は、例えば、列単位の形式で(すなわち全ての列に)、第2のラスタ行330と8本目のラスタ行372との間の画像内容を包括的に有している。この画像部分は、また、図解図452、454、456の曲線の3つの参照経路に適合する曲線の経路を含まない。さらに、第3の処理ステップにおいて、画像内容は、パターン検出手段420のラスタ行の第3のグループに供給されることができる。ここのラスタ行の第3のグループは、380で示されて、ラスタ行3〜9を含む。パターン検出手段420は、この画像部分において、図解図456の曲線の第3の参照経路に対応する曲線の経路を確認することができる。従って、曲線の確認された経路は、図解図500の510で示される。さらに、解像度を改善するために、ラスタ行の隣接するグループ370、374、380が重複する、すなわち、共通のラスタ行を含む点に注意される。この状況において、例えば、図3に示されているように、ラスタ行の隣接するグループがたった1本のラスタ行だけ異なる、すなわちラスタ行の隣接するグループが正確に1本のラスタ行で相互にオフセットされることが好ましい。
換言すれば、デバイス400は、連続して、ラスタ行のさまざまなグループを含むさまざまな画像部分を処理して、それらをパターン検出に従属させることができる。このように、パターン検出は、いずれの場合においても、小さい画像部分を処理しなければならないだけであり、それは極度にパターン検出の複雑さを減少させる。さらに、その結果、使用する曲線の参照経路の数は少なく保たれることができる。第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点で楕円に近い曲がった線分の位置に関する情報が、曲線の参照経路が確認される画像部分を示す、すなわち、曲線の参照経路を確認するために使われるラスタ行のグループ370、374、380を示す情報から導かれることができる点に更に注意される。換言すれば、曲線の参照経路が確認される画像部分を述べている情報が、曲がった線分の位置パラメータを表し、このように、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点の少なくとも1つの座標を決定するために使われることができる。
同様に、第1の画像310は、行ごとの形式で、すなわち全ての行に、パターン検出手段420に供給されることができる。この状況において、ラスタ列の異なるグループ360,364を含むいくつかの画像部分は、次々と処理されることができる。ラスタ行のグループの列ごとの処理に関して与えられる説明は、同じように適用される。
図5bは、そこにマークされた検出された曲がった線分を有するラスタ画像の第2の図解図を表すことに注意される。図5bの図解図550において、560および570で示される検出された曲がった線分は、図解図454において表される曲線の参照経路に対応する。
最初に、第1のラスタ列322から始めて、列ごとの形式でパターン検出手段420にラスタ画像310を供給し、次に、最後のラスタ列340から始めて、列ごとの形式でパターン検出手段420にラスタ画像310を供給することが有利である点にも注意される。第1のラスタ列で始める第1の実行において、湾曲の第1の方向の曲線の経路が検出され、その一方で、最後のラスタ列340で始める第2の実行において、それに対して対向する湾曲の方向を有する曲線の経路が検出されることができる。同様に、1つの湾曲行動を有する曲線の経路または湾曲の1つの単一方向を検出するように設計されているだけのパターン検出手段を用いるときに、異なる湾曲行動を有する曲線の経路を確認することが可能であるように、ラスタ画像310の行ごとの処理は、あるところで第1のラスタ行320で始めて、他のポイントで最後のラスタ線334から始めて実行されることができる。
図6は、発明のデバイス400の利用のためのパターン検出手段のブロック図を示す。図6の回路は、全体が600で示されて、ハフ変換を実行するためのいわゆる「ハフ配列」を示す。座標判定手段110を実行するパターン検出手段400は、好ましくは、十分な近似によって、極値点の周囲で、すなわち第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点の周囲で、確認される楕円を示す異なる半径を有する円曲線の探索を実施する。パラレル収縮ハフ変換によって、特に有利な方法で、これは、実施されることができる。ハフ変換は、円曲線のために構成されることができて、この状況において、極値の、すなわち特定の方向における最も遠くに位置するそれらの位置を確認することの検索に適応することができる。
図6は、ハフ変換を実行するための特に有利な手段を示す。ハフ変換をここで実行するための手段600は、直列に接続された複数の段階610を含み、それによって、いくつかの信号612、614、616が並行して伝達される。信号ごとに、段階は、Aで示される遅延素子620、またはBで示されるバイパス624を含む。さらに、段階の出力における信号は、Cで示される加算コンポーネント630に供給される。加算コンポーネントは、好ましくは、どれくらいの信号がそれぞれの段階の出力で同時にアクティブであるかを規定する。いわゆる行の合計は加算コンポーネント630の出力632に存在し、前記行の合計がそれぞれの段階の出力において同時にアクティブである信号の数を示す。行632の合計は、行632の合計と所定の閾値とを比較する比較器634に供給されることができる。行632の合計が所定の閾値を上回る場合、それぞれの段階で、少なくとも所定の数の信号がアクティブであることを意味する。換言すれば、「直線」が、少なくともおよそ、それぞれの段階に存在し、前記直線が少なくとも、それぞれの段階の所定の数の信号が同時にアクティブであるという点で特徴付けられている。その後、比較器634の出力信号は、遅延素子636に供給される。それぞれが段階610の比較器634の出力に接続されるそれぞれの遅延素子636は、遅延素子636の出力信号が次の遅延素子636の入力に供給されるように、カスケード接続される。
遅延素子620、636がクロック的な方法で作動し、その結果、信号612、614、616および比較器634の出力信号はクロック的な方法で伝達される。それらの構造に関して、同じ方向に、信号612、614、616および比較器634の出力信号は並行して伝達され、しかしながら、段階610において信号612,614,616を伝達するために遅延素子620またはバイパス624を使用したかどうかにより、個々の段階において信号612、614、616は異なる程度に遅延する。しかしながら、複数の信号612、614、616の中心信号が、複数の段階を通して、比較器634の出力からの信号と同じくらい速く送られることが好ましい。好ましくは、中心信号は段階の各々において同じくらい遅延し、比較器634の出力信号も、好ましくは、一定の遅延で段階を通して送られる。中心信号は、好ましくは、第1の信号612および最終信号614の中間に位置し、このように、ハフ変換手段600に供給される画像部分の中央でラスタ行を記述するか、または、画像部分の幅の最高25%だけ画像部分の中心から間隔を置かれる。画像部分の幅は、同時にハフ変換手段600に供給されるラスタ行またはラスタ列によって定義される。
構造記述に基づいて、パターン検出手段600の動作モードは、以下において更に詳細に説明される。画像部分が並行するタイムシグナル612、614、616の形でハフ変換手段600に供給されると仮定される。それらが個々の段階を通過するときに、異なるタイムシグナル612、614、616がさまざまな程度に遅延するように、遅延素子620またはバイパス624は構成される。遅延素子620またはバイパス624のスイッチを入れることによって、曲線の曲がった経路(好ましくは、曲線の円形の曲がった経路)が1つの段階またはいくつかの段階610を通過した後に曲がっていないように、遅延は設定される。換言すれば、ハフ変換手段によって処理される画像部分の曲線の曲がった経路は、個々の信号612、614、616が時間内の異なる時点でアクティブであるという結果となる。しかしながら、最適に遅延素子620またはバイパス624をセットすることは、信号612、614、616が異なる速度で個々の段階を通過するようにし、その結果、理想的には、一旦特定の段階610が通過されるならば、信号612、614、616に基づくいかなる送られた信号も同時に段階の出力においてアクティブである。この場合、特に大きい行の合計が特定の段階で発生し、前記行の合計がそれぞれの加算手段630によって計算される。このような大きい行の合計は、それぞれの段階の比較器634が、遅延素子636のカスケードを介して、ハフ変換手段の出力640に次々に送り届けられるアクティブ信号を出力するという結果となる。このように、タイムシグナル612、614、616の形でハフ変換手段600に入力される画像部分の曲線の経路の位置は、ハフ変換手段600の出力640において、出力信号上の活性の時間的位置から推定されることができる。
信号612、614、616の中の所定の信号(また、中心信号とも呼ばれる)が遅延素子636の連鎖によって送られる比較器634の出力からの出力信号と同じくらい速くハフ変換手段600の段階610を通過することが好ましい点にも注意される。換言すれば、入力信号612、614、616のうちの少なくとも1つは、並行して、比較器634の出力信号と同じ速度で伝播する。このように、ハフ変換手段600の出力640に存在し、遅延素子636のカスケードにおいて送られる比較器634の信号に基づく出力信号は、入力信号612、614、616の曲がった線分が発生する時点において直接の記述を生み出すことを達成することができる。この状況において、ハフ変換手段600の出力640における出力信号上の活性の発生の時は、線の曲がった経路が入力信号612、614、616の形でハフ変換手段に入力される時点の記述を提供する。信号612、614、616におけるサンプルの曲がった経路が存在する時点は、信号612、614、616の基礎をなしているラスタ画像における曲線の曲がった経路の空間的な位置に関して出された直接の結果を明らかに可能にする。
さらに、示された形状で、信号612,614,616の少なくとも1つが段階610を通して比較器634の出力信号と同じくらい速く伝播するものであるが、曲線の正確な形状、すなわち、例えば曲がった曲線における曲率半径は、どの段階610において比較器634がアクティブになるのかについての影響を有するだけである。しかしながら、示された構成で、曲線の曲がった経路の正確な形状は、ハフ変換手段600の出力640でアクティブになる時に影響を及ぼさない。
したがって、ラスタ画像(またはその部分)が異なる速度でハフ変換手段600のいくつかの段階を通過する複数の並列信号に変換されるという点で、図6に示されるハフ変換手段600が非常に効率的な方法でラスタ画像の曲線の曲がった経路の位置を決定することに適していると確認されることができる。段階610の出力で列の合計を形成することによって、いつ少なくとも所定の数の信号が同時に段階の出力でアクティブになるかを検出することができ、それは曲線の最初の経路が「曲がっていなかった」ことを再び示す。
好ましくは、ハフ変換手段600は、最適に遅延素子620またはバイパス624を選択することによって、信号612、614、616によって記載され、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点で楕円に近くなることができる曲線のいかなる経路もまっすぐになるように設計される。また、好ましくは、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点で楕円に近づくことができる曲線のこのような経路だけは曲がっていない。このように、図6のハフ変換手段600は、第1の曲がった線分、第2の曲がった線分、第3の曲がった線分、または第4の曲がった線分を確認するのに適している。ハフ変換手段600の出力640に出力信号がある時点は、信号612、614、616が基礎を形成されるラスタ画像の曲線の確認された経路の位置、すなわち第1の曲がった線分、第2の曲がった線分、第3の曲がった線分、または第4の曲がった線分のパラメータを記述する。
図7aは、パターン検出手段によるグラフィック画像を移動するアプローチの図解図を示す。具体的には、図7aは、列ごとの形式で図6に示されるハフ返還手段600(また、ハフ配列とも呼ばれる)による画像またはラスタ画像を移動することを示す。
図7aは、複数のラスタ行720および複数のラスタ列730からなるラスタ画像710を示す。示されることは、各々好ましくは5つのラスタ列730のグループ740であり、それが5つのラスタ列とみなされ、各ケースにおいて、同時に、信号612、614、616の形で並行してハフ変換手段600に供給される。詳しくは、図3の図解図300において参照される。
図7bは、並行したタイムシグナルへのラスタ画像の変換の間に形成されるタイムシグナルの図解図を示す。図7bの図解図は、全体が750で示される。図解図750は、複数の活性でないラスタポイントまたはイメージポイント762およびハッチングでマークされる複数の活性なラスタポイントまたはイメージポイント764を含むラスタ画像760を示す。活性なラスタポイントまたはイメージポイント764は、好ましくは曲線の経路を記述する。上述のように、ラスタ画像760は、複数のラスタ行770および複数のラスタ列772を含む。タイムシグナルが一群の7つのラスタ列から成る画像部分780に基づいて形成されるとも仮定される。例えば、第1のタイムシグナル782は、ラスタ列のグループ780内に含まれる第1のラスタ列784と関連している。ここのタイムシグナル782は、行ごとの形式で関連するラスタ列784に沿ってラスタ画像760をスキャンすることによって形成される。同様に、第2のタイムシグナル786は、行ごとの形式でラスタ列のグループ780内の第2のラスタ列788をスキャンすることによって形成される。時間挙動の観察は、記載されているスキャン方向において、ラスタ画像760の同じラスタ行にある活性なラスタポイントが、タイムシグナル782、786、790上の同時活性パルスという結果となることを明らかに示す。水平線、すなわちラスタ行の中で伸びている線は、このようにタイムシグナル782、786、790上の同時パルスによって、タイムシグナル782、786、790において目立つようになる。
タイムシグナル782、786、790が入力信号612、614、616としてハフ変換手段600に供給される、そして、信号612、614、616がハフ変換手段600の個々の段階610で異なる程度に遅延させられると仮定される場合、変化の程度によって生じているタイムシグナル782、786、790の遅延がラスタ画像760の歪曲に対応することは明らかになり、その結果、曲線の曲がった経路は直線に曲げられることができる。しかしながら、タイムシグナル782、786、790のいくつかの同時の活性状態に対応する直線は、上述のように、ハフ変換手段600で検出されることができる。
図8は、本発明の第3実施例にかかるグラフィック画像の楕円の形状および/または位置に関する情報を決定するための発明のデバイスのブロック図を示す。図8の発明のデバイスは、全体が800で示されて、ビデオソースまたはカメラ810によって供給されるグラフィック画像812に基づいて、人間または動物の視線を決定する。カメラを含むビデオソース810は、例えば、ビデオ・データ812を前処理手段814に提供する。前処理手段814は、自身のフィールド・プログラマブル・ゲートアレイ(FPGA)において、または特定用途向け集積回路(ASIC)において集積されることができる。しかしながら、前処理手段814は、後述するように、ハフ変換手段またはハフ配列とともに単一のFPGAの中に収容されることもできる。前処理手段814は、好ましくは、二値画像を生成するための閾値二値化によって、および閾値二値化から生じている二値画像からの次のエッジ抽出によって、ビデオ・データ812をエッジ画像に変換する。二値画像からのエッジ抽出は、拡張(伸張)および引算に基づいて実施され、バイナリ・エッジ画像という結果となる。換言すれば、前処理手段814は、例えば、ビデオ・データの明るさおよび/または諧調レベルを閾値と比較して、比較結果に基づいて、明暗の画像領域の間だけの識別をする二値画像を生成することができる。二値画像の拡張または圧縮バージョンは、二値画像から作り出されることができ、差はオリジナルの二値画像および拡張または圧縮二値画像との間で決定される。差は、ビデオ・データ812内のエッジを示すエッジ画像を生成するために使われることができる。
前処理手段814で前処理された後に、エッジ画像は、好ましくは第1の方向の、そして、それに対して直交する第2の方向の更なる処理に利用できる。しかしながら、エッジ画像は、それにもかかわらず、第1の方向に沿って、そして、それに対して直交する第2の方向に沿ってエッジ画像にアクセスできる単一のメモリに保存されることができる。例えば、第1の方向のエッジ画像の処理はエッジ画像の列ごとの処理を示し、それに対して直交する方向の処理は行ごとのエッジ画像の処理を示すことができる。第1の方向の処理のためにあるエッジ画像は820で示されるが、それに対して直交する方向の処理のためにあるエッジ画像は822で示される。第1の方向の処理のためにあるエッジ画像820は、湾曲の第1の方向の曲線の曲がった経路を検出するための第1のハフ変換手段830(また、ハフ配列とも呼ばれる)に並行して供給される。さらに、エッジ画像820は、湾曲の第1の方向とは逆の湾曲の第2の方向の曲線の曲がった経路を検出するための第2のハフ変換手段832に供給される。
しかしながら、2つのハフ変換手段830、832は、同様に設計することができ、その場合、第1エッジで開始して、エッジ画像が第1のハフ変換手段830に供給され、またその場合、第1エッジの反対側の第2エッジで開始して、エッジ画像が第2のハフ変換手段に供給される。例えば、エッジ画像820が、第1のラスタ行で開始して、行ごとの形式で、第1のハフ変換手段830に供給される場合、エッジ画像820は、最後のラスタ行で開始して、行ごとの形式で、第2のハフ変換手段832に供給される。
2つのハフ変換手段830、832は、第1の楕円点、第2の楕円点、第3の楕円点、または第4の楕円点で、ビデオ・データ810の楕円に近いエッジ画像820のこのような曲がった線分を確認する。さらに、ハフ変換手段830、832は、確認された曲がった線分に基づいて関連した楕円点の座標を確認する。同様に、第2の方向の処理のためにあるエッジ画像822は第3のハフ変換手段840および第4のハフ変換手段842に供給され、その基本的な動作モードに関して、第3のハフ変換手段840は第1のハフ変換手段830に対応し、その基本的な動作モードに関して、第4のハフ変換手段842は第2のハフ変換手段832に対応している。このように、第1のハフ変換手段830、第2のハフ変換手段832、第3のハフ変換手段840、および第4のハフ変換手段842は、第1の楕円点、第2の楕円点、第3の楕円点、および第4の楕円点の座標844、845、846、847を提供する。
後述するように、4つのハフ変換手段830、832、840、842は、好ましくはFPGAにおいて行われる点に注意される。好ましくはパーソナル・コンピュータ(PC)において実行される楕円計算手段850は、第1の楕円点、第2の楕円点、第3の楕円点、および第4の楕円点の座標844、845、846、847に基づいて楕円パラメータを計算する。さらに、このように、人間またはビデオソース810によって観察される動物の視線は、楕円パラメータから計算されることができる。
換言すれば、各々に対して90°回転している二値画像820、822は、ハフ配列830、832、840、842に送られ、全ての4つのタイプの極値点、すなわち4つの特定の楕円点が検索される。次に、例えば、極値点から、すなわち第1の楕円点、第2の楕円点、第3の楕円点、および第4の楕円点から、パーソナル・コンピュータにおいて、楕円またはそれらのパラメータが計算され、人間または動物の視線はそこから決定される。
なお、上ですでに説明したように、第1の楕円点の座標844および第2の楕円点の座標845が、おそらく、少なくとも、決定される楕円の中心の座標を算出するために十分である点に注意される。従って、90°回転したエッジ画像822の計算はおそらく省略されることができ、その結果、第3のハフ変換手段840および第4のハフ変換手段842は省略されることもできる。
さらに、楕円の3つの極値点の座標はこのような計算に充分であるため、楕円パラメータの全てが計算されることになっている場合であっても、少なくとも、第4のハフ変換手段842は省略されることができる。
さらに、エッジ画像が確実にハフ変換手段830、832、840、842に供給される限り、前処理装置を要望通り変化させることができる点に注意される。さらに、利用可能な充分な時間があるならば、ここで並行であるとして示される処理は、連続して実施される。
図9は、本発明の第4実施例において、グラフィック画像の楕円の形状および/または位置により情報を測定するための発明のデバイスのブロック図の部分を示す。ここで、ブロック図のセクション910において、図9は、2つの異なるパターン検出手段920、922を用いて湾曲の異なる方向を有する曲がった線分を確認することの可能性を示す。第1のパターン検出手段920は、湾曲の第1の方向の曲線の曲がった経路を検出し、第2のパターン検出手段922は湾曲の第2の方向の曲線の曲がった経路を検出するが、湾曲の第2の方向は湾曲の第1の方向と逆向きである。画像または画像部分930は、同様に両方のパターン検出手段920、922に供給される。換言すれば、第1のラスタ行が最初に供給されるように、第1の画像部分930は画像としてパターン検出手段920に供給される。第1のラスタ行が最初に供給されるように、画像または画像部分930は第2のパターン検出手段922にも供給される。第1のパターン検出手段920および第2のパターン検出手段922の応用は、同時に、または、次々と実行される。ブロック図910に関して、用語ラスタ行が用語ラスタ列と置き換えられることもできる点に更に注意される。
第2のブロック図950は、画像または画像部分980の異なる湾曲方向の曲線の曲がった経路を検出する第2の可能性を示す。ここで、例えば、画像または画像部分980は、第1のラスタ行から初めて第1のパターン検出手段990に供給される。さらに、第2のパターン検出手段992の画像または画像部分980は、最後のラスタ行から始めて供給されることができる。2つのパターン検出手段990、992は、両方とも、第1の湾曲方向の曲線の曲がった経路を検出するだけである。異なる方向における画像または画像部分980を供給することによって、第1のパターン検出手段990がオリジナル画像における第1の湾曲方向を含む画像部分の曲線の曲がった経路を検出し、第2のパターン検出手段992が、オリジナル画像、またはオリジナル画像における第1の湾曲方向と逆の第2の湾曲方向を含む画像部分の曲線の曲がった経路を検出することができる。画像または画像部分980が、例えば、最初に第1のラスタ行から始めて次に最後のラスタ行から始めて、次々と第1のパターン検出手段991に供給される場合、2つの別々のパターン検出手段990、992が必要でないことに更に注意される。この場合、第2のパターン検出手段992は省略されることができる。
ブロック図910および950により記載された実施例が、例えば、デバイス800において使用されることができ、それに応じて、実現は有利であると考えられる。
以下に、第1の楕円点、第2の楕円点および第3の楕円点の座標からの楕円パラメータの決定が、更に詳細に説明される。ここで、以下において、第1の楕円点、第2の楕円点および第3の楕円点は、「極値点または転換点」とも呼ばれる。
第1ステップにおいて、ここでは、楕円中心240の座標(x
m、y
m)が、第1の楕円点および第2の楕円点の座標から算出される。以下に、図2aおよび2bの図解図200、250の記述が用いられ、それはすでに詳細に説明されている。図2aの図解図200からそれとみなされることもできるように、楕円の左右対称性のため、中心点が2つの逆の極値点または転換点の間に正確に常に中心にある点に更に注意される。したがって、次式が適用される。
および、
以下に、更に楕円のシェープパラメータ、すなわち楕円の第1の半軸の長さa、楕円の第2の半軸の長さbおよび回転角αの決定について記載される。
極値点の座標(x1,y1)(x2,y2)(x3,y3)(x4,y4)からのシェープパラメータの決定はより困難である。図2bを参照してすでに述べたように、知られた中心点(xm,ym)を用いて、楕円はまず第一に原点に移される。
このように、以下で、座標原点264において回転する楕円270が仮定される。それは、最小限、四角形に適用される4つの接点を有する。それぞれ2つの接点は、座標原点に対して回転対称である。したがって、第1象限の2つの点276、280だけが考慮される。
以下において示される方程式(1.1)は、パラメータ形式で座標原点においてαで回転する楕円を記述する。
ここで、xおよびyは、パラメータθによる楕円点の座標である。残りのパラメータα、aおよびbが、すでにある。
tan(θ)について、方程式系(1.1)を解くと、以下のような結果となる。
極値xの条件から
方程式(1.4)は、次のように得られる。
そして、極値yの条件から
方程式(1.6)は、次のように得られる。
方程式はθによって極値点の位置を記述する。換言すれば、θxおよびθyは、方程式(1.1)に関して、変換された第1の楕円点276に対して、または、それぞれ変換された第3の楕円点280に対して、パラメータθのためのパラメータ値を示す。
方程式(1.2)および(1.4)を同等と考え、方程式(1.2)および(1.6)を同等と考えて、次のように置換すると、
以下の結果を得る。
および、
以下において、回転角αの計算について説明される。回転角を計算するために、楕円の二乗軸率a
2/b
2は、方程式(1.7)および(1.8)を同等と考えることによって除去されることができる。これは、第4次方程式となる。
解は、計算機代数プログラムMapleを使用して見つけられた。方程式(1.9)の4つの解のうちの2つは、虚数である。2つの他の解は、u
1およびu
2である:
後方代入の後、90°回転する楕円が逆の軸率を有する回転しない楕円に等しいため、2つの解は正確に90°異なる。微分によって、正しい解を決定することができる。
x
xおよびy
yが同符号を有する場合、以下が適用される。
それらが異なる符号を有する場合、以下が適用される。
現在、周知の回転角を用いて、軸率ρ=a2/b2は、方程式(1.7)または方程式(1.8)から決定されることができる。
以下に、半軸の長さの計算が記載される。
これまで、回転角αおよび軸率ρが決定された。半軸の長さを計算するために、楕円方程式が、用いられなければならない。
ここで、極値点θxおよびθyの位置から、以下の方程式系がシステムが結果として得られる。
これから、展開および引算によって、aを除去する。
(1.4)および(1.6)を(1.14)に代入することによってθxおよびθyは、除去されることができる。残ることは、2つの極値点の回転角α、軸率ρおよびx座標に依存する半軸bのための式である。
軸率ρおよび半軸bから、欠落した半軸aは、容易に算出されることができる。
以下において、楕円パラメータを計算するときの方程式系の重複確定性の問題が評価される。ここで、まず第一に、課題が本質的に示される。さらに、どのようにして、重複確定性が発明のデバイスまたは発明の方法の信頼性を増加させるために用いることができるかについて更に記述される。
4つの極値点を見つけて、楕円は過剰に決定される。楕円の5つのパラメータを決定するために、4つの可能な極値点(8つの座標)の5つの座標だけが必要である。したがって、「2.5楕円点」のみが必要である。
2つの対向する極値点が、中心点を決定するために必要である。実験によって、常に図2bに従う楕円に対して、以下の方程式があてはまることが分かった。
つまり、全4値xx、xy、yxおよびyyを決定するために、3つの測定値は充分である。それらのうちの2つは、中心点を決定することから必然的に公知である。それから、第3の点の更なる座標が、残りの楕円パラメータを決定するために使われなければならない。
例えば、点1および点3、すなわち第1の楕円点226および第2の楕円点228が、中心点240を決定するために使われる。座標原点にシフトした後のx3−xmはxxになり、y3−ymはyxになる。xxおよびyxはこのように極値をx方向に記載する。y方向の極値点の更なる座標から、方程式(1.17)によって、第4の値が決定される。
測定値、すなわち座標決定手段によって与えられる極値点の座標は正確ではない。このように、それらは、方程式(1.17)を容易に満足しない。計算値の代わりに、計測値(すなわち座標決定手段によって与えられる値)が方程式(1.17)を考慮せずに楕円パラメータの計算のために使われる場合、わずかに誤った測定位置によって間違った結果を得る危険がある。楕円パラメータを導き出すときに楕円が実際に存在するとみなされるので、値(また、計算において使用する座標)は「本当の」楕円によってもたらされなくてはならず、すなわち方程式(1.17)は(少なくともおよそ)(座標決定手段によって与えられる座標の全てが1つの楕円に属している点に基づく限り)座標決定手段によって与えられる座標によって条件が満たされなければならない。
以下において、上述の過剰な確定性がどのように使われることができるかが説明される。
(公式(1.17)を用いて)計算した(第3の楕円点280の座標に対する)値と計測値(すなわち、座標決定手段によって直接与えられる)との間の隔たりは、見つけた楕円を評価するために使われることができる。3つの極値点が入力画像の楕円から来ることが保証されることができる。
4点が得られる場合、楕円パラメータの計算は3つのそれぞれ(または全体として5つの座標)を用いて実行されることができる。4点から、例えば、3点を有する3つの異なる量が形成されることになっている。そこから計算される4つの楕円のパラメータは、4点がある場合には、過剰な確定性を克服するために平均されることができる。
要約すれば、上記の概念に基づいて、リアルタイムで使用可能な楕円検出が、ハフ変換に基づいて実現されてもよいということができる。第1段階において、ここでは、楕円の極値または極値点(また、第1の楕円点、第2の楕円点、第3の楕円点および第4の楕円点と呼ばれる)が、それぞれ決定される。平行ハフ変換またはパターン認識または検出の他の方法の助けを借りて、正確に楕円パラメータを決定することが可能である点(すなわち、座標(xm、ym)によって記述される中心点、半軸aおよびb、および回転α)、または、例えばa/bのような楕円パラメータの機能から、画像の楕円の特徴的な点が捜される。
それぞれ、楕円の特徴的な位置は、それぞれ、エッジ画像の正負のx方向における、および正負のy方向における、極値または極値点のxおよびy座標である。前述の極値点は、例えば、図2aの図解図200において示される。
楕円パラメータのはっきりした決定のために、正確に一方向の2つの極値点および第3の極値点の更なる座標は、公知でなければならない。座標(x0、y0)および(x2、y2)および座標x1またはy1またはx3またはy3のうちの1つが公知であれば、それは充分である。座標(x1、y1)および(x3、y3)および座標x0またはy0またはx2またはy2のうちの1つが公知であるであれば、それも充分である。数学的表記法において、以下の通りに表されることができる。
((x0、y0)および(x2、y2)および(x1またはy1またはx3またはy3))
または
((x1、y1)および(x3、y3)および(x0またはy0またはx2またはy2))
は、楕円パラメータの決定に対して知られていなければならない。
詳細な情報(すなわち、より多くの座標)が利用できる場合、計算の曖昧性は適切な方法、例えばエラーの最小化などによって取り除かれることができる。要求されている以上に多い点が知られている場合、更に各々(最大の)周知の4点のうちの2.5を使用して、それぞれの楕円が計算されることができる。これらの楕円のパラメータは平均されて、結果として得られる楕円のパラメータとなる。換言すれば、(「2.5点」の)5つのパラメータのそれぞれは、楕円パラメータのいくつかのセットを計算するために用いることができる。そこにおいて、平均化は、楕円パラメータの計算されたセットにわたって実行されてもよい。
極値点の決定は、極値の検索と考えられることもできる。極値の検索は、充分な近似の極値点周辺で楕円(および/または捜される楕円)を示す異なる半径を有する円曲線の検索によって実行されることができる。円曲線の検索は、例えば正負のxおよびy方向において、すなわち、例えばラスタ画像の全ての4つの標準方向において実行される。ここで、あらゆる方向において、画像は、重なるストリップおよび/または画像部分において分析される。
特に適切である方法は、上述の並列収縮ハフ変換である。並列収縮ハフ変換は、円曲線のために構成されて、極値検索に適応する。全てのクロックで平均して、n個のエッジ点の票は、行合計Cから列(遅延素子)Aの直列に接続される遅延素子の配列によって形成され、その一方で、エッジ点(エッジ画像の点)はシフトされる。換言すれば、ハフ領域「ハフ配列」の第n番目の段階において、このように、行合計は形成され、その一方で、エッジ画像の点は第n番目の段階にシフトされる。各画像点は、切替えられたバイパスBを考慮して次の遅延素子に増加的にシフトされる。各列が多くのクロックにおけるバイパスBの接続によって以前に決定された票を生成する。ここで、票は、シフトされる点がどの円曲線に置かれることができるかについて示すものである。各クロックにおいて合計される列から来ている票は、加算器列という結果になる。
円曲線が見つかったかどうかについて、決定が閾値を用いて各行の比較器によってなされる場合、加算器への入力は省略されることができる。閾値を上回る場合、バイパスのない別の遅延素子列で、データとともに時計回りにシフトされる確定した場所でビットが発生する。
ハフ領域またはハフ配列を離れるとき、すなわちハフ変換手段の出力Eで、形成されたビットは検出される。それらは、検出された円曲線の座標についての、そして、極値点の座標についての情報を与える。
より良好な理解のために、各列の遅延素子のバイパスの異なる構成によって、行ごとにFでハフ変換手段600にシフトされる円曲線は、(検出可能な)最大行合計という結果になる領域(配列)の特定の線における1つの直線になると想像することができる。
すべての円曲線または極値、または極値点を見つけるために、全ての画像列および全ての画像行が領域(配列)の各列を通って正確に一回前方に移されなければならず、正確に一回後方に移されなければならないのであって、その画像列は、隣接するものと共に領域(配列)を通ってシフトされるだけである。図7aは、列ごとに一方向に領域(配列)を通って画像をシフトしている様子を示す。ここで、例えば、常に5つの隣接する画像列が、同時にシフトされる。
領域(配列)を使用して、全ての4つの方向のためにそれを使用する代わりに、2つのまたは4つの領域(配列)が、使われることができる。それらが2つの他の領域(配列)より逆曲線を有する円曲線を変換しおよび/または検出するように、2つの領域(配列)が各々構成される場合、(画像)データは、前に、すなわち、それぞれオリジナル画像および90度回転したオリジナル画像から、領域(配列)を通してシフトされなければならないだけである。上述の方法において、極値点の座標は、決定されることができる。座標がこのように少量のデータを形成するだけである1つの画像の中に存在している通常少ない数の極値点は、更なるステップの個々の楕円と関連していなければならない。これは、例えば、パーソナル・コンピュータまたはマイクロコントローラによって実行されることができる。極値検出の後(すなわち、極値点の座標を決定した後)の少ないデータ量のため、ここでは、高い要求という結果にはならない。ここの発明概念は、処理時間が画像内容と無関係であるという効果がある。さらに、楕円パラメータは、ほんのわずかの極値から計算されることができる。極値からの楕円パラメータのこの計算は極めて急速に実行されることができて、ハードウェア、例えばFPGAまたはASICを用いて容易に実現されることができる。
以下に、道路標識検出の概念が、再び簡潔に要約される。この点で、その第1段階の道路標識検出が図1〜9に関して記載されていた楕円の確認と類似している点に留意する必要がある。ここで、パラメータは、例えば、二値化のための閾値または曲線の対応する経路に属している画像点の最小数のための閾値のように、セットされることができる。
道路標識検出は、以下の通り、ステップ・バイ・ステップ式で実行される。
1.カメラを用いて画像を記録する;
2.閾値をセットする;二値化(好ましくは、諧調レベルのヒストグラム分布に対応して適応する);ビデオについては、好ましくは、x個の画像フレームの後でよりしばしば再調整する、または、あらゆる画像に対して最適の閾値をセットする;標準画像処理;
3.輪郭を見つける;輪郭を見つけるアルゴリズムは、好ましくはモルフォロジー演算器から成るが、原則としてエッジ検出アルゴリズムである;
4.ハフ変換;ハフ変換を実行するためのソフトウェアを使用して、画像の極値が見つけられ、マークされる;各極(値)は、x,y位置を使用して好ましくは示されて、付加的な曲率値を有する;ハフ変換を実行するためのソフトウェアのパラメータのバリエーションに応じて、発生する極値の群は、多少濃密であってもよい;
5.ハミルトン変分計算を用いた分類法;min(integral x_i−t_j)2にしたがって積分を最小化すること;
楕円の例のために、分類は、以下の通りに実行される:
すべての可能な4点対のリストを準備する;楕円を4のあらゆる組合せに適合させて、楕円パラメータを決定して、測定位置の偏差を適した楕円から形成する;最小偏差に関して、4の組合せの減少リストを準備する;
6.道路標識は、丸いか、三角であるか、矩形であるかまたはこのカテゴリに分類されない他の形状(例えば、停止信号)を有する。
これは、スケッチしている曲線の主要な原則である。この機能は、ノードおよび二次導関数によって近似されることができる。これは、制限のあるデジタル・ケースに当てはまるだけである。垂直および水平の線が見つけられる。また、円は問題ない。異なる傾斜の直線については、従来法はよく機能しない。ここで、好ましくは、ハフ・ラインファインダが例えば用いられる。そして、A.Brueckmann、F.KlefenzおよびA.Wuenscheよって刊行された「2D傾斜およびサイン波形状検出のためのニューラルネット(A neural net for 2D slope and sinusoidal shape detections)」に記載されている、(公表:インターナショナル・サイエンティフィック・ジャーナル・オブ・コンピューティング、第3巻、エディション1、ウクライナ、2004、21〜26ページ)。
このように、好ましくは、方向選択の完全なコンピュータの神経科学的なヒューベル−ウィーゼル解法が得られる(方向選択のコンピュータの神経科学ヒューベル−ウィーゼル解法)。
7.それぞれ、輪郭記述言語のテンプレートまたはマスターの量を形成する(V.Ferrariその他による刊行「輪郭セグメント・ネットワークによるオブジェクト検出(Object detection by contour segment networks)」を参照、公表:コンピュータ・ビジョンのヨーロッパ会議(ECCV)、グラーツ、2006年5月)。
例:x,y座標で、曲率半径zの、丸い標識が見られる。
例:三角形、四角形:
すべての3種類の組合せ対をまっすぐな成分から形成する。最小値を変分計算から形成する。45°三角形がある場合、許容差範囲内で、+45°および/または−45°の傾斜および水平線の2つのまっすぐなハフラインが存在しなければならない。
円が四角形に4つのポイントで接触するので、すべての距離(適当な円−輪郭点)の最小値を決定する;円か楕円かの決定
一般の方法:線および円のアークから成るオブジェクト、オブジェクトがどのようにまとめられるかについて記述する。例:コーナー;上向きの線、yセンチメートル、下向きの線、xセンチメートル;曲率半径を有する曲線のアーク。
マークされたポイントにわたって異なる方向にこのテンプレートをシフトする;テンプレート・ベクトルおよびレッドポイント・ベクトルの違いの最小値(min(template vector−red point vector))を形成する;最高の可能な適合が確認される所で、対象が存在すると仮定される。
このように、道路標識は、基本的な幾何学的な形状に分割される。その後、標識は、標準サイズおよび標準位置に配置されて、標準標識と比較される。
8.この目的のために、単純な相関アルゴリズムは、ピクセル後のピクセルに使用される。アルゴリズムは、色および形状の両方を使用する。
要約すると、本発明は、車両に取り付けられたカメラによって記録される画像の道路標識を検出するために、特に信頼性が高い概念を提供する点に留意する必要がある。
比較的低いコンピュータの効果については、ここに記載されている概念は、特に信頼性が高い道路標識検出を可能にする。
以下において、文字がどのように能率的に道路標識において検出されることができて、道路標識の識別のために使われることができるかが記述される。
図28は、画像の文字を検出するための発明のデバイスのブロック図を示す。図28によるデバイスは、全体が2800で示される。デバイス2800は、好ましくは、画像2808を受信する。デバイス2800は、任意に、画像2808から画像の前処理されたバージョン2812を生成するために行う画像前処理2810を含む。デバイス2800は、画像2808または画像の前処理されたバージョン2812を受信して、画像2808における、または画像の前処理されたバージョン2812における筆記成分を確認するためのハフ変換器2820を含む。本発明の実施例によれば、ハフ変換器2820は、確認された筆記成分として、画像2808における、または画像の前処理されたバージョン2812における円のアークまたは楕円のアークを確認する。
他の好ましい例において、ハフ変換器2820は、確認された筆記成分として、異なる方向から画像2808または画像の前処理されたバージョン2812を通る複数の直線部分を確認する。
さらなる態様において、ハフ変換器2820は、確認された筆記成分として、それぞれ、画像2808のまたは画像の前処理されたバージョン2812において、一方では円のアークまたは楕円のアーク、他方では直線部分を確認する。さらに、ハフ変換器2812は、文字記述発生器2830に確認された筆記成分に関する情報2822を提供する。
文字記述発生器2830は、確認された筆記成分に基づいて、すなわち確認された円のアークまたは楕円のアークに基づいて、および/または確認された直線部分に基づいて確認された筆記成分の位置を記述している文字記述2832を得る。
データベース比較器2840は、文字記述発生器2830から文字記述2832を受け取って、文字記述2832を複数の比較文字記述2842と比較する。好ましくは、文字コードは、例えば、データベース2844に格納される比較文字記述2842と関係している。データベース比較器2840は、文字記述および複数の比較文字記述との間で検出された文字の文字コード2846を提供する。
上記のデバイス2800の構造の記述に基づいて、以下において、デバイス2800の機能が更に詳細に説明される。この点で、ハフ変換器2820は、好ましくは、異なる文字および/または筆記成分、例えば、画像2808または画像の前処理されたバージョン2812における円のアークおよび/または楕円のアークおよび/または直線部分を検出することに注意すべきである。この点において、線が中断される場合であっても、ハフ変換器がその機能により全体としてまっすぐであるか曲がった線を検出することが可能であることに注意すべきである。ここで、線の中断があまり長すぎないことが必要なだけである。これは、ハフ変換器によって、例えば段階的に傾斜したか曲がった線を直線状に曲げることによって達成され、それから直線が検出される。直線の検出は、概して特に単純であり、直線の検出に関しては、どれくらい多くの画像点が直線に沿って存在しているかをチェックしなければならないだけである。直線に沿った画像点の数が所定の最小数より大きい場合、全ての点が直線に沿って存在するというわけではない場合であっても、直線が存在すると仮定されることができる。しかしながら、直線に沿った点が所定の数より少ない場合、画像中に線が存在しないと仮定されることができる。
ハフ変換器は一般的に言って、短い中断が存在する場合であっても、全体として所定の曲線(すなわち、例えば円のアーク、楕円のアークまたは傾斜した線)に沿っている不継続の線を検出する特に信頼性の高い手段である。
さらに、その動作原理により、ハフ変換器は、確認された線形状成分(円のアークおよび/または楕円のアークおよび/または直線部分)の1つの位置に関して、少なくとも情報を提供する。
概してハフ変換器によって与えられる情報は、位置情報に加えて、確認された筆記成分、例えば確認された直線部分の方向に関する情報、または確認された円のアークまたは楕円のアークの曲率半径に関する情報を含む。
さらに、円のアークまたは楕円のアークの検出において、ハフ変換器が概して、円のアークまたは楕円のアークの極値点、すなわち特定の方向の最も遠くに位置する点に関する情報も提供することに注意すべきである。
要約すると、ハフ変換器が個々の筆記成分の位置を記述する複数のパラメータを提供する点に注意されることができ、そこにおいて、短い中断を有する筆記成分は、1つの連続した筆記成分として記述される。このように、ハフ変換器を用いることにより、ちょっとした中断がタイプフェースの中に存在するとき、複数の個々の構成要素への文字の断片化が直接発生するという文字検出のための従来の手段の課題は防止される。ハフ変換器の使用は、これに反して、このような障害に対する相当な程度の鈍感さをもたらす。
文字記述発生器2830は、ハフ変換器から非常に限られた数の個々の筆記成分の記述(一方では、円のアークまたは楕円のアーク、および/または、他方では、直線部分)を受信する。
特定の充分な数の画像が属する円のアークを記述するか、または充分な数の画像点が属する直線部分を記述する、ハフ変換器によって確認される限られた数の筆記成分から、文字記述発生器は、確認された円のアークまたは楕円のアークを記述する簡潔な文字記述を生成する。換言すれば、文字記述発生器2830によって、位置パラメータおよび/または別のパラメータ、例えば、円のアークまたは楕円のアークを有する曲率パラメータおよび直線部分を有する方向パラメータを含む特に有利な文字の記述が形成される。このように、文字は、その自然の構成成分、すなわち一連のアーク(円のアーク/楕円のアーク)および/または直線部分によって、全体として記述される。
フォントまたは確認された基本筆記成分は、人間のユーザが効果的な方法で知らない文字を記述するのに用いる記述の形に対応する。このように、文字記述発生器2830によって与えられる文字記述2832は、それぞれ、画像2808に、または、画像の前処理されたバージョン2812に存在する文字の効果的な記述を示し、そこにおいて、記述は、好ましくは、ハフ変換器2820によって確認されるこのような成分を含むだけである。
異なるフォントの特性に対するハフ変換器の適用によって、発明のデバイス2800は、単純なおよび効率的な方法で異なるフォントに適応することができる。フォントが例えばドイツのスクリプトまたは若干のコンピュータ・フォントのような主に丸い成分から成る場合、ハフ変換器2820は、特に異なる曲率半径の円のアークの検出に適しており、それによって主に(または、代わりに、もっぱら)ハフ変換器2820によって与えられている情報2822に、アーク状筆記成分の記述が含まれる。
しかしながら、例えば、若干のコンピュータ・フォントを有する場合のように、フォントが主要部として直線を含むフォントである場合、ハフ変換器2820は、好ましくは(または、代わりに、排他的に)異なる方向の直線を検出する。
このように、文字記述発生器2830は、好ましくは現在処理されたフォントの重要な特徴に関する情報を含む。このように、文字プロバイダ2830は、データベース比較器によって処理されハフ変換器2820によって与えられる情報2822の表現を生成しなければならないだけである。これによって、文字記述発生器2833は、比較的少ない労力で実現されることができる。
データベース比較器2840による次のデータベース比較が基本成分(円のアークおよび/または楕円のアークおよび/または直線部分)の記述に基づくので、比較は効率的な方法で起こることもできる。その理由は、その中に、典型的文字が非常に限られた数の特性文字成分を含むだけであるということである。このように、フォントは、特に少ない特徴によって、例えば特性筆記成分の特徴および/またはパラメータによって記載される。データベース比較のために用いられる少ない数の成分は、データベース比較器の非常に効果的な実現という結果となり、それによって必要な計算能力は低く保たれることができ、文字検出は急速になされることができる。
それとは別に、文字は、異なる筆記成分の一定数の存在により、すでに極めて狭められることができる点に留意する必要がある。換言すれば、多くの異なる筆記成分が公知である(円/楕円のアークおよび/または直線部分)場合、非常に限られた数の文字だけが可能である。このような予備選択によって、データベース比較器2840によって実行されるデータベース比較は、通常の場合であるより実質的に効率的にされることができる。
要約すれば、特性筆記成分だけがハフ変換器によって検出されるという事実のためにデバイス2800が特に効果的な文字検出を可能にすることが決定され、それによって強く情報圧縮された情報2822が結果として得られ、それに基づいて、表現文字記述2832は低い労力で発生させることができる。このように、高性能が結果として得られ、さらに、データベース比較の高い信頼性はデータベース比較器2840によって実行されるデータベース比較の高い信頼性が得られる。
デバイス2800の個々の手段に関する詳細は、以下においてより詳細に説明される。
図29は、画像の文字を検出するための拡張デバイスのブロック図を示す。図29のデバイスは、全体が2900で示される。
デバイス2900は、基本的に画像2808に対応する画像2908を受信する。デバイス2900は、基本的に画像前処理2810に対応する画像前処理2910を含む。画像前処理2910は、好ましい実施例において、二値化、エッジ検出、文字分離のうちの1つまたはいくつかの機能を含む。
画像前処理2910は、基本的に画像の前処理されたバージョン2812に対応する画像の前処理されたバージョン2912を提供する。
画像前処理が、例えば、画像2908を受信し、(画像2908が諧調レベルとして与えられていない限り)それを諧調レベルに変換し、諧調レベル値に閾値が適用されることに留意する必要がある。画像点の諧調レベル値が初期値か最適に設定された閾値より大きいか小さいかどうかによって、画像の前処理されたバージョン2912の関連する画像点は、第1の値および/または明度に、または、第2の値および/または明度にセットされる。このように、例えば画像2908から、関連する単色画像が得られる。
好ましい実施例において、二値化のために用いられる閾値は、画像2908のおよび/または画像2908の諧調レベル・バージョンの諧調レベルのヒストグラム分布に応じてセットされる。しかしながら、他の実施例では、固定した所定の閾値が使われることもある。新規な画像が記録される場合、好ましい実施例では、二値化のために用いられる閾値が再調整される。
さらに、例えば、閾値が異なるカラー強度に直接適用される場合、好ましい実施例では、二値化は、例えば、画像2908を諧調レベル画像に変換する中間のステップなしで実施されることができる点に留意すべきである。
別の好ましい実施例では、画像前処理2910は、二値化に加えて例えばエッジ検出を含む。エッジ検出によって、例えば、二値化によって発生する単色画像のエッジが検出される。換言すれば、単色画像の2つの色の間の移行は、エッジとしてマークされる。ハフ変換器が特によくエッジ画像に対処することができるので、これは特に有利である。
それとは別に、エッジ検出が、画像2908を用いて直接に、すなわち、二値化を用いずに行われることができる点に留意する必要がある。
更なる好ましい実施例において、画像前処理2910は、文字分離を含む。ここで、個々の文字は、分離される。例えば、異なる確認されたエッジが所定の距離より大きい距離を含む場合、例えば、2つの別の文字が存在すると仮定される。例えば、文字が原則として最小距離で各々から分離されるときに、それは有利である。このように、文字分離によって、例えば1つの画像から、複数の画像部分が得られ、そこにおいて、各画像部分は、好ましくは1つの個々の文字を含むだけである。異なる方法が詳細にここで説明されていない文字分離のために存在する点に留意する必要がある。
全体的に、このように画像前処理2910によって、画像2909の前処理されたバージョン2912が得られる。さらに、デバイス2900は、ハフ変換器2920を含む。ハフ変換器2920は、図28において記載されていたハフ変換器2820と同じ機能を有する。このように、ハフ変換器2920の出力で、確認された筆記成分に関する情報が得られ、そこにおいて、確認された筆記成分は、円のアーク、楕円のアークおよび/または直線部分であってもよい。
さらに、デバイス2900は、筆記ライン検出器2926を含む。筆記ライン検出器2926は、ハフ変換器2920によって与えられる確認された筆記成分に関する情報2922を受信し、画像2908における、または、画像の前処理されたバージョン2912における筆記ラインに関する情報2928を提供する。
筆記ライン検出器2926は、ハフ変換器2920によって与えられる確認された筆記成分に関する情報2922に基づいて、円のアークまたは楕円のアークのかなりの数の端部、および/または特に多数の直線部分の端部が位置する画像のラインを検出する。
筆記ライン検出器2926の機能に関する詳細は、図31および32を参照して後述する。
それとは別に、筆記ライン検出器2926は、オプションとして省略されることもできる点に留意する必要がある。
デバイス2900は、その機能において、基本的に文字記述発生器2830に対応する文字記述発生器2930を含む。しかしながら、文字記述発生器2930は、文字分離2932を生成するために、筆記ライン検出器2926がある1つの好ましい実施例において、筆記ライン検出器2926によって与えられる画像における筆記ラインに関する情報2928、および、ハフ変換器2920によって与えられる確認された筆記成分に関する情報2922の両方を使用するように構成される。
文字記述発生器2930は、好ましくは、文字記述2932を生成し、その結果、文字記述2932は、情報2928によって記述されている筆記ラインに関する情報2922によって記述されている筆記成分の相対位置を記述する。
このように、特に有利な文字記述2932が得られ、そこにおいて、更に詳細に記述される筆記ラインが考慮される。筆記ラインに関する情報2928を考慮し、好ましくは確認された筆記ラインに関して、確認された筆記成分のパラメータ2922を示す対応する文字記述2932は、文字の回転または寸法のスケーリングに関して鈍感である。
デバイス2900は、文字記述2932を受信し、その機能に関して基本的にデバイス2800のデータベース比較器2840に対応するデータベース比較器2940を含む。データベース比較器2940は、好ましくは、比較文字2942を受信するために、データベース2944に連結される。それから離れたデータベース比較器2940は、検出された文字の文字コード2946を提供する。
さらに、好ましい実施例において、デバイス2900は、確認された文字の信頼性をチェックするためのオプションの手段2958を含む。確認された文字の信頼性をチェックするための手段2958は、オイラー連結数計算機2960を含む。オイラー連結数計算機2960は、画像2908または画像の前処理されたバージョン2912を受信して、画像2908の画像内容または画像の前処理されたバージョン2912のオイラー連結数を含むオイラー連結数情報2962を提供する。さらに、オイラー連結数は、時々文献のオイラー指標と呼ばれて、画像(または画像の前処理されたバージョン)における対象の数および画像におけるホールまたは囲まれた領域の数の間の差を記述する。オイラー連結数計算機2960によって実行されるオイラー連結数の計算に関する詳細は、以下に記載される。
さらに、文字検出の信頼性を決定するためのデバイス2958は、オイラー連結数2962を受信するためにオイラー連結数計算機2960に連結される文字試験器2970を含む。さらに、文字試験器2970は、検出された文字に属する比較オイラー連結数2972を得るために、データベース比較器2940に連結される。比較オイラー連結数2972は、データベースの入力に基づいてデータベース比較器2940によって提供される。さらに、文字試験器2970は、文字信頼性情報2974を提供する。ここで、それぞれ、画像2908から、または、画像の前処理されたバージョン2912からオイラー連結数計算機2960で決定される実際のオイラー連結数2962が確認された文字に属するデータベース2944からとられた比較オイラー連結数2927に対応するときに、文字試験器2970は、好ましくは、検出された文字の高い信頼性を示す。それとは対照的に、文字信頼性情報2974によって、実際のオイラー連結数2962および比較オイラー連結数2972間に偏差が存在するときに、文字試験器2970は、好ましくは、確認された文字の低い信頼性を示す。
以下に、文字の検出の手順が、図30a、30、31、32a、32b、32c、33、34および35を参照して説明される。
図30aは、この点で3つの文字「a」「c」「d」の図解図を示す。ここで、文字「a」「c」「d」において、例えば、円のアークまたは楕円のアークの極値点は、それぞれ、直線部分の中心点と同様に示される。前述の点は、「x」によって示される。アークの極値点が所定の方向において最も遠いアークの点であることに留意する必要がある。文字が(例えば直角の)xy座標システムにおいてプロットされると仮定される場合、アークの極値点は、例えば、正のx方向、負のx方向、正のy方向および負のy方向において最も遠いアークの位置である。xy座標システムは、さらに、図30において3010で示される。
さらに、文字「a」の第1の(上の)アークの極値点は、3620で示される。第2の左のアークの極値点は、3622で示される。第3の下のアークの極値点は、3624で示される。第1の直線部分の中心点は3626で示され、第2の直線部分の中心点は3628で示される。アークは少なくともおよそ円形または楕円形の線の部分である点に留意する必要がある。換言すれば、ハフ変換器は、文字「a」の線の経路が円のアークまたは楕円のアークによる第1の極値点3620の周囲の状況に近似し、さらに、文字「a」の線の経路が、例えば、直線部分による線の中心点3626の周囲の状況に近似することを検出する。
文字「a」に対するのと同様に、文字「c」および「d」に対しても、円のアークの近似および/または楕円のアークの近似の極値点および直線部分の近似の中心点が、「x」によってマークされる。
図30bは、文字「a」の単純な記述の表の図解図を示す。ここで、デバイス2800のハフ変換器2830および/またはデバイス2900のハフ変換器2930が、例えば、異なる曲線の極値点の位置を確認することができ、異なる曲線の中心点の位置を更に確認することができると仮定される。
このようにして、図30aの文字「a」に関して、3つのアークと2つの直線部分が確認される。このように、図30bによる文字「a」の記述は、3つのアークと2つの直線部分に関する記述を含む。極値点3620の近くの第1のアークは下方へカーブするアークであり、その結果、関連する記述は、例えば、下方への湾曲を示す特性および/またはパラメータを含む。さらに、記述は、好ましくは極値点3620の位置に関する情報を含む。位置は、好ましくは、関連する座標x,yによって示されることができる。さらに、極値点3620の近くの第1のアークの記述は、オプションとして、第1のアークの曲率半径rの表示を含む。
同様に、第2の極値点3622の周囲で文字「a」に近似する第2のアークの記述は、アークが右への湾曲を有するという事実に関する情報を含む。第2のアークの記述は、座標x、yおよびオプションとして第2のアークの曲率半径rに関する情報の形で第2の極値点3622の位置を再び示すことができる。第3の極値点3624の周囲において文字「a」に近似する第3のアークに対して与えられる対応する記述は、図30bに示される。しかしながら、極値点3620、3622、3624において文字「a」に近似するアークは、他のパラメータによって記述されてもよいことに留意すべきである。
それとは別に、極値点は、好ましくは、必ずしも広範囲の極値点である必要のない局部的な極値点であるという点に留意すべきである。
文字「a」の2つの直線部分に関して、例えばハフ変換器2820、2920によって、方向に関する情報が提供される。このように、中心点3626を有する第1の直線部分の記述は、例えば、第1の直線部分が右上に行くことを示すことができる。さらに、記述は、線部分が水平線と比較して、傾斜角度をオプションとして示すことができる。さらに、記述は、例えば、座標x,yによって、対応する線部分の中心点3626の位置を示すことができる。さらに、第1の直線部分の記述は、パラメータ1の形で第1の直線部分の長さに関する情報を含むことができる。しかしながら、例えば始点または終点の座標のように、他のパラメータが記述のために用いられることができる。
図30bは、中心点3626を有する第1の直線部分および中心点3628を有する第2の直線部分を含む直線部分の2つの記述を示す。このように、ハフ変換器3820、2920によって与えられる情報に基づいて、図30bから、文字の効果的な記述が生成されることが、図30bから知ることができる。
以下において、確認された筆記成分に関する情報2822、2922の好ましい説明を得るために、どのようにハフ変換器によって与えられる情報がデータベース比較器2840、2940における比較のために更に処理されることができるかについて説明される。しかしながら、簡単な実施例において、ハフ変換器2820、2920によって与えられる情報が直接データベース比較器2840に供給されることができる点に留意する必要がある。
図31は、ドイツのスクリプトの文字および文章の対応するラインの図解図を示す。図31の図解図は、全体が3100で示される。図解図3100は、4つの特性ライン、すなわち下のライン3110、ベースライン3120、センターライン3130および上のライン3140を示す。さらに、概略図解図3100は、レタリング「abcdefg」3150および4つの大文字「ABCJ」3160を示す。図解図3100から、小文字「a」「c」および「e」は、少なくとも観念的にベースラインおよびセンターラインの間に位置して、これらの線に接触する。大文字「A」「B」および「C」と同様に小文字「b」および「d」は、ベースライン3120および上のライン3140の間に位置して、概してベースライン3120および上のライン3140に接触する。しかしながら、文字「f」は、下のラインおよび上のラインの間に位置して、下のライン3110および上のライン3140に接触する。同じことは、大文字「J」にもいえる。
このように、筆記ライン検出器2926は、例えば、情報2928として、筆記ライン3110、3120、3130、3140の位置、すなわち、例えば、前述の筆記ラインの方向に関する情報を提供する。
それとは別に、筆記ライン検出器は、筆記ラインを決定するために、お互いに関して(例えば、筆記ラインが各々に対して平行で、特定の相対的な間隔を有するという事実に関して)筆記ラインの位置についての前知識を使用することができる。
以下に、図32a、32bおよび32cを参照して、どのようにして特に有利な文字記述が決定された筆記ラインと関連して極値点の位置を記述することによって決定されることができるかに関して記載されている。この目的のために、図32aは、下のライン、ベースライン、センターライン、上のラインからなるラインシステムにおける文字「a」の図解図を示す。図32aによる図解図は、全体が3200で示される。図解図3200は、下のライン3210、ベースライン3212、センターライン3214および上のライン3216を示す。文字「a」は、ベースラインおよびセンターラインの間に配置される。文字「a」は、全体が3220で示される。文字「a」の第1の、一番上のアークは、極値点3230を含む。図32aの実施例の極値点3230は、センターラインからの極値点3230の間隔が、絶対的に(絶対的な間隔に関して)または相対的に(2つのベースライン間の間隔に対応して)示される所定の閾値より小さいときに、およそセンターライン3214にある、および/またはセンターライン上にあるとみなすことができる。ここで、例えば、基本的に適宜、x座標(x=0)は、第1のアークの極値点3230と関連がある。
文字「a」は、その極値点3232がベースライン3212とセンターライン3214との間に位置する第2の左のアークを含む。さらに、x座標(x=−0.5)は、基準点として選ばれる第1の極値点3230と関連して位置(または、水平位置またはx位置)を記述する第2の極値3232と関連がある。さらに、文字「a」は、その極値点3234がベースライン3212上に位置する第3の底部のアークを含む。換言すれば、ベースライン3212からの第3の極値点3234の距離は、所定の閾値より小さく、そこにおいて、所定の閾値は、(2つの筆記ラインに対応して)絶対的な数値または相対的な数値として、決定あるいは予め定義されることができる。
さらに、第3の極値点3232も、基準点と関連した位置を記述するx座標を含む。図の例では、x=−0.1が適用される。
さらに、同様の情報が、文字「a」の別のコンポーネントに(そして、他の全ての文字に)、例えば、文字「a」の右のほぼ直線部分に与えられる。
例えば、下のライン3210およびベースライン3212間の範囲が第1の区間(区間I)として定義されることができる点に更に注意される。ベースライン3212およびセンターライン3214間の範囲は、第2の区間(区間II)として、更に定義されることができる。センターライン3214および上のライン3216間の範囲は、第3の区間(区間III)として、更に定義されることができる。
区間を制限する筆記ラインの距離に応じて、0および1の間の値が区間の中の位置と関係していてもよい点に更に注意され、そこにおいて、その値は、垂直方向位置または相対的なy位置を記述する。換言すれば、特定の位置(例えば、アークの極値点、直線部分の始点、直線部分の中心点または直線部分の終点)が区間の範囲内に位置する場合、ほぼ0の相対的な位置座標は、その点が区間の初めに位置するときのこの点に関連させることができ、更に、ほぼ1の相対的な位置座標は、その点が、例えば、区間の終わり近くに位置するときの点に関連させることができる。例えば、対応する点がベースラインおよびセンターラインの間に位置するが、ベースの非常に近くに位置する場合、ゼロの位置パラメータはその点と関係している。その点がベースラインおよびセンターラインの間に位置するが、センターラインの近くに位置する場合、例えば、ほぼ1の位置パラメータが位置と関係させることができる。それとは別に、例えば、0.5の位置パラメータは、ベースラインおよびセンターラインの間の中央にある点と関係させることができる。しかしながら、それが、位置パラメータの線形の関連性を選択することを必ずしも必要とするというわけではない。また、0および1の間の区間に対する位置パラメータの境界は必要でないが、一例として示しただけである。むしろ、相対的な位置パラメータがベースラインに関連がある点(アークの極値点、直線部分の始点、直線部分の終点または直線部分の中心点)と関係していることは、本発明の一実施例の一般の効果である。
図32bに関して、以下において、文字のための記述の典型的な形が与えられる。アーク(すなわち、例えば円のアークまたは楕円のアーク)に対して、記述は、アークが上方へ、下方へ、左に、または、右にカーブするかどうかについて示す方向に関する情報を含むことができる。さらに、アークに対する記述は、極値点の位置に関する情報を含むことができる。極値点の位置は、例えば、第1の方向において(例えば、x方向とも呼ばれるような筆記ラインに沿った方向において)絶対的または相対的な位置として示されることができる。しかしながら、x方向の位置に関する相対的な情報は与えられることができ、例えば、文字の類似点に関する位置を示す。類似点は、例えば、アーク、直線部分の始点、直線部分の終点または直線部分の中心点である。同様に、基準点は、例えば中心点、特定の方向における最も遠い点または他の特性点などのように、文字の他の選択された特性点でもよい。さらに、アークの記述は、好ましくは、筆記ライン3210、3212、3214、3216と関連して、位置yに関する情報を含む。筆記ラインと関連する位置に関する情報は、例えば、区間における点が2つの筆記ラインの間に位置するか(所定の許容範囲内で)、または筆記ライン上に位置するかどうかを示すことができる。さらに、情報は、筆記ラインの間のどの間隔で点が与えられるかについてオプションとして示すことができる。
さらに、筆記ラインと関連する位置に関する情報は、点(例えば、所定の許容範囲の中で)が筆記ラインの1つにあるかどうか、もしそうであれば、どの筆記ライン上に点が位置するのかに関する情報を含むことができる。さらに、上述のように、筆記ラインと関連するy方向の位置のより正確な記述は、例えば0および1の間の値の形で与えられることができる。また、それとは別に、x方向の位置は、1つまたは2つの基準点に関して、絶対的にまたは相対的に示されることができる。
さらに、アークに関する情報は、アークの曲率半径に関する情報を含むことができる。しかしながら、曲率半径に関する情報は、オプションであると考えられている。
さらに、文字の記述は、直線部分に関する情報を含むことができる。例えば、直線部分の方向は、文字に関する情報に含まれることができる。このように、直線部分の方向は、例えば、水平線に関しておよび/または筆記ライン3210、3212、3214、3216に関して角度の表示によってされることができる。さらに、確認された直線部分の位置は、例えば、直線部分の始点の、および直線部分の終点の位置が記載されているという事実によって与えられることができる。それに代わるものとして、直線部分に関する情報は、直線部分の長さに関する、および直線部分の中心点に関する情報を更に含むことができる。直線部分に関する前述の情報は、好ましくは、筆記ラインに関して選択される。
文字記述発生器2930が、ベースライン検出器2926によって与えられる情報を使用し、更にハフ変換器2920によって与えられる情報を使用している情報2932として文字の相対的な記述を提供することができることに注意する必要があり、その結果、情報2932は、筆記ラインと関連して文字のアークおよび/または直線部分の位置を記述する。
図32cは、図32aに示す文字「a」の典型的な記述を示す。図32cに示す記述3280による文字「a」は、下方へカーブする第1のアークを含み、その極値点3230がx座標x=0を含み、センターライン3216に更に配置される。さらに、文字「a」は、右にカーブおよび/または屈曲する第2のアークを含み、その極値点はx座標x=−0.5を含む。第2のアークの極値点3232は、さらに、第2の区間(区間II)に配置される。極値点3232のy位置は、例えば、y=0.5として正確に示されることができ、それによって極値点3232がベースラインおよびセンターラインの間にあることが表現される。さらに、文字「a」は、上方へカーブする第3のアークを含み、その極値点はx座標x=−0.1を含む。さらに、第3のアークの極値点3234はベースライン3212に配置される。文字「a」の右側の直線部分は、記述3280によれば、右上に行って、水平線に関しておよび/または筆記ラインに関して80°の角度を有する。直線部分の始点は、x=0.4のx座標を含み、第2の区間、すなわちベースラインおよびセンターラインの間に配置される。直線部分の終点は、0.5のx座標を含み、例えば、センターライン3214上に配置される。例えば、対応する位置情報は、文字記述発生器2930によって、符号化され、順序付けられ、配列された形でデータベース比較器2940に与えられる。
以下において、図33および34を参照して、文字記述発生器によって(すなわち、例えば、文字記述発生器2830によって、または、文字記述発生器2930によって)、特にデータベース比較器2840によって処理されることに適している情報2822、2932がどのようにして得られることができるかについて記載される。
この目的のために、図33は、本発明の一実施例による発明の文字記述発生器のブロック図を示す。図33による文字記述発生器は、全体が3300で示される。例えば、図28による文字記述発生器2830または図29による文字記述発生器2930に対応する文字記述発生器3300は、確認された筆記成分、すなわち、例えば、確認された円のアークまたは確認された楕円のアークまたは確認された直線部分に関する情報3322を受信する。情報3322は、例えば、情報2822または情報2922に対応する。しかしながら、別の実施例で、情報3322は、筆記ラインに関する情報2928に基づいて、および、確認された筆記成分に関する情報2922に基づいて形成されることができ、したがって、筆記ラインと関連して確認された筆記成分の位置を記載する。本発明の一実施例によれば、情報3322がパラメータによって1つの(確かな、先の処理で決定された)規則にしたがって異なる筆記成分を記述するのは、ここでは重要である。文字記述発生器3330は、情報3322によって記述されている筆記成分の全体から選択された筆記成分の本当のサブセットを選択するオプションとしての筆記成分選択器3340を含む。例えば、選択される筆記成分の数は、外部から与えられる。さらに、選択は、例えば、ランダムに起こることができる。あるいは、選択された筆記成分のサブセットが、例えば、アークの第1の所定の数および直線部分の第2の所定の数を記述するように、筆記成分選択器3340が選択された筆記成分のサブセットを選択するように、あらかじめ定義されていてもよい。選択は、ランダムに、または、所定の規則に従って起こることができる。
筆記成分組合せ発生器3350は、筆記成分選択器3340によって選択された文字のサブセット3342の記述を受信する。別の方法として、筆記成分組合せ発生器3350は、例えば、筆記成分選択器が省略されたときに、情報3322を受信することもできる。
筆記成分組合せ発生器3350は、それぞれ、情報3342または情報3322によって記載される筆記成分の異なる組合せを生成し、情報3352としてそれを出力する。例えば、ここの情報3352は、例えば、文字記述2832または文字記述2932に対応し、例えば、データベース比較器2840、2950に供給される。
ここで筆記成分の異なる組合せは、筆記成分の異なる配置である。例えば、情報3322が関連する位置パラメータを有する3つのアークおよび1つの直線部分を記述する場合、筆記成分組合せ発生器3350は、例えば、異なる組合せを生成することができる。第1の組合せは、例えば、アーク1、アーク2、アーク3、直線部分1の順序で筆記成分を記述する。第2の組合せは、例えば、上記のものと異なる順序の情報3322によって記載されている筆記成分、アーク1、アーク3、アーク2、直線部分1を記述する。筆記成分組合せ発生器3350によって発生する第3の組合せは、例えば、更に別の順序および/または配置の情報3122によって記載されている筆記成分、アーク1、直線部分1、アーク2、アーク3を記述する。
換言すれば、筆記成分組合せ発生器3350は、筆記成分が異なる順序で配置される情報3322に基づいて、異なる順序に配置された筆記成分のセットを形成する。どのような順序で筆記成分が配置されるかは、例えば、筆記成分の組合せ発生器3350に含まれる規則で決定される。あるいは、筆記成分組合せ発生器3350は、あらゆる可能な順序を使用することができる。
このように、筆記成分組合せ発生器3350は、全体として、筆記成分の1つのセットに基づく関連するパラメータによって記述される筆記成分のいくつかの異なって順序づけられたセットを形成する。このように、データベース比較器2840、2940によって実行されるデータベース比較は、個々の筆記成分が情報3322に記述されている順序とは独立したものである。したがって、文字の識別は、情報3322における筆記成分の記述の順序とは独立したものであり、それは特に信頼性が高いフォント検出が成し遂げられる方法である。
図34は、本発明の実施例における発明の文字記述発生器のブロック図を示す。図34による文字記述発生器は、全体が3400で示される。この点で、文字記述発生器3400が基本的に情報3322に対応する確認された筆記成分に関する情報3422を受信する点に留意する必要がある。図34において例示される実施例において、例えば、情報3422は、それぞれの位置パラメータが関連する5つのアークおよび2つの直線部分に関する情報を含む。情報3422の1つの例は、図35を参照して、以下において更に詳細に記載される。
例えば、文字記述発生器2830または文字記述発生器2930に取って代わることができ、または、文字記述発生器2830、2930の一部となることもできる文字記述発生器3430は、筆記成分順序付け手段3440を含む。例えば、筆記成分順序付け手段3440は、情報3422に基づいて情報3452を生成し、そこにおいて、筆記成分は、それらが情報3452によって再生される順序で連続するベースラインを記述するように順序付けされる。換言すれば、筆記成分順序付け手段3440は、特定の筆記成分に対する次の筆記成分を確認し、その結果、特定の筆記成分と次の筆記成分とが連続した筆記線を形成する。このように、筆記成分順序付け手段3440は、例えば、いくつかの筆記成分の終点を確認して、次の筆記成分になるものとして2つの筆記成分を検出し、さらに、第1の筆記成分の終点と第2の筆記成分の始点との間の間隔が所定の範囲より小さい。このように、筆記成分順序付け手段3440は、全体として、例えば、データベース比較器2840、2940のための入力情報として役立つことができる順序付けられた情報3452を提供する。
典型的な順序付けられていない記述が図34において3460で示され、筆記ラインの経路にしたがって順序付けられた図解が3462で示される。
以下に、画像の文字を検出する発明の方法が示される。この目的のために、図36は、画像の文字を検出する発明の方法のフロー図を示す。図36による方法は、全体が3600で示される。
ステップ3610において、方法3600は、確認された筆記成分を確認するために画像または画像の前処理されたバージョンを変換するハフ変換を含む。さらに、方法3600は、第2段階3620において、確認された筆記成分に基づいて文字記述を生成することを含む。さらに、第3のステップ3630において、方法3600は、文字記述を複数の比較文字記述と比較し、比較の結果として、その文字コードに検出された文字の文字コードを提供する。
方法3600が発明概念に関して(すなわち発明のデバイスに関して)記載されたすべてのそれらのステップによって補充されることができる点に更に注意される。
発明のデバイスまたは発明の方法は、ハードウェアにおいて、または、ソフトウェアで行うことができる。実現は、デジタル記憶媒体、例えば対応する方法が実行されるように、プログラム可能なコンピュータシステムと協同することができる電子的に読み込み可能な制御信号を有するフレキシブルディスク、CD、DVD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリなどにおいてなされてもよい。一般に、本発明は、コンピュータ・プログラム製品がコンピュータにおいて実行されるとき、発明の方法を実行するための機械で読み取ることができるキャリアに格納されるプログラムコードを有するコンピュータ・プログラム製品にある。換言すれば、本発明は、コンピュータ・プログラムがコンピュータにおいて実行されるとき、発明の方法を実行するためのプログラムコードを有するコンピュータ・プログラムとして実現されることができる。
要約すると、本発明が文字検出の特に効率的な方法を記載する点に注意されなければならない。
この点で、町標示、町名または速度制限を読むことがフォント検出の重要な態様である点に留意する必要がある。このように、例えば、(全ての文字および数字のいくつかのフォントタイプにおいて)多くの文字および数字は、鉛直線、水平線、凹線および凸線から組み立てられる。しかしながら、少なくとも、複数のフォント型の文字および数字は、鉛直線、水平線、凹線および凸線を含む。
例えば、文字「S」は、文字「O」および/または「o」のように、4つの極値を有する。しかしながら、文字「S」は、曲率に関して、および、各々に関する極値の相対距離において、文字「O」と異なる。
前述の発見に基づいて、文字検出システムは開発されることができる。文字「W」「Z」「A」「K」「Y」「X」「V」「N」および/または「M」の斜線の検出のために、例えば、A.Brueckmann、F.KlevenzおよびA.Wuenscheによる「2D―傾斜およびサイン波形状検出のためのニューラルネット(A neural net for 2D−slope and sinusoidal shape detection)」(インターナショナル・サイエンティフィック・ジャーナル・オブ・コンピューティング、第3巻、エディション1、ウクライナ、2004、第21頁〜第25頁、に公開)に記載されていているように、好ましくは、ヒューベル―ウィーゼル・バー検出器が用いられることができる。アーク(例えば、円または楕円のアーク)の検出、および直線部分(例えば、斜線)の検出は、本発明の一実施例において、異なるプログラミングだけで、同じアーキテクチャ「二重ハフIPコア」に基づくことができる。換言すれば、例えば、第1の設定状態がアークを検出することが可能で、第2の設定状態が直線を検出することが可能であるように再設定可能なハフ変換器を用いることができる。
本発明の一実施例では、見つかった極値の位置は、例えば小学一年生の筆記帳のように、ラインシステムと関係している。かくして、本発明の一実施例において、例えば小文字「d」「c」を有するベースライン、センターライン、および、例えば大文字「C」「K」を有する上のラインが決定される。
本発明の一実施例では、文字検出に属する極値だけでなく、全ての極値は、情報「凸/凹 上/下」「凸/凹 左/右」を含む。換言すれば、1つの好ましい実施例で、例えば、アークの湾曲に関する情報は、決定され、後で評価される。
ソフトウェアシミュレーションにおいて(または、一般に、ハフ変換を実行するとき)、例えば最大曲率半径および最小曲率半径の間の範囲が設定されることができ、そこにおいて、例えば、最大曲率半径および最小曲率半径の間の曲率半径を有するアークだけが、ハフ変換器によって検出される。
さらに、ソフトウェアシミュレーションにおいて、またはハフ変換を実行するときに、それぞれ、パラメータ「和でない遅延線(DelayLines not sum)」の助けを借りて、ハフ変換器および/またはハフ分野のどの遅延線が和に貢献しないかを決定することができる。このように、極値のまわりのラインが和に貢献しないように細かく設定することができるが、さもなければあまりに頻繁に直線が計数されおよび/または決定されるからである。
換言すれば、ハフ変換器において、曲線の極値の近傍に配置される線の部分がハフ変換の結果に貢献しないことが成し遂げられてもよい。
このように、本発明の一実施例において、画像の曲線に関して(例えば、円形にカーブする線または楕円形にカーブする線に関して)、特徴ベクトルは形を有する結果となる(極値のx、y位置;負の最大曲率半径、正の最大曲率半径の値域の曲率半径)。換言すれば、画像の曲線に関する特徴ベクトルは、曲率半径と同様にアークの極値点の位置を記述するが、曲率半径はその絶対値に関して最大曲率半径より小さい。
さらに、特徴単一区分アルゴリズムが存在する。この点において、例えば、ハイデルベルクのループレヒト・カールス大学におけるK.H.ノフツおよびR.レイの文献、またはブダペストのパーズマーニ・ペーテル・カトリック大学におけるT.ロスカの文献などが参照される。
例えば、文字「c」が間に3つの極値を有し、1つはセンターライン上にあり、1つはベースライン上にあり、1つはその間にある点にここで注意される。この場合、各々に関する極値の相対的なx位置は重要である。
好ましい実施例では、分類は、min(X−Xi)2の古典的変分法に従って実行される。あるいは、分類は、V.フェラーリによるラベリング方法に従って実行される。この点における詳細について、V.フェラーリその他によって公開された「輪郭部分ネットワークによるオブジェクト検出(Object detection by contour segment networks)」(公開:コンピュータ・ビジョン(ECCV)のヨーロッパ会議、グラーツ、2006年5月)が参照される。
二重のクロスチェックのために、または、少なくとも文字検出をチェックするために、本発明の一実施例において、オイラー連結数の使用は明らかである。オイラー連結数は、以下の通りに定められる:
連結数=オブジェクトの数−囲まれたホールの数
ここで、オブジェクトは、画像点またはピクセルの連続領域と定義される。
連結数は、従って2×2検索マスクの決定から、ピクセルグリッドにおいて計算される。
ラテンアルファベットの異なる文字に対して、以下が適用される:
「B」に対して:K=−1;
「Q」、「R」、「O」、「P」、「A」に対して:K=0;
残りの文字に対して、または、残りに対して:K=1
さらに、図37は、WinDelayプログラムを用いたフォント検出の超微細構造のスクリーン図解図を示す。
図37の図解図は、全体が3700で示される。図解図3700から、(例えばWinDelayプログラムによって)左下のコンマがマークされることがわかる。さらに、文字「G」、文字「S」および/または「O」がマークされる。文字厚やセリフさえ、決定されることができる。図解図3700が得られる入力画像は、(例えば、ウェブカメラを用いて)カメラを有するスクリーンによって記録されるテキストである。
以下に、文字検出の方法は、実施例を参照して段階的に述べる。第1ステップにおいて、方法は、楕円の確認(また、楕円ファインダと呼ばれる)と類似している。例えば閾値のようなパラメータは、ハフ変換の機能を提供するプログラム「WinDelayLine」に設定されることができる。
文字検出は、以下のように、段階的に行われる:
1)カメラで画像を記録する。あるいは、画像は、例えば、スキャナによって生成されるか、他の方法で得られる。
2)閾値を設定;二値化(諧調レベルのヒストグラム分布に従って適応可能であるべきである);ビデオについてxフレームの後により多く、また、各画像に対する最高で、最適な閾値を再調整する;標準画像処理。
3)輪郭を見つける;輪郭ファインダ・アルゴリズムは、原則としてエッジ検出アルゴリズムである形態学的オペレータから構成されるアルゴリズムである。
4)ハフ変換;ハフ変換(例えば、ソフトウェア「WinDelayLine」によって実行される)の助けを借りて、画像の極値は、(例えば赤で)マークされて見える。各極値は、x,y位置によって示され、さらに曲率値を有する。ハフ変換によって生じるマークされた極値の集合(また、「赤い雲」とも呼ばれる)は、パラメータ・コア・サイズ、最小曲率半径、最大曲率半径、和でない遅延のバリエーションに応じて、多かれ少なかれ密集していてもよい。この点において、J.カッツマン(イルメナウ大学における論文、ドイツ、2005)による論文「Echtzeitfaehige,auf der Hough―Transformation basierende Methoden der Bildverarbeitung zur Detektion von Ellipsen」が参照される。
5)min(integral)(X_i−t_j)2に従って、ハミルトンの変化計算による分類。
換言すれば、例えば、特徴ベクトルおよび比較特徴ベクトルの間の偏差は、最小化される。
アルゴリズムは、例えば、楕円の検出のために以下の通りに機能する:
すべての可能な4点対のリストを準備する;楕円を4の各組合せに適応させて、楕円パラメータを決定して、適応した楕円から測定位置の偏差を形成する。小さい偏差(または最小偏差)に従って、4の組合せの減少性リストを準備する。
しかしながら、ステップ5)は、オプションであると考えられる。
6)文字および数字は、線およびアークから成る。ここで、描かれている曲線の法則は、関心をもたれなければならない:各機能は、ノードおよび二次導関数によって近似されることができる。これは、制限されたデジタル・ケースにおいて、真であるだけである:垂直および水平の線は見つかる、また、円は問題ではない、しかし、異なる傾斜の直線については、方法はよく機能しない。ここで、例えば、ソフトウェアWinDelayLineで、または、ハフ変換で、それぞれ、例えば、A.Brueckmann、F.KlefenzおよびA.Wuenscheによる「2D傾斜およびサイン波形状検出のためのニューラルネット(A neural net for 2D slope and sinusoidal shape detection)」(公開:インターナショナル・サイエンティフィック・ジャーナル・オブ・コンピューティング 3(1) 第21〜26頁、2004年)に記載されていているように、直線ハフ・ファインダが用いられる。
このように、方向選択性の完全なコンピュータの神経科学的なヒューベル−ウィーゼル解が提供される。
7)輪郭記述言語の多くのテンプレートを形成する。例えば、V.Ferrariその他による「輪郭部分ネットワークによるオブジェクト検出(Object detection by contour segment networks)」(公開:コンピュータ・ビジョン(ECDB)のヨーロッパ会議、グラーツ、2006年5月)において示されているように、輪郭記述言語が使われることができる。
典型的な説明は、文字「p」に関してここで与えられる:まっすぐな下方への線;下方への湾曲を有する3つの極値、湾曲は左側に曲がっている、上方へ屈曲する角部。
位置に対する規定値(例えばセンターラインの下の、または、センターラインの上の位置)が許容差範囲において維持されることになっている、そして、「p」ラインが円の3つのアークの左側に位置されなければならないという強制的な状態の下で、すべての4点組合せ対を直線成分および3つのアーク成分から形成する。すべての文字および数字に対して(少なくとも複数の文字または数字に対して)、それらの特性テンプレートが生成され、すべての組合せ対がテンプレートと適合することになっている。最小値が結果である。
換言すれば、4点は、アークの極値または直線部分の特性点(例えば出発点、中央点または終点)の特性点を示すことで決定され、そこにおいて、特定の規定位置関係は、維持されることになっている(例えば、センターラインの上下の位置、または既存の湾曲の関係)。
さらに、V.Ferrariその他による「輪郭部分ネットワークによるオブジェクト検出(object detection by contour segment networks)」に示されているように、方法は適用されることができる。対応する方法は、以下の通りに要約されることができる:オブジェクトが線および円のアークから組み立てられる場合、どのようにオブジェクトが組み立てられるかを記載する。説明は、例えば以下の通りでもよい:角部;上方へのライン、yセンチメートル;下方へのライン、xセンチメートル;曲率半径rを有する湾曲のアーク。このテンプレートは、そこにおいて、マークされた点に交差して異なる方向(「十字に交差する」)にシフトされる(画像において確認される極値;また、「赤い点」呼ばれる)。「min(テンプレート・ベクトル−赤い点ベクトル)」を形成する。換言すれば、テンプレート・ベクトルと、特徴を示しているか、または確認された極値を示すベクトル(「赤い点ベクトル」)との間の偏差を決定する。最高の適合がある所で、オブジェクトがあると仮定される。
以下において、オイラー連結数がどのように決定されることができるかが、さらに説明される。この点において、10の無料送達郵便物の通知書に用いられるレナード・オイラーは、第1に連結数を決定することであったことに注意される。彼のスクリプトはラテン語であり、彼の公式は:
連結数Kは、オブジェクトの数引くホールの数に等しい。
ピクセルグリッドのコンピュータシステムのアプリケーションのために使われるという事実の解釈において、これは次のことを意味する:
オブジェクトは、画素の連続領域(また、画素領域と呼ばれる)として定義される。例えば、オブジェクトは、黒い画素の連続画素領域として定義されることができる。画素の連続領域(画素領域)は、例えば白い画素の形で、ホールおよび/またはエンクロージャを含むこともできる。ここで、ホールは、黒い画素の境界のエンクロージャとして定義される。換言すれば、ホールは、例えば、他の色の画素(例えば黒い画素)に囲まれている第1の色の画素(白い画素)である。
以下において、連結数がどのように部分的な2×2オペレータに基づいて決定されるかが記述される。この目的のために、どのくらいの頻度で2×2パターン
がピクセルイメージに存在するかがカウントされる。
さらに、どのくらいの頻度で2×2パターン
が画像に存在するかがカウントされる。
それから、決定された数は各々から減算され、この数(例えば結果)が連結数を示す。
この手段を文字に適用して、大文字の「B」は連結数K=−1を有し、文字「a」「b」「d」「e」「q」「o」「p」および「R」はf連結数K=0を有し、残りの文字その他の文字(例えば、ラテンアルファベット)は連結数1を有する。
あるいは、他のフォント表示において、文字「A」「D」「O」「P」「Q」「a」「b」「d」「e」「g」「o」「p」および「q」は連結数0を有すると決定することができる。
正しい文字が見つかったかどうか、オイラー連結数はこのように二重クロスチェックとして役立つことができる。
要約すると、本発明が文字検出に特に有利な概念を提供すると言うことができる。
図38は、本発明の一実施例における画像の道路標識を確認するための発明のデバイスを示す。図38によるデバイスは、全体が3800で示される。デバイス3800が画像1010を受信することに注意されたい。さらに、図10に示すデバイス1000と同様に、デバイス3800は、任意のエッジ検出器1020を含む。同様に、デバイス3800は、ハフ変換器1030を含む。エッジ検出器1020およびハフ変換器1030は、その機能に関して図10に記載されている手段に対応する。
さらに、デバイス3800は、少なくとも1つの形状検出器1040または1つの楕円検出器1660を含み、好ましくは形状検出器1040および楕円検出器1060の両方を含む。その機能に関して、形状検出器1040はデバイス1000について記載されている形状検出器に対応し、楕円検出器1660は、その機能に関して、デバイス1600について記載されている楕円検出器1660に対応する。
さらに、デバイス3800は、パターン識別器3850を含む。パターン識別器またはパターン検出器は、それぞれ、ハフ変換器1030から画像1010における円のアークまたは楕円のアークに関する情報を受信するか、または、ハフ変換器1030から画像を通る直線部分に関する情報を受信する。このように、ハフ変換器1030は、デバイス3800の中で、画像における円のアークまたは楕円のアークに関する情報を提供するだけであるか、または画像の直線部分に関する情報を提供するだけである。あるいは、ハフ変換器1030は、画像における円のアークまたは楕円のアークについての、および画像の直線部分についての情報を提供することが可能である。ハフ変換器1030がどの情報を提供するかの決定は、特に、形状検出器1040および/または楕円検出器1660、さらにパターン識別器3850によってどの情報が要求されているかという事実に依存する。
パターン識別器3850は、画像において検出される(一般的な)形状1042について形状検出器1040によって与えられる情報を用いて、画像において検出された楕円形状について楕円検出器1660によって与えられる情報1662に基づいて、画像1010の画像部分3862を選択する。例えば、それが図15を参照して述べられているように、画像部分の選択は実行されることができる。
さらに、図15を参照して述べられているように、画像部分選択器3860は、任意に、画像部分のマッピングを実行することができる。さらに、それが図19を参照しして述べられているように、画像部分選択器3860は、マスキングを用いて画像部分3862を決定することができる。パターン識別器3850は、画像部分3862を受信し、および/または画像部分選択器3860によって選択される画像部分に関する情報を受信する筆記検出器3870を含む。さらに、筆記検出器3870は、ハフ変換器によって与えられる画像における円のアークおよび/または楕円のアークおよび/または直線部分に関する情報を受信する。さらに、筆記検出器3870は、画像部分選択器によって選択される画像部分3862に存在する円のアークおよび/または楕円のアークおよび/または直線部分を決定する。このように、筆記検出器3870は、画像部分3862に存在する選択された円のアークおよび/または楕円のアークおよび/または直線部分に関する情報を受信する。筆記検出器によって受信された選択された円のアークおよび/または直線部分に関する情報は、筆記成分を記述する。このように、それが図28〜36を参照して説明されているように、フォント検出は実行されることができる
パターン識別器3850が別に設定されてもよいことに注意すべきである。それは、筆記検出器3870が、全体として、形状検出器1040または楕円検出器1660によって検出された一般的な(例えば、三角形、長方形、正方形)または楕円形の中にある画像の選択された円のアークおよび/または楕円のアークおよび/または直線部分に関する情報を含むことは決定的である。画像の選択された円のアークおよび/または楕円のアークおよび/または直線部分に関する情報は、確認された筆記成分(図28を参照)に関する情報2822の場所を獲得する。筆記検出器3870が文字を検出する場合、例えば図28および29を参照して記載されたように、筆記検出器3870は例えば検出された文字の文字コードを提供する。筆記検出器3870によって与えられる文字コードは、道路標識が検出されたという事実に関する情報を例えばもたらすことができる。換言すれば、検出された文字コードは、確認された道路標識を記述する情報の一部である。道路標識が1つ以上の符号および/または1つ以上の文字を含む場合、筆記検出器3870は1つ以上の文字を含む道路標識のフォントに関する情報を任意に提供することもできる。対応するフォントは、例えばデータベースとの比較によって、道路標識および/または道路標識自体によって表される情報を確認するために用いられる。
要約すると、筆記検出器3870が形状検出器1040または楕円検出器1660によって検出される形状にある筆記成分に関する情報に基づいて少なくとも1つの検出された文字の文字コードを提供することに注意され、そこにおいて、文字コードは、好ましくは、確認された道路標識に関する情報を決定するために用いられる。
ハフ変換器によって与えられる情報は、道路標識の検出において繰り返し再利用されることができることに注意される。画像において確認された円のアークおよび/または楕円のアークおよび/または直線部分に関する情報は、形状検出器の助けを借りて、または楕円検出器の助けを借りて、画像1010の一般的なまたは楕円の形状を検出するために用いられる。さらに、ハフ変換器1030によって与えられる情報は、検出された形状によって記述されている画像部分の1つまたはいくつかの文字を確認するために用いることができ、特に確認された道路標識に関する信頼性が高い情報を得る。
実施例において、本発明は、このようにハフ変換の実行に基づいて、特に道路標識検出のための特に有利な概念を提供し、そこにおいて、ハフ変換器によって与えられる情報は、実施例に応じて繰り返し再利用されることができる。
全体的に見て、発明概念は、車の視覚系による道路標識検出を可能にする。本発明は、このように速度制限および他の標識に関する情報を提供する。
本発明は、市中またはハイウェイの両方でのドライブにおける広範囲のオンロードテストにおいて、ソフトウェア「Windelayline」を使用してテストされた。道路標識は、標準的なビデオカメラ・パナソニックGS27―EGを使用して記録された。証明状態(トンネル、影部分)にかかわらず、全体的に、道路標識は、100%区分された。「Windelayline」の方法は、シリコン・ソフトウェア「microenable IV」ビデオプロセッサ(フレーム採集)上のネットリストとして移動可能なハフ変換と類似である。
好ましい実施例では、本発明は、画像1010,1150;1300;1500;1610の道路標識1060;1310;1510を確認するためのデバイス1000;1600を提供し、画像またはそれから得られるエッジ画像1002;1622の異なる方向に画像1010;1610を通る複数の線部分を確認するハフ変換器1030;1630と、確認された線部分に基づいて画像またはそれから得られるエッジ画像の道路標識に対応する形状を検出する形状検出器1040;1200;1640と、形状が検出された形状に基づいて形状検出器によって検出される形状に対応する検出された形状に対応する画像部分を選択して、比較画像パターンを使用して選択された画像部分に基づいて道路標識を確認するパターン識別器1050、1650を含み、パターン識別器1050、1650は、画像1010;1610の部分および比較画像パターンをマッピングによる形状に関して互いに適応させ、ハフ変換器1630は、画像1610またはそれから得られるエッジ画像における円のアーク部分または楕円のアーク部分を確認し、デバイスは、確認された円のアーク部分または楕円のアーク部分に基づいて、画像またはそれから得られるエッジ画像における楕円の位置を検出する楕円検出器1660;1700を更に含み、ハフ変換器1630は、円のアーク部分または楕円のアーク部分の極値点1812a〜1812hを決定し、楕円検出器1660;1700は、ハフ変換器によって決定された少なくとも4つの極値点1812a、1812b、1812c、1812dの第1のセットと、ハフ変換器によって決定された少なくとも4つの極値点1812a、1812b、1812c、1812dの第2のセットとを選択し、4つの極値点の第1のセットは4つの極値点の第2のセットと異なり、極値点の第1のセットの4つの極値点により第1の適合する楕円1840のパラメータを決定し、第1の適合する楕円から極値点の第1のセットの4つの極値点の偏差dを決定し、極値点の第2のセットの4つの極値点により第2の適合する楕円1840のパラメータを決定し、適合する楕円から極値点の第2のセットの4つの極値点の偏差Dを決定し、第1の適合する楕円からの極値点の第1のセットの4つの極値点の偏差dを使用し、第2の適合する楕円からの極値点の第2のセットの4つの極値点の偏差Dを使用して、極値点の第1のセットの4つの極値点が画像の楕円に属するかどうか、そして、第2のセットの4つの極値点が画像の楕円に属するかどうかを決定する。
オプションとして、デバイスにおいて、パターン識別器は、道路標識を確認するために、少なくとも1つの比較画像パターンとの比較により、検出された形状を満たす、またはその境界が検出された形状に基づいて検出された形状により決定される画像を確認する。
オプションとして、デバイスにおいて、パターン識別器は、シフトすることによっておよび/または回転によっておよび/または歪曲によって、画像の部分および比較画像パターン2200を互いに適応させることができる。
オプションとして、デバイスにおいて、パターン識別器は、画像相関アルゴリズムを用いて画像パターンを少なくとも1つの比較画像パターン2200と比較することができる。
オプションとして、デバイスにおいて、パターン識別器は、画像パターンおよび比較画像パターンとの間の偏差の評価を得るために、画像部分の画像パターンを複数の比較画像パターン2200と比較することができ、偏差の評価が所定の最大許容偏差より大きくないとき、画像パターンとの最小の偏差を含む、比較画像パターン2200に対する画像の比較画像パターンの検出を示すことができる。
オプションとして、デバイスにおいて、パターン識別器は、確認された楕円、または、画像またはそれから得られるエッジ画像において楕円または比較形状が確認されたかどうかという事実に応じて確認された比較形状に対応する画像の画像部分を選択することができる。
オプションとして、デバイスは、画像1010;1610のエッジを検出し、画像に基づいてエッジ画像1022;1622を生成するエッジ検出器1020;1620を含む。
オプションとして、エッジ検出器1020;1620は、閾値を用いて画像を単色画像に変換し、単色画像のエッジを検出することができる。
オプションとして、デバイスにおいて、画像1010;1610は、ビデオカメラからのカメラ画像でもよい。
好ましい実施例では、本発明は、パターン識別器が筆記検出器を含むデバイス3800を提供し、筆記検出器は、画像を通る直線部分、確認された円のアーク部分または確認された楕円のアーク部分についてハフ変換器1030;1630によって与えられる情報に基づいて、確認された直線部分、確認された円のアーク部分または確認された楕円のアーク部分の位置を記述する文字記述を得る文字記述発生器を含み、筆記検出器は、文字記述と、文字コードが比較の結果として検出された文字の文字コードを提供するために関連付けられた複数の比較文字記述とが比較されるデータベース比較器を含み、デバイスは、道路標識の確認のために文字コードを使用する。
オプションとして、デバイスにおいて、ハフ変換器は、確認された直線部分の位置、長さまたは方向に関する情報を提供することができ、文字記述発生器は、文字記述の生成のために確認された直線部分についてハフ変換器によって与えられる情報を使用する。
オプションとして、デバイスにおいて、確認された直線部分、確認された円のアーク部分または確認された楕円のアーク部分は、確認された筆記成分を形成することができる。
オプションとして、デバイスにおいて、文字記述発生器は、文字記述として、確認された筆記成分の順序付けとして文字を記述する文字の記述を得ることができる。
オプションとして、デバイスにおいて、文字記述発生器は、連続した筆記の線を記述する確認された筆記成分を順序付けるように、文字記述を順序付けることができる。
オプションとして、デバイスにおいて、ハフ変換器は確認された円のアーク部分または楕円のアーク部分の位置、弧長、曲率半径または湾曲角度に関する情報を提供することができ、文字記述発生器は、文字記述の生成のためのハフ変換器によって与えられる確認された円のアークまたは楕円のアークの位置、弧長、曲率半径または湾曲角度に関する情報を使用する。
オプションとして、デバイスにおいて、文字記述が文字に属する円のアークまたは楕円のアークの相対位置の記述を含むように、文字記述発生器は文字記述を生成することができる。
オプションとして、デバイスは、文字がハフ変換器によって確認される筆記成分の位置に基づいて配置されるラインを確認する筆記ライン検出器を含むことができる。
オプションとして、デバイスにおいて、筆記ライン検出器は、ハフ変換によって確認される筆記成分の位置に基づく筆記ラインとして筆記の下のライン、ベースライン、センターラインまたは上のラインを決定することができる。
オプションとして、デバイスにおいて、筆記ライン検出器は、確認された円のアークまたは楕円のアークの所定数以上の極値が筆記ラインとして位置するラインを決定することができる。
オプションとして、デバイスにおいて、文字記述が少なくとも1つの検出された筆記ラインと関連して確認された筆記成分の位置に関する情報を記述するように、文字記述発生器は文字記述を生成することができる。
オプションとして、デバイスにおいて、文字記述発生器は、確認された円のアークまたは楕円のアークのための文字記述に円のアークまたは楕円のアークの方向についてハフ変換器によって与えられる情報を含めることができる。
オプションとして、デバイスにおいて、文字記述発生器は、確認された円のアークまたは楕円のアークのための文字記述にハフ変換器によって与えられる確認された円のアークまたは確認された楕円のアークの極値点の位置に関する情報を含めることができる。
オプションとして、デバイスにおいて、ハフ変換器は、曲率半径が絶対値に関して所定の最大許容曲率半径より小さい円のアークだけまたは楕円のアークだけを確認することができる。
オプションとして、デバイスにおいて、文字記述発生器は、選択された隣接する確認された文字成分を組み立てることによって文字の記述を生成することができ、選択された文字成分が所定の出発点から所定の終点への線の連続経路を記述するように、文字記述発生器は確認された文字成分の全体から文字の記述のために使用される選択された文字成分を選択する。
オプションとして、デバイスにおいて、文字記述発生器は、文字の次の部分を記述する確認された文字成分に基づいて特徴ベクトルを生成することができる。
オプションとして、デバイスにおいて、データベース比較器は、特徴ベクトルおよび比較ベクトルの違いの評価を得るために、そして違いの評価に基づいて特徴ベクトルに属する文字コードを決定するために、文字記述の情報を含む特徴ベクトルを比較文字と関連した複数の比較特徴ベクトルと比較することができる。
オプションとして、デバイスは、文字を含む画像の画像部分の画像内容に基づいてオイラー連結数を計算するための連結数計算機を含み、さらに、文字の検出の信頼性に関する情報をもたらしている信頼性情報を得るために、デバイスは、画像部分に対して計算されるオイラー連結数と、画像部分において検出される文字に関連するデータベースに含まれる所定の比較連結数とを比較するために行う連結数検査器を含む。
参考文献
B.V.ファントおよびG.D.フィンレイスン.「色定数色指数付け(Color constant color indexing)」.パターン解析および人工知能に関するIEEE議事録,17(5):522〜529,1995.
J.クルーダス.「カラー指数付け、一定のカラー指数付け(Color indexing, constant color indexing)」.ハウプトゼミナール、TU−ニルメナウ、2005。
P.ランバート、N.ハーヴィーおよびH.グレキュ.「空間色彩ヒストグラムを用いた画像検索(Image retrieval using spatial chromatic histograms)」.イメージングおよびビジョン、第343〜347頁、2004.CGIV 2004−グラフィクスの色に関する第2のヨーロッパの会議(Second European Conference on Color in Graphics)
G.Ciocca、R.SchettiniおよびL.Cingue.「空間色彩ヒストグラムおよび符号定数を使用する画像指数づけおよび検索(Image indexing and retrieval using spatial chromatic histograms and signatures)」.イメージングおよびビジョン、(4月2日〜5日), 2002.CGIV 2002−グラフィクスの色に関する第1のヨーロッパの会議.ポアティエ大学(フランス)