JP2021125076A - 歩行者信号識別装置 - Google Patents

歩行者信号識別装置 Download PDF

Info

Publication number
JP2021125076A
JP2021125076A JP2020019528A JP2020019528A JP2021125076A JP 2021125076 A JP2021125076 A JP 2021125076A JP 2020019528 A JP2020019528 A JP 2020019528A JP 2020019528 A JP2020019528 A JP 2020019528A JP 2021125076 A JP2021125076 A JP 2021125076A
Authority
JP
Japan
Prior art keywords
signal
state
detection
detection accuracy
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020019528A
Other languages
English (en)
Other versions
JP6737968B1 (ja
Inventor
亮輔 奥田
Ryosuke Okuda
亮輔 奥田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2020019528A priority Critical patent/JP6737968B1/ja
Application granted granted Critical
Publication of JP6737968B1 publication Critical patent/JP6737968B1/ja
Publication of JP2021125076A publication Critical patent/JP2021125076A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】優れた識別精度を有する、歩行者信号機用の信号識別装置の提供。
【解決手段】本発明に係る信号識別装置は、周囲の環境を撮影して画像情報を取得する画像情報取得手段と、上記画像情報から、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う物体検出手段と、上記信号、横断歩道、及び検出確度から現在の信号の状態を判定する状態判定手段とを備える。
【選択図】図3

Description

本発明は、歩行者信号機用の信号識別装置に関する。
近年、高齢化の進展や、社会参加する障害者の増加に伴い、高齢者や障害者が自力で行動することを支援する機器に対する要求が強くなっている。視覚障害者が横断歩道を渡るのを支援する信号機識別装置が、この例である。非特許文献1(「LED信号機の点滅を利用した視覚障がい者用信号機情報提示スマートフォンアプリの開発」、情報処理インタラクション2017論文集、799項−802項)には、スマートフォンで動作する信号機識別ソフトが開示されている。このソフトでは、信号機の点滅の周波数を利用して、信号機の検出の精度を向上させている。
「LED信号機の点滅を利用した視覚障がい者用信号機情報提示スマートフォンアプリの開発」、情報処理インタラクション2017論文集、799頁−802頁
視覚障害者がより安全に横断歩道を渡ることができるように、識別精度が高い歩行者信号機用の信号識別装置が望まれている。
本発明の目的は、優れた識別精度を有する、歩行者信号機用の信号識別装置の提供にある。
本発明に係る信号識別装置は、周囲の環境を撮影して画像情報を取得する画像情報取得手段と、上記画像情報から、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う物体検出手段と、上記信号、横断歩道、及び検出確度から現在の信号の状態を判定する状態判定手段とを備える。
好ましくは、この装置は、上記横断歩道から信号が存在すると推定できる領域を設定する、信号推定領域の設定手段をさらに備える。上記状態判定手段は、上記信号推定領域内に上記物体検出手段で検出された信号が存在する場合に、この信号推定領域内の信号のうち検出確度が最大の信号を最善の信号として選択する第一の信号選択手段と、上記第一の信号選択手段で選択された最善の信号の検出確度の値により、この最善の信号を現在の信号の状態とするか否かを判定する第一の信号判定手段と、上記物体検出手段で検出された信号は存在するが上記信号推定領域内に位置する信号がない場合に、これらの物体検出手段で検出された信号のうち検出確度が最大の信号を最善の信号として選択する第二の信号選択手段と、上記第二の信号選択手段で選択された最善の信号の検出確度の値により、この最善の信号を現在の信号の状態とするか否かを判定する第二の信号判定手段とを備える。上記第一の信号判定手段と第二の信号判定手段とで、判定の基準が異なっている。
好ましくは、上記第一の判定手段では、最善の信号の検出確度が所定の閾値Ti以上であればこの最善の信号が現在の信号の状態と判定され、上記第二の判定手段では、最善の信号の検出確度が所定の閾値To以上であればこの最善の信号が現在の信号の状態と判定される。上記閾値Tiは上記閾値Toより小さい。
好ましくは、上記物体検出手段では、横断歩道はその幅を規定している境界線が検出され、上記信号推定領域には、上記物体検出手段において横断歩道の幅を規定している右側の境界線と左側の境界線の両方が検出できたときにこれらの境界線から設定されるタイプ1の信号推定領域と、上記物体検出手段において横断歩道の幅を規定している右側の境界線及び左側の境界線のいずれか一方のみが検出できたときにこの境界線から設定されるタイプ2の信号推定領域とが存在する。上記第一の判定手段では、上記信号推定領域がタイプ1である場合には、最善の信号の検出確度が所定の閾値Ti1以上であればこの最善の信号が現在の信号の状態と判定され、上記信号推定領域がタイプ2である場合には、最善の信号の検出確度が所定の閾値Ti2以上であればこの最善の信号が現在の信号の状態と判定される。上記第二の判定手段では、最善の信号の検出確度が所定の閾値To以上であればこの最善の信号が現在の信号の状態と判定される。上記閾値Ti1が上記閾値Ti2より小さく、上記閾値Ti2が上記閾値Toより小さい。
好ましくは、この装置は、上記画像情報のピクセル数を減らす低解像度化手段と、上記低解像度化した画像情報に対し、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う第一の物体検出手段と、上記第一の物体検出手段で得られた信号、横断歩道及び検出確度から現在の信号の状態を判定する第一の状態判定手段と、上記第一の状態判定手段の結果より、上記低解像度化する前の画像情報から探索すべき領域を切り出す探索領域切り出し手段と、上記探索領域の画像情報に対し、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う第二の物体検出手段と、上記第二の物体検出手段で得られた信号、横断歩道及び検出確度から現在の信号の状態を判定する第二の状態判定手段とを備える。
好ましくは、この装置は、上記探索領域の画像情報に対し輝度調整を行う輝度調整手段をさらに備え、この輝度調整された画像情報に対し、上記第二の物体検出手段が実施される。
好ましくは、上記物体検出手段は、ニューラルネットワークを使用して実現されている。上記ニューラルネットワークでは、横断歩道の幅を規定している境界線が、この境界線を囲む矩形の領域として学習されている。このとき、上記境界線は、右上がりの線分の場合及び左上がりの線分の場合で、異なる物体として学習されている。より好ましくは、上記境界線は、右上がりの線分の場合、左上がりの線分の場合、及び垂直線分の場合で、互いに異なる物体として学習されている。
好ましくは、この装置は、加速度センサ及びカメラ方向補正手段をさらに備え、このカメラ方向補正手段は、上記加速度センサの計測結果からこの装置の姿勢を補正するための情報を生成する。
本発明に係る歩行者信号機用の信号識別プログラムは、演算器を有する携帯機器において動作する。このプログラムは、上記演算器に対して、周囲の環境を撮影した画像情報から、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う物体検出処理と、上記信号、横断歩道、及び検出確度から現在の信号の状態を判定する状態判定処理とを実行させる。
本発明に係る歩行者信号機用の信号識別装置では、周囲の環境を撮影した画像情報から検出した信号及び横断歩道、並びにこれらの検出確度から、現在の信号の状態が判定される。この装置は、信号の状態の判定に、信号の検出結果だけではなく、横断歩道の検出結果を併せて使用することで、信号の優れた識別精度を実現している。
図1は、本発明の一実施形態に係る信号識別装置が示された、ブロック図である。 図2は、図1の装置の表示/入力器の表示画面の一例である。 図3は、本装置のプログラムが図1の演算ユニットの演算器に実行させる処理が示された、ブロック図である。 図4は、図3の処理で実施される、処理の流れが示されたフロー図である。 図5は、図4の画像整形処理で整形された後の画像の一例である。 図6(a)及び(b)は、それぞれ図4の信号推定領域設定処理で設定された信号推定領域の例である。 図7は、図4の状態判定での処理の流れが示されたフローチャートである。 図8(a)、(b)及び(c)は、それぞれ図4の探索領域切り出し処理で切り出される探索領域の例である。 図9は、図4の状態遷移の動作が示された、状態遷移図である。 図10は、図4の物体検出で動作されるニューラルネットワークの学習で使用する、横断歩道の境界線の例である。 図11は、図4の物体検出で動作されるニューラルネットワークの学習で使用する、横断歩道の境界線の他の例である。 図12は、図4の物体検出で動作されるニューラルネットワークの学習で使用する、横断歩道の境界線のさらに他の例である。
以下、適宜図面が参照されつつ、好ましい実施形態に基づいて本発明が詳細に説明される。
[概要]
本発明に係る歩行者信号機用の信号識別装置は、視覚障害者用である。本装置のユーザーは、視覚に障害を有する、歩行者、自転車搭乗者、車椅子搭乗者等である。本装置は、これらのユーザーが横断歩道を渡る際に、歩行者用信号機の状態の識別を補助する。
本装置のユーザーは、外出の際に本装置を携帯する。例えばユーザーは、本装置を所定のホルダーに入れて、首から掛ける。ユーザーは、ポケットや鞄等に本装置を入れて携帯し、使用時にこれを取り出してもよい。ユーザーは、横断歩道を渡る前に、本装置で歩行者用の信号を撮影する。本装置は、撮影した画像から信号の状態を識別し、ユーザーに通知する。例えば、本装置は、識別結果として、信号が「青」、「点滅」、及び「赤」のいずれの状態かをユーザーに通知する。この実施形態では、識別結果は、本装置の画面への表示、音の再生、及び本装置の振動のうちのいずれか、又はこれらの組み合わせで、ユーザーに通知される。
[全体構成]
図1は、本発明の一実施形態に係る信号識別装置2が示された、ブロック図である。図1で示されるように、この装置2は、演算ユニット4、カメラ6、表示/入力器8、発音器10、バイブレータ12及び加速度センサ14を備える。図示されないが、この装置2は、演算ユニット4を動作させるプログラムをさらに備える。この実施形態では、この装置2のハードウエア部分は、スマートフォンで実現されている。ハードウエア部分が、他の携帯機器で実現されていてもよい。例えばハードウエア部分が、タブレットコンピュータで実現されていてもよく、携帯ゲーム器で実現されていてもよい。ハードウエア部分が、本装置専用のハードウエアであってもよい。
図1で示されるように、演算ユニット4は、演算器16、メモリ18及びインターフェース20を備える。演算器16は、典型的にはCPUである。演算器16が複数のCPU及びその周辺回路から構成されていてもよい。メモリ18には、信号識別の処理を演算ユニット4に実行させるためのプログラム(信号識別プログラム)が格納される。メモリ18には、この処理で演算器16が使用するデータも格納される。メモリ18は、典型的には半導体メモリ及びハードディスクである。インターフェース20は、演算器16及びメモリ18と、カメラ6、表示/入力器8、発音器10、バイブレータ12及び加速度センサ14との間で、データをやりとりするための回路である。
カメラ6は、周囲の環境を撮影し、画像情報として演算ユニット4に送る。カメラ6は、この装置2の画像情報取得手段を構成する。この実施形態では、カメラ6が撮影する画像は、解像度が1920×1080ピクセル、フレームレートが27.5fpsのRGBのカラー動画像である。カメラ6が撮影する画像の解像度及びフレームレートは、上記の値より大きくてもよく、小さくてもよい。ただし、フレームレートは、信号が点滅するときの点滅の周波数(50Hzまたは60Hz)に同期しない値が選択される。ユーザーは、本装置2の姿勢を変えることで、縦長(ポートレイト)の画像または横長(ランドスケープ)の画像のいずれを撮影するかを選択することができる。
表示/入力器8は、信号識別結果をユーザーに通知するのに使用される。表示/入力器8は、信号識別結果をカメラ6が撮影した画像とともに表示する。表示/入力器8は、ユーザーの指示を本装置2に入力するためにも使用される。この実施形態では、表示/入力器8はタッチパネルである。表示器と入力器とが、別々に実現されていてもよい。例えば本装置2が、入力器としてキーを有していてもよい。
図2には、表示/入力器8の表示画面22の例が示されている。この例では、信号の識別結果が、カメラ6が撮影した信号機周辺の画像とともに表示されている。この例では、カメラ6は横長の画像を撮影している。図2で示されるように、撮影した画像の周囲に、識別結果表示領域24が設けられている。例えば、信号の識別結果が「青」である場合、識別結果表示領域24は緑色で表示される。信号の識別結果が「赤」である場合、識別結果表示領域24は赤色で表示される。道路の対面に位置する信号機は見え難いユーザーでも、識別結果表示領域24の色を見て、信号の状態を確認することができる。
発音器10は、信号識別結果をユーザーに音で通知するのに使用される。例えば、信号の識別結果が「青」である場合、発音器10から「青です」との音声メッセージが再生される。本実施形態では、音声メッセージに加え、音楽及び効果音を再生することができる。例えば「青」、「点滅」及び「赤」のそれぞれに、異なる音楽又は効果音を割り当てておき、信号の識別結果に応じて対応する音楽又は効果音が発音器10から再生される。発音器10の典型的な例として、スピーカ、イヤホン及びヘッドホンが挙げられる。
バイブレータ12は、信号識別結果をユーザーに振動で通知するのに使用される。例えば、バイブレータ12は、「青」では短周期で振動し、「赤」では長周期で振動することで、信号識別結果をユーザーに通知する。
加速度センサ14は、本装置2に加わる加速度を検知する。後述するとおり、加速度センサ14の検知結果は、本装置2の姿勢の補正や動作モードの変更に使用される。
本装置2では、演算ユニット4、カメラ6、表示/入力器8、発音器10、バイブレータ12及び加速度センサ14が、一体として構成されていてもよく、これらの一部が他とは別れて構成されていてもよい。例えば発音器10が、演算ユニット4と無線で通信する、イヤホン又はヘッドホンであってもよい。
図3では、演算ユニット4の枠の中に、本信号識別プログラムが演算ユニット4の演算器16に実行させる処理(以降では、「本信号識別プログラムが行う処理」と記載する)が示されている。図3に示されるとおり、本プログラムは、メイン処理26、信号判定28、物体検出29、カメラ方向補正30、及び振動監視31の各処理を行う。換言すれば、本プログラムは、メイン処理部、信号判定部、物体検出部、カメラ方向補正部、及び振動監視部を備える。これらのうち、メイン処理部、信号判定部及び物体検出部が、画像情報から信号を検出し、信号の識別をする部分である。
なお、「本プログラムが演算器16にAの処理を実行させる」場合、これは、「演算器16と本プログラムとで、A手段が実現されている」こととなる。これは、「本装置2は、A手段を備える」ことと同義となる。すなわち、図3で示されるように、本装置2は、メイン処理手段、信号判定手段、物体検出手段、カメラ方向補正手段及び振動監視手段を備えている。以後で説明される処理についても、同様である。
図4には、メイン処理部、信号判定部及び物体検出部で行われる処理及びこれらの処理の流れが示されている。この実施形態では、メイン処理部、信号判定部及び物体検出部は、それぞれ独立に実行されるスレッドである。以下では、メイン処理部、物体検出部及び信号判定部が、この順で詳細に説明される。その後に、カメラ方向補正部及び振動監視部が説明される。
[メイン処理部]
メイン処理部のスレッドは、プログラムの全体の処理の流れを制御する。図4の点線の矢印は、それぞれのスレッドでの処理の流れを示している。図4で示されるように、メイン処理部での処理の流れは、無限ループを形成する。メイン処理部は、(a)画像入力検出、(b)信号判定終了確認、(c)状態遷移、(d)ユーザー通知及び(e)信号判定部起動の処理を含む。
(a)画像入力検出は、カメラ6から新たな画像情報が入力されたか否かを常時監視する。図4において、符号Iで示されるのが、入力される画像情報(画像I)である。この実施形態では、画像Iは、解像度が1920×1080ピクセルの、RGBデータである。この実施形態では、フレームレートが27.5fpsであるので、画像Iは一秒間に27.5回入力される。画像Iが入力されると、メイン処理部は、次の(b)信号判定終了確認に移る。
(b)信号判定終了確認では、前回起動した信号判定部のスレッドが終了しているかどうかの確認が行われる。信号判定部のスレッドが終了していれば、メイン処理部は信号判定の結果(図4の符号S_1又はS_2)を受け取り、(c)状態遷移に移る。信号判定部のスレッドが終了していなければ、画像Iは破棄され、メイン処理部は(a)画像入力検出に戻る。
(c)状態遷移では、信号判定の結果(S_1又はS_2)から、メイン処理部のスレッドの状態遷移が行われる。この状態遷移の結果により、ユーザーへ通知すべき内容が決められる。状態遷移の詳細は、後に説明される。
(d)ユーザー通知は、表示/入力器8、発音器10及びバイブレータ12の少なくとも一つを動作させて、ユーザーへ信号の状態を通知する。ユーザー通知の詳細は、後に説明される。
(e)信号判定部起動では、新たな信号判定部のスレッドが起動され、併せて直近に入力された画像Iがこの信号判定部に渡される。メイン処理部は、(a)画像入力検出に戻る。なお、(c)状態遷移の結果、メイン処理部のスレッドの状態が、後述する「待機」の状態である場合は、信号判定部起動では、何も処理はされない。信号判定部のスレッドを起動することなく、メイン処理部は(a)画像入力検出に戻る。
なお、メイン処理部のスレッドが起動された直後の最初のループにおいては、上記(b)信号判定終了確認の段階ではまだ信号判定部のスレッドが起動されていない。この段階では、終了確認をすべき信号判定部のスレッドが存在しない。最初のループの(b)信号判定終了確認の結果は、例外的に、「検出された物体が無い状態(後述する、物体無(N)の状態)との判定で信号判定が終了している」であるとして、メイン処理部は次の(c)状態遷移の処理に移る。
なお、図4の実施形態では、上記(e)で直近に入力された画像Iを使用して信号判定部を起動した後、(a)で次の画像入力の検出が実行され、その後に(b)信号判定終了確認が実施されている。これは、信号判定部のスレッドの処理時間が、メイン処理部の他の処理の処理時間よりも、大幅に長いためである。この処理順にすることより、処理の効率化が図られている。(a)の処理の直後に、このとき入力された画像Iを使用して(e)信号判定部起動の処理が実行されてもよい。この場合のメイン処理部での処理順は、(a)、(e)、(b)、(c)、(d)となる。
[物体検出部]
図4で示されるように、一回の信号判定部のスレッドにおいて、物体検出部のスレッドは二回起動されうる。一回目の物体検出(第一物体検出)は、(o)画像整形、(p)検出及び(q)物体選択の処理を含む。二回目の物体検出(第二物体検出)は、(r)画像整形、(s)検出及び(t)物体選択の処理を含む。
第一物体検出の入力は、メイン処理部のスレッドに入力された画像Iである。画像Iが、信号判定部のスレッドを通して、第一物体検出に入力される。前述のとおり、この実施形態では、画像Iは、解像度が1920×1080ピクセルのRGBデータである。
(o)画像整形では、画像Iが、所定の大きさの画像に整形される。画像整形の処理により、画像Iは正方形にされ、さらに低解像度化される。図5に、整形後の画像32の例が示されている。入力された画像Iが横長の場合は、図5で示されるように、その上端の外側と下端の外側に黒帯部34を付加することで、画像Iは正方形にされる。図示されないが、画像Iが縦長の場合は、その右端の外側と左端の外側に、黒帯部を付加することで、画像Iは正方形にされる。低解像度化は、例えば近接する複数のピクセルを平均して一つのピクセルとすることで、実現できる。この実施形態では、画像Iは、416×416ピクセルの画像に低解像度化される。
(p)検出では、整形された画像に対し、ニューラルネットワークによる推論により、物体の検出及びその検出確度の生成が行われる。この実施形態で検出される物体は、以下の5種類である。
青信号: 緑(青)が点灯している歩行者用信号
赤信号: 赤が点灯している歩行者用信号
黒信号: 緑も赤も点灯していない歩行者用信号
右境界: 横断歩道の幅を規定している境界線のうち、右側の境界線
左境界: 横断歩道の幅を規定している境界線のうち、左側の境界線
図5の例では、青信号36、右境界38及び左境界40が検出されている。
信号(青信号、赤信号及び黒信号)の検出では、この信号を囲む矩形の左上角の座標及び右下角の座標が、併せて検出される。図5の例では、角c1及びc2の座標が検出される。横断歩道(右境界及び左境界)の検出では、境界線の二つの端点の座標が、併せて検出される。図5の例では、右境界38については端点p1及びp2の座標が、左境界40については端点p3及びp4の座標が検出される。さらに、それぞれの検出された物体に対し、検出結果の確からしさを表す「検出確度」が生成される。この実施形態では、検出確度として、0.0以上1.0以下の値が生成される。検出確度は、その値が大きいほど検出した物体の確からしさが高いことを表す。この処理では、「物体」、「座標」及び「検出確度」が、一つのセットとして出力される。この実施形態では、常に2535の物体が検出される。実際には、これらの物体のほとんどは、その検出確度が0.0である。
ニューラルネットワークとしては、既存のプログラムが使用できる。この実施形態では、GitHub社が運営するインターネットページで公開されている、「YOLOv3」が使用されている。上記物体を検出するためのニューラルネットワークの学習については、後に説明がされる。
(q)物体選択では、上記で検出された物体の中から、信号判定の処理に必要な物体が選択される。物体選択の方法は、以下のとおりである。
・「青信号」、「赤信号」及び「黒信号」については、検出確度が所定の値以上であれば、全て選択される。この実施形態では、検出確度が0.5以上の「青信号」、「赤信号」及び「黒信号」が、全て選択される。この結果、0個以上の「青信号」、「赤信号」及び「黒信号」が選択される。
・「右境界」及び「左境界」のそれぞれについては、「水平方向に延びていない」かつ「検出確度が所定の値(この実施形態では0.5)より大きい」かつ「検出確度が最大」の境界線が選択される。この結果、0個又は1箇の「右境界」、及び0個又は1箇の「左境界」が選択される。
選択された物体が、座標及び検出確度とともに検出結果として信号判定部に返される(図4の符号O_1)。これにより、第一物体検出の処理が終了する。
第二物体検出では、後述するとおり、もとの画像Iの一部が切り出されて形成された探索領域が、入力の画像となる。入力画像が異なること以外は、第二物体検出部の処理は、第一物体検出部の処理と同じである。
[信号判定部]
信号判定部は、画像Iを入力として、信号機の信号の状態を判定する。図4で示されるように、信号判定部は、(f)から(n)までの処理を含む。
(f)第一物体検出起動は、第一物体検出のスレッドを起動するとともに、画像Iを第一物体検出のスレッドに渡す。
(g)第一信号推定領域設定では、第一物体検出で検出された「右境界」及び「左境界」の位置から、信号機の点灯部が存在すると推定できる矩形の領域(信号推定領域)が、画像Iの中に設定される。信号推定領域には、タイプ1及びタイプ2が存在する。以下では、図6(a)及び(b)を参照して、それぞれの信号推定領域が説明される。なお、図6(a)及び(b)では、右方向がx座標の正方向であり、下方向がy座標の正方向である。また、画像Iの「1ピクセル」がx方向の長さの単位及びy方向の長さの単位となる。従って、例えば画像Iが横長の画像の場合、画像Iのx方向の長さは「1920」となり、y方向の長さは「1080」となる。
・タイプ1
タイプ1は、検出結果中に、右境界及び左境界が両方存在する場合に設定される、信号推定領域である。図6(a)に、タイプ1の信号推定領域の例が示されている。図6(a)において、画像Iの内部の一点鎖線の矩形がタイプ1の信号推定領域42である。タイプ1の信号推定領域42の下辺のy座標は、右境界の端点及び左境界の端点のうち、最も上側に位置する端点のy座標と一致する。図6(a)の例では、信号推定領域42の下辺のy座標は、右境界44の端点P1のy座標と一致する。タイプ1の信号推定領域42の上辺は、もとの画像Iの上辺と重なる。タイプ1の信号推定領域42の右辺のx座標は、右境界の上側の端点及び左境界の上側の端点のうち、右側に位置する端点(図6(a)の例では、右境界44の端点P1)のx座標をxrとしたとき、(xr+e1)と設定される。タイプ1の信号推定領域42の左辺のx座標は、右境界の上側の端点及び左境界の上側の端点のうち、左側に位置する端点(図6(a)の例では、左境界46の端点P2)のx座標をxlとしたとき、(xl−e1)と設定される。ここでe1は所定のマージンである。この実施形態では、マージンe1は、もとの画像Iの短辺の長さ(この実施形態では1080)をwとしたとき、
e1=max(w×0.15,(xr−xl)/2)
と設定される。この式で「max()」は、()内の数の最大値を表す。なお、上記の式では、信号推定領域42の端がもとの画像Iの端を超える場合は、もとの画像Iの端までが、信号推定領域42とされる。
・タイプ2
タイプ2は、検出結果中に、右境界及び左境界のいずれか一方のみが存在する場合に設定される、信号推定領域である。図6(b)に、右境界52のみが存在するときの、タイプ2の信号推定領域の例が示されている。図6(b)において、もとの画像Iの内部の一点鎖線の矩形がタイプ2の信号推定領域50である。タイプ2の信号推定領域の下辺のy座標は、検出された境界線の上側の端点のy座標と一致する。図6(b)の例では、信号推定領域50の下辺のy座標は、右境界52の端点P1のy座標と一致する。タイプ2の信号推定領域の上辺は、もとの画像の上辺と重なる。図6(b)のx2は、検出された境界線(この図では右境界52)の上側の端点のx座標を表す。図6(b)で示されるとおり、検出された境界線が右境界52の場合、タイプ2の信号推定領域50の右辺のx座標は(x2+e2)であり、左辺のx座標は(x2−c2×e2)である。図示されないが、検出された境界線が左境界の場合、タイプ2の信号推定領域の右辺のx座標は(x2+c2×e2)であり、左辺のx座標は(x2−e2)である。ここでe2は所定のマージンであり、c2は所定の係数である。この実施形態では、マージンe2及び係数c2は、
e2=w×0.2
c2=3
と設定される。なお、上記の式で、信号推定領域の端が、もとの画像Iの端を超える場合は、もとの画像Iの端までが、信号推定領域とされる。
マージンe1は、上記の式の値に限られない。マージンe1は、上記の式の値よりも大きくてもよく、小さくてもよい。マージンe1の値は、信号判定の精度及び信号判定の効率を考慮して、設定される。
マージンe2及び係数c2は、上記の式の値に限られない。マージンe2は、上記の式の値よりも大きくてもよく、小さくてもよい。係数c2は、上記の式の値よりも大きくてもよく、小さくてもよい。マージンe2及び係数c2の値は、信号判定の精度及び信号判定の効率を考慮して、設定される。
なお、画像Iの上辺まで達している境界線が検出されているときは、上記の設定方法では、信号推定領域の上辺と下辺のy座標は同じとなる。この場合は、信号推定領域は設定されない。第一物体検出の検出結果中に、右境界及び左境界のいずれも存在しないときも、信号推定領域は設定されない。
(h)第一状態判定では、信号の状態が判定される。図7に、第一状態判定の処理のフローが示されている。ステップS1では、物体検出結果に、信号(青信号、赤信号、黒信号)が存在するか否かが判定される。これらがいずれも存在しないときは、ステップS12で信号推定領域が存在するか否かが判定される。信号推定領域が存在しないときはステップS13で「物体無」と判定され、信号推定領域が存在するときはステップS14で「信号推定領域のみ存在」と判定される。
ステップS1で信号(青信号、赤信号、黒信号)のいずれかが存在する場合は、ステップS2においてタイプ1の信号推定領域が存在するか否かが判断される。これが存在する場合はステップS3において、信号がタイプ1の信号推定領域内に存在するか否かが判断される。これが存在する場合は、ステップS4において、タイプ1の信号推定領域内に存在する信号のうち、検出確度が最大の信号が、「最善の信号BS」として選択される。ステップS5において、この最善の信号BSの検出確度が所定の閾値Ti1以上であるか否かが判断される。検出確度が閾値Ti1以上である場合は、ステップS15において、現在の信号は「信号BSの状態である」と判定される。すなわち、最善の信号BSが「青信号」であれば、現在の信号は「青信号の状態である」と判定され、最善の信号BSが「赤信号」であれば、現在の信号は「赤信号の状態である」と判定され、最善の信号BSが「黒信号」であれば、現在の信号は「黒信号の状態である」と判定される。検出確度が所定の閾値Ti1より小さい場合は、ステップS16において、現在の信号の状態は「確度不足で判定不可」とされる。
タイプ1の信号推定領域が存在しない場合は、ステップS6において、タイプ2の信号推定領域が存在するか否かが判断される。存在する場合は、ステップS7において、信号がタイプ2の信号推定領域内に存在するか否かが判断される。これが存在する場合は、ステップS8において、タイプ2の信号推定領域内に存在する信号のうち、検出確度が最大の信号が「最善の信号BS」として選択される。ステップS9において、この最善の信号BSの検出確度が所定の閾値Ti2以上であるか否かが判断される。検出確度が閾値Ti2以上である場合は、ステップS15において、現在の信号は「信号BSの状態である」と判定される。検出確度が所定の閾値Ti2より小さい場合は、ステップS16において、現在の信号の状態は「確度不足で判定不可」とされる。
物体検出の結果に信号が存在する場合において、信号推定領域内に位置する信号がない場合又は信号推定領域が存在しない場合(以後「信号推定領域外の信号のみが存在する場合」と称される)、ステップS10において、これらの信号のうち検出確度が最大の信号が「最善の信号BS」として選択される。ステップS11において、この最善の信号BSの検出確度が所定の閾値To以上であるか否かが判断される。検出確度が閾値To以上である場合は、ステップS15において、現在の信号は「信号BSの状態である」と判定される。検出確度が所定の閾値Toより小さい場合は、ステップS16において、現在の信号の状態は「確度不足で判定不可」とされる。
なお、上記ステップS4及びステップS8は併せて、信号推定領域内に信号が存在する場合に最善の信号BSを選択する、「第一の信号選択ステップ」と称される。ステップS5及びステップS9は併せて、この場合に最善の信号BSを現在の信号の状態とするか否かを判定する、「第一の信号判定ステップ」と称される。上記ステップS10は、信号推定領域外の信号のみが存在する場合に最善の信号BSを選択する、「第二の信号選択ステップ」と称される。ステップS11は、この場合に最善の信号BSを選択する、「第二の信号選択ステップ」と称される。
上記の閾値Ti1及び閾値Ti2は、いずれも閾値Toとは異なった値に設定される。すなわち、信号推定領域内に信号が存在する場合と、信号推定領域外の信号のみが存在する場合とでは、最善の信号BSを現在の信号の状態であると判定するか否かの基準が異なっている。
この実施形態では、閾値Ti1及び閾値Ti2は、いずれも閾値Toよりも小さな値に設定される。すなわち、信号推定領域内に信号が存在する場合には、信号推定領域外の信号のみが存在する場合と比べて、最善の信号BSの検出確度が小さい場合にも、現在の信号が「信号BSの状態である」と判定されうる。
この実施形態では、閾値Ti1は、閾値Ti2よりも小さな値に設定される。すなわち、タイプ1の信号推定領域内に信号が存在する場合には、タイプ2の信号推定領域内に信号が存在する場合と比べて、最善の信号BSの検出確度が小さい場合にも、現在の信号が「信号BSの状態である」と判定されうる。
閾値Ti1と閾値Ti2とが同じ値であってもよい。すなわち、タイプ1かタイプ2かに依らず、信号推定領域内に信号が存在する場合、最善の信号BSの検出確度が閾値Ti以上であれば、現在の信号は「信号BSの状態である」と判定されてもよい。この場合においても閾値Tiは、閾値Toよりも小さな値に設定される。
この実施形態では、閾値Ti1は0.7に設定され、閾値Ti2は0.8に設定され、閾値Toは0.9に設定されている。Ti1、Ti2及びToの値は、これらに限られない。適切なTi1、Ti2及びToの値は、物体検出部の検出性能や学習の度合い、カメラ6の性能等に依存しうる。Ti1、Ti2及びToの値は、これらの性能等により、適切に設定される。
上記のとおり、第一状態判定の処理では、現在の信号が、「青信号(G)」、「赤信号(R)」、「黒信号(B)」、「確度不足で判定不可(UC)」、「信号推定領域のみ存在(Z)」及び「物体無(N)」のいずれの状態であるかが判定される。併せて、「G」、「R」、「B」、及び「UC」の場合は、最善の信号BSが選択されている。
(i)終了判定では、上記の第一状態判定の結果から、信号判定の処理を終了するか否かが判定される。第一状態判定の結果、現在の信号の状態が「G」、「R」、「B」及び「N」のいずれかの場合、この状態及び最善の信号BSの情報が、画面表示のための画像情報Iと共にメイン処理部に戻される(図4の符号S_1)。信号判定部のスレッドは終了する。現在の信号の状態が「UC」又は「Z」の場合は、次の(j)探索領域切り出しの処理が実行される。
(j)探索領域切り出しでは、入力された画像Iの一部が、さらに信号を探索すべき領域として切り出される。探索領域切り出しの処理は、以下の通り、第一状態判定の結果が「UC」の場合と「Z」の場合とで異なる。
・結果が「UC」の場合
もとの画像Iの中から、最善の信号BSを中心として、これを含む所定の大きさの領域が、「探索領域」として切り出される。図8(a)に、この探索領域の例が示されている。図8(a)において、画像Iの内部に位置する破線で示された矩形が、最善の信号BSを囲う矩形56である。符号Oは、この矩形56の中心を表す。この実施形態では、この中心Oを中心とする、416×416ピクセルの大きさの正方形の領域が、探索領域57とされる。上記の設定方法では、探索領域57がもとの画像Iからはみ出す場合は、探索領域57の端ともとの画像Iの端とが一致するように、探索領域57が水平方向または/及び垂直方向に移動される。
・結果が「Z」の場合
もとの画像Iから、信号推定領域と重なり、信号推定領域と同じ幅の正方形の領域が、探索領域として切り出される。図8(b)及び(c)に、この探索領域の例が示されている。これらの図では、もとの画像Iの内部に位置するハッチが付された矩形が、信号推定領域である。図8(b)で示されるように、信号推定領域60が横長である場合、信号推定領域60の上辺を一辺とする正方形の領域が、探索領域58とされる。図8(c)で示されるように、信号推定領域61が縦長である場合、信号推定領域61と同じ幅で信号推定領域61に含まれる正方形の領域が、探索領域59とされる。この場合、信号推定領域61の上下方向の中央と、探索領域59の上下方向の中央とが一致するように、探索領域59の位置が決められている。図示されないが、信号推定領域が正方形の場合は、信号推定領域と探索領域とは一致する。
(k)探索領域輝度調整では、探索領域内の輝度の分布の偏りを解消するために、探索領域内のピクセルの輝度が調整される。これにより、探索領域内の輝度のヒストグラムが均一化される。輝度調整では、従来の手法が使用される。例えばこの実施形態では、コンピュータビジョンライブラリであるOpenCVの、equalizeHist()関数が使用されている。
(l)第二物体検出起動は、第二物体検出のスレッドを起動するとともに、探索領域の画像情報(図4の符号I_R)を第二物体検出のスレッドに渡す。第二物体検出の(r)画像整形、(s)検出及び(t)物体選択の処理が実施される。これらは、第一物体検出でのこれらの処理と同じである。ただし、探索領域のサイズが416×416ピクセルである場合には、画像整形では、実質的な処理は実施されない。第二物体検出の検出結果(図4の符号O_2)が、次の(m)第二信号推定領域設定に返される。
(m)第二信号推定領域設定及び(n)第二状態判定は、それぞれ前述の(g)第一信号推定領域設定及び(h)第一状態判定と同じである。第二状態判定の結果及び最善の信号BSの情報が、画面表示のための画像情報Iと共にメイン処理に戻される(図4の符号S_2)。これにより、信号判定部のスレッドが終了する。
[メイン処理部の状態遷移]
以下では、前述のメイン処理部の説明では省略された、(c)状態遷移について説明がされる。図9は、メイン処理部のスレッドの状態遷移図である。図9において、状態間の遷移を表す矢印に付された符号G、R、B及びNは、それぞれ信号判定部から返された状態判定の結果に対応している。なお符号Otは、「その他の場合」の意味である。図9で示されるように、メイン処理部のスレッドは、以下の10種類の状態をとりうる。
緑:信号を「緑(青)」と識別している状態
緑2:信号を「緑」と識別しているが確からしさが弱い状態
点滅:信号を「点滅」と識別している状態
点滅2:信号を「点滅」と識別しているが確からしさが弱い状態
赤:信号を「赤」と識別している状態
赤2:信号を「赤」と識別しているが確からしさが弱い状態
不確定:信号又は信号推定領域は存在するが、信号の状態が識別できない状態
無:信号及び信号推定領域が認識できない状態
待機:信号識別の動作を行わず、休止している状態
スヌープ:「待機」から復帰するか否かを判定する状態
メイン処理部のスレッドが起動された直後には、メイン処理部の状態(初期状態)は「無」である。各状態からの状態遷移は、以下の通りに行われる。
「無」では、信号判定の結果が「N」であれば、状態は「無」に留まる。それ以外の場では、状態は「不確定」に遷移する。「無」の状態が所定の時間(この実施形態では3分)以上連続していれば、状態は「待機」に遷移する。このことが、図9では「3m」の符号を付した矢印で、表されている。
「待機」では、この状態になってから所定の時間(この実施形態では1秒)経過後、状態は「スヌープ」に遷移する。このことが、図9では「1s」の符号を付した矢印で、表されている。
「スヌープ」では、信号判定の結果が「N」であれば、状態は「待機」に遷移する。それ以外であれば、状態は「不確定」に遷移する。
「不確定」では、信号判定の結果が「N」であれば、状態は「無」に遷移する。信号判定の結果が2回連続で「G」であれば、状態は「緑」に遷移する。このことが、図9では「G×2」の符号を付した矢印で表されている。信号判定の結果が2回連続で「R」であれば、状態は「赤」に遷移する。このことが、図9では「R×2」の符号を付した矢印で表されている。それ以外であれば、状態は「不確定」に留まる。
「緑」では、信号判定の結果が「G」であれば、状態は「緑」に留まる。信号判定の結果が「B」であれば、状態は「点滅」に遷移する。それ以外であれば、状態は「緑2」に遷移する。
「緑2」では、信号判定の結果が「N」であれば、状態は「無」に遷移する。信号判定の結果が「G」であれば、状態は「緑」に遷移する。信号判定の結果が「B」であれば、状態は「点滅」に遷移する。信号判定の結果が2回連続で「R」であれば、状態は「赤」に遷移する。それ以外であれば、状態は「不確定」に遷移する。
「点滅」では、直近の4回の信号判定の結果のうち、3回以上が「G」であれば、状態は「緑」に遷移する。このことが、図9では「G(3/4)」の符号を付した矢印で表されている。信号判定の結果が上記以外の「G」であれば、状態は「点滅」に留まる。信号判定の結果が「B」であれば、状態は「点滅」に留まる。それ以外であれば、状態は「点滅2」に遷移する。
「点滅2」では、信号判定の結果が「G」又は「B」であれば、状態は「点滅」に遷移する。信号判定の結果が2回連続で「R」であれば、状態は「赤」に遷移する。信号判定の結果が「N」であれば、状態は「無」に遷移する。それ以外であれば、状態は「不確定」に遷移する。
「赤」では、信号判定の結果が「R」であれば、状態は「赤」に留まる。それ以外であれば、状態は「赤2」に遷移する。
「赤2」では、信号判定の結果が「N」であれば、状態は「無」に遷移する。信号判定の結果が「R」であれば、状態は「赤」に遷移する。信号判定の結果が2回連続で「G」であれば、状態は「緑」に遷移する。それ以外であれば、状態は「不確定」に遷移する。
[メイン処理部のユーザー通知]
以下では、前述のメイン処理部の説明では省略された、(d)ユーザー通知について説明がされる。ユーザー通知では、メイン処理部の各状態に基づき、ユーザーに情報発信が行われる。以下では、表示/入力器8による通知、発音器10による通知及びバイブレータ12による通知が全て許可されているとして、各状態での通知内容の例が説明される。
「緑」及び「緑2」の状態:
今回を除く直近の4回の状態に「緑」及び「緑2」が存在せず、かつ「赤」又は「赤2」が存在した場合は、「青になりました」の音声メッセージが通知される。それ以外の場合は、「青です」のメッセージが繰り返し通知される。「青」に対応する音楽又は効果音が、再生される。表示/入力器8の表示画面22の識別結果表示領域24が、緑色となる。バイブレータ12が、「青」に対応するパターンで振動する。
「点滅」及び「点滅2」の状態:
「もうすぐ赤になります」の音声メッセージが繰り返し通知される。表示/入力器8の表示画面22の識別結果表示領域24が、黒色となる。
「赤」及び「赤2」の状態:
今回を除く直近の4回の状態に「赤」及び「赤2」が存在せず、かつ「緑」、「緑2」、「点滅」又は「点滅2」が存在した場合は、「赤になりました」の音声メッセージが通知される。それ以外の場合は、「赤です」のメッセージが繰り返し通知される。「赤」に対応する音楽又は効果音が、再生される。表示/入力器8の表示画面22の識別結果表示領域24が、赤色となる。バイブレータ12が、「赤」に対応するパターンで振動する。
「無」、「待機」、「スヌープ」及び「不確定」の状態:
表示/入力器8の表示画面22の識別結果表示領域24が、白となる。
[カメラ方向補正部]
カメラ方向補正部は、本装置2の姿勢を補正するための情報をユーザーに提供する。カメラ6で撮影した画像が、ランドスケープ又はポートレイトと見なせる範囲となるように、カメラ6の方向を調整させるのが、カメラ方向補正部の目的である。カメラ方向補正部は、加速度センサ14で検知した重力の方向から、本装置2の姿勢を判断する。本装置2の姿勢が良好であれば、カメラ方向補正部は、例えば、バイブレータ12を使用して所定の周期で本装置2を振動させる。本装置2の姿勢を補正した方が良い場合、カメラ方向補正部は、例えば「少し上に向けて下さい」、「少し下に向けて下さい」、「少し右を持ち上げて下さい」、「少し左を持ち上げて下さい」等の音声メッセージを、発音器10を通して再生させる。
[振動監視部]
振動監視部は、加速度センサ14の値を常時監視している。振動監視部は、ユーザーが本装置2をタップしたことを感知して、本装置2の動作モードを変更する。振動監視部は、ユーザーが、タップにより本装置2の動作モードを変更することを可能とする。この実施形態では、振動監視部により、以下の動作モードの変更が実現されている。
・3回連続タップ: 本装置2の、通常の動作モード(識別モード)と、スリープモードとの切り替えが行われる。識別モードにおいて本装置2の背面を3回連続でタップすることで、本装置2はスリープモードとなる。振動監視部は、3回連続タップを検知すると、カメラ6の動作、音の再生及びバイブレータ12の振動を停止させ、メイン処理部のスレッドを削除し、表示/入力器8の画面を黒にする。これにより、本装置2はスリープモードとなる。スリープモードにおいて本装置2の背面を3回連続でタップすることで、本装置2は識別モードとなる。このとき振動監視部は、「識別モードになりました」とのメッセージを再生させ、メイン処理部のスレッドを起動し、カメラ6を動作させる。
・4回連続タップ: カメラ方向補正機能の動作及び停止の切り替えが行われる。識別モードにおいて本装置2の背面を4回連続でタップすることで、振動監視部は、音の再生及びバイブレータ12の振動を停止させ、カメラ方向補正部を起動させる。カメラ方向補正部が動作している状態で本装置2の背面を4回連続でタップすることで、振動監視部は、カメラ方向補正部を停止させる。
・2回連続タップ: 発音器10による音の再生の許可と不許可との切り替えが行われる。音の再生が許可された状態で、振動監視部が2回連続タップを検知すると、振動監視部は、これらの再生を不許可とする。これ以降、発音器10による音声、音楽及び効果音の再生が、いずれも停止される。音の再生が不許可の状態で、振動監視部が2回連続タップを検知すると、振動監視部は、発音器10による音の再生を許可する。
[カスタマイズ部]
図3では示されていないが、本プログラムは、本装置2の動作をカスタマイズするための、カスタマイズ部をさらに備える。カスタマイズ部は、例えば表示/入力器8の画面を上から下にフリックする(素早く動かす)ことで、起動される。カスタマイズ用の画面が、表示/入力器8に表示される。カスタマイズ部の使用者は、本装置2のユーザーである視覚障害者ではなく、主にその支援者である。この実施形態では、カスタマイズ部により、以下の動作のカスタマイズができる。
1)ユーザー通知において、音声メーセージによる通知、効果音と音楽による通知、振動による通知、表示/入力器8による通知のそれぞれについて、許可/不許可の設定ができる。
2)音声メーセージによる通知の際の、メッセージの再生間隔が設定できる。
3)メイン処理部の各状態に対応して、再生する音楽及び効果音の種類が設定できる。
4)表示/入力器8による通知において、識別結果表示領域24の幅が設定できる。
[ニューラルネットワークの学習]
前述のとおり、物体検出では、ニューラルネットワークによる推論で、物体が検出される。検出される物体は、前述のとおり、信号として、青信号、赤信号及び黒信号、横断歩道として、右境界及び左境界である。ニューラルネットワークによる物体検出では、通常全ての物体は「矩形の領域」として検出される。青信号、赤信号及び黒信号については、これらの信号を囲む矩形の領域をニューラルネットワークに学習させることで、これらの検出が可能となる。一方、右境界及び左境界は線分であるため、そのままではニューラルネットワークで検出することが困難である。
本装置2では、「線分」である横断歩道の右境界及び左境界を検出するために、以下の互いに異なる6種類の矩形の物体が、ニューラルネットワークの学習に使用されている。
(1)右上がり線分の左境界(RU_左境界):
図10に示されるとおり、この図の例では、横断歩道の左境界は、右上がりの線分となっている。この線分を囲う矩形の領域を「RU_左境界」として、ニューラルネットワークに学習させる。
(2)左上がり線分の左境界(LU_左境界):
図11に示されるとおり、この図の例では、横断歩道の左境界は、左上がりの線分となっている。この線分を囲う矩形の領域を「LU_左境界」として、ニューラルネットワークに学習させる。
(3)垂直方向線分の左境界(V_左境界):
図12に示されるとおり、この図の例では、横断歩道の左境界は、垂直方向の線分となっている。この線分を囲う矩形の領域を「V_左境界」として、ニューラルネットワークに学習させる。
(4)左上がり線分の右境界(LU_右境界):
図10に示されるとおり、この図の例では、横断歩道の右境界は、左上がりの線分となっている。この線分を囲う矩形の領域を「LU_右境界」として、ニューラルネットワークに学習させる。
(5)右上がり線分の右境界(RU_右境界):
図示されないが、右上がりの線分となっている右境界について、この線分を囲う矩形の領域を「RU_右境界」として、ニューラルネットワークに学習させる。
(6)垂直方向線分の右境界(V_右境界):
図示されないが、垂直線分となっている右境界について、この線分を囲う矩形の領域を「V_右境界」として、ニューラルネットワークに学習させる。
上記の学習をさせることで、横断歩道の境界線は、RU_左境界、LU_左境界、V_左境界、LU_右境界、RU_右境界及びV_右境界の6種類の矩形の物体として検出される。これらのうち、RU_左境界、LU_左境界及びV_左境界が、「左境界」とされる。LU_右境界、RU_右境界及びV_右境界が、「右境界」とされる。これにより、本装置2は、「左境界」及び「右境界」を検出している。
なお、横断歩道の右境界及び左境界を検出するために、RU_左境界、LU_左境界、LU_右境界及びRU_右境界の4種類の物体が、ニューラルネットワークの学習に使用されてもよい。この場合、横断歩道の境界線は、これら4種類の矩形の物体として検出される。これらのうち、RU_左境界及びLU_左境界が「左境界」とされ、LU_右境界及びRU_右境界が「右境界」とされる。
[作用効果]
以下、本発明の作用効果が説明される。
本発明に係る歩行者信号用の信号識別装置2では、周囲の環境を撮影した画像Iから検出した信号(青信号、赤信号、黒信号)及び横断歩道(右境界、左境界)、並びにこれらの検出確度から、信号の状態が判定される。この装置は、信号の状態の判定に、信号の検出結果だけではなく横断歩道の検出結果を併せて使用することで、信号の優れた識別精度を実現している。
従来、画像情報から物体を検出する処理では、検出された物体の検出確度の値から、検出結果が正しいか否かの判断を行なうのが一般的である。例えば、検出確度が所定の値以上であれば、この物体の検出結果が正しいとして採用される。
この実施形態では、横断歩道の右境界及び/又は左境界から、信号推定領域が設定される。前述のとおり、信号が信号推定領域内に存在する場合と、信号推定領域外の信号のみが存在する場合とで、最善の信号BSを現在の信号の状態であると判定するめの、検出確度についての基準が異なっている。換言すれば、最善の信号BSが信号推定領域内に位置するか否かと、この最善の信号BSの検出確度の値とから、現在の信号の状態が判定される。信号の状態を判定に、検出確度だけでなく信号推定領域の情報を併せて使用することで、信号の優れた識別精度が実現されている。
最善の信号BSの検出確度が所定の閾値以上であるときに、これを「現在の信号の状態」と判定する場合、この閾値の値を小さく設定すると、信号の状態の誤判定が起こりやすくなる。この閾値の値を大きく設定すると、この閾値以上の最善の信号が存在ないことが起こり易くなり、効率的な信号の状態の判定ができない。
この実施形態では、前述のとおり、信号が信号推定領域内に存在する場合の閾値Ti1及び閾値Ti2は、信号推定領域外の信号のみが存在する場合の閾値Toより小さい。信号推定領域内に位置する信号は、信号推定領域に位置しない信号と比べて、この信号の検出結果の確からしさは高い。閾値Ti1及び閾値Ti2を小さくしても、信号の状態の誤判定は起こりにくい。閾値Ti1及び閾値Ti2を閾値Toより小さくしても、精度の高い信号の状態判定が実現されうる。閾値Ti1及び閾値Ti2を閾値Toより小さくすることで、効率的に信号の判定ができる。この装置2は、信号に対する優れた識別精度と効率的な識別とを併せて実現している。
この実施形態では、上述のとおり、閾値Ti1は閾値Ti2より小さい。タイプ1の信号推定領域内に位置する信号は、タイプ2の信号推定領域に位置する信号と比べて、この信号の検出結果の確からしさは高い。閾値Ti1を閾値Ti2より小さくしても、信号の状態の誤判定は起こりにくい。閾値Ti1を閾値Ti2より小さくすることで、効率的に信号の判定ができる。この装置2は、信号に対する優れた識別精度と効率的な識別とを併せて実現している。
この実施形態では、第一の物体検出において、画像Iのピクセル数を減らす低解像度化が実施される。通常、物体の検出処理は、他の処理と比べて長い処理時間を要する。画像Iを低解像度化した画像に対して検出処理を実施することで、この検出処理が高速化できる。この装置2では、信号の効率的な識別が可能となっている。
この実施形態では、第一の物体検出において検出された物体に対し第一状態判定が実施される。この結果が「確度不足で判定不可(UC)」の場合に、第一状態判定で選択された最善の信号BSの周辺の領域が、探索領域として画像Iから切り出される。この探索領域に対して第二の物体検出を実施することで、この信号の検出確度を上げることができる。この装置2では、精度の高い物体の検出が可能となる。この装置2は、信号の優れた識別精度を実現している。
この実施形態では、第一の物体検出において検出された物体に対し第一状態判定が実施される。この結果が「信号推定領域のみ存在(Z)」の場合に、信号推定領域の情報から、探索領域が切り出される。信号推定領域では、信号が存在する可能性が他の領域と比べて高い。この探索領域に対して第二の物体検出を実施することで、精度の高い物体の検出が可能となる。この装置2は、信号の優れた識別精度を実現している。
この実施形態では、探索領域の画像情報に対し輝度調整が実施される。探索領域の画像情報の輝度の分布の偏りが解消されるため、第二の物体検出においてより精度の高い物体の検出が可能となる。この装置2は、信号の優れた識別精度を実現している。
この実施形態では、物体検出は、ニューラルネットワークを使用して実現されている。ニューラルネットワークでは、横断歩道の境界線は、この境界線を囲む矩形の領域として学習されている。このとき、境界線は、右上がりの線分の場合及び左上がりの線分の場合で、異なる物体として学習されている。境界線は、右上がりの線分を囲う矩形の物体及びの左上がりの線分を囲う矩形の物体として検出される。これにより、物体を矩形の領域として検出する従来のニューラルネットワークのプログラムによって、横断歩道の境界線の検出が可能となっている。
ニューラルネットワークでは、横断歩道の境界線は、右上がりの線分の場合、左上がりの線分、及び垂直線分の場合で、異なる物体として学習されているのがより好ましい。境界線が右上がりの線分の場合及び左上がりの線分の場合に加え、境界線が垂直線の場合も異なる物体として学習することにより、横断歩道の境界線が垂直線となっている場合にも、この境界線の検出ができる。これにより、境界線の検出率が向上されうる。
この実施形態では、カメラ方向補正部が、加速度センサ14の計測結果からこの装置2の姿勢を補正するための情報を生成する。これにより、ユーザーは、ランドスケープ又はポートレイトと見なせる範囲の画像が撮影できる。これは、物体検出による、物体の検出精度の向上に寄与する。この装置2は、信号の優れた識別精度を実現している。
[その他の実施形態]
上記で説明された実施形態では、メイン処理、信号判定及び物体検出の処理は、演算ユニットでプログラムを実行することで実現されている。これらの処理の一部が、専用のハードウエアで実現されていてもよい。例えば、本装置2がニューラルネットワークの推論を実行する専用回路を有しており、物体検出部の検出の処理が、この専用回路で行われてもよい。
上記で説明された実施形態では、メイン処理部、信号判定部及び物体検出部は、それぞれ異なるスレッドとして実行されている。これらのいずれかが二つ又はこれら全てが、一つのスレッドとして実行されてもよい。例えば信号判定及び物体検出が、一つのスレッドとして実行されてもよい。
上記で説明された実施形態では、第一状態判定の結果が、「青信号(G)」、「赤信号(R)」、「黒信号(B)」の場合は、この結果をメイン処理部に返して、信号判定が終了される。第一状態判定の結果が「青信号(G)」、「赤信号(R)」、「黒信号(B)」の場合にも、信号判定を終了せず、第二物体検出、第二信号推定及び第二状態判定の処理が実施されてもよい。この実施形態では、第一物体検出、第一信号推定領域設定及び第一状態判定により、低解像度化された画像から最善の信号BSが高速に選択される。最善の信号BSを使用した探索領域設定、第二物体検出、第二信号推定領域設定及び第二状態判定により、高い精度の状態判定が可能となる。この装置は、信号に対する優れた識別精度と効率的な識別とを併せて実現している。
以上説明されたとおり、本信号識別装置では、優れた識別精度が実現されている。このことから、本発明の優位性は明らかである。
以上説明された信号識別装置は、種々の信号の識別にも適用されうる。
2・・・信号識別装置
4・・・演算ユニット
6・・・カメラ
8・・・表示/入力器
10・・・発音器
12・・・バイブレータ
14・・・加速度センサ
16・・・演算器
18・・・メモリ
20・・・インターフェース
22・・・表示画面
24・・・識別結果表示領域
26・・・メイン処理
28・・・信号判定
29・・・物体検出
30・・・カメラ方向補正
31・・・振動監視
34・・・黒帯部
36・・・青信号
38、44、52・・・右境界
40、46・・・左境界
42、50、60、61・・・信号推定領域
56・・・信号を囲む矩形
57、58、59・・・探索領域

Claims (10)

  1. 周囲の環境を撮影して画像情報を取得する画像情報取得手段と、
    上記画像情報から、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う物体検出手段と、
    上記信号、横断歩道及び検出確度から現在の信号の状態を判定する、状態判定手段
    とを備える、歩行者信号機用の信号識別装置。
  2. 上記横断歩道から信号が存在すると推定できる領域を設定する、信号推定領域の設定手段をさらに備え、
    上記状態判定手段が、
    上記信号推定領域内に上記物体検出手段で検出された信号が存在する場合に、この信号推定領域内の信号のうち検出確度が最大の信号を最善の信号として選択する第一の信号選択手段と、
    上記第一の信号選択手段で選択された最善の信号の検出確度の値により、この最善の信号を現在の信号の状態とするか否かを判定する第一の信号判定手段と、
    上記物体検出手段で検出された信号は存在するが上記信号推定領域内に位置する信号がない場合に、これらの物体検出手段で検出された信号のうち検出確度が最大の信号を最善の信号として選択する第二の信号選択手段と、
    上記第二の信号選択手段で選択された最善の信号の検出確度の値により、この最善の信号を現在の信号の状態とするか否かを判定する第二の信号判定手段とを備え、
    上記第一の信号判定手段と第二の信号判定手段とで、判定の基準が異なっている、請求項1に記載の信号識別装置。
  3. 上記第一の判定手段では、最善の信号の検出確度が所定の閾値Ti以上であればこの最善の信号が現在の信号の状態と判定され、
    上記第二の判定手段では、最善の信号の検出確度が所定の閾値To以上であればこの最善の信号が現在の信号の状態と判定され、
    上記閾値Tiが上記閾値Toより小さい、請求項2に記載の信号識別装置。
  4. 上記物体検出手段では、横断歩道はその幅を規定している境界線が検出され、
    上記信号推定領域には、上記物体検出手段において横断歩道の幅を規定している右側の境界線と左側の境界線の両方が検出できたときにこれらの境界線から設定されるタイプ1の信号推定領域と、上記物体検出手段において横断歩道の幅を規定している右側の境界線及び左側の境界線のいずれか一方のみが検出できたときにこの境界線から設定されるタイプ2の信号推定領域とが存在し、
    上記第一の判定手段では、上記信号推定領域がタイプ1である場合には、最善の信号の検出確度が所定の閾値Ti1以上であればこの最善の信号が現在の信号の状態と判定され、上記信号推定領域がタイプ2である場合には、最善の信号の検出確度が所定の閾値Ti2以上であればこの最善の信号が現在の信号の状態と判定され、
    上記第二の判定手段では、最善の信号の検出確度が所定の閾値To以上であればこの最善の信号が現在の信号の状態と判定され、
    上記閾値Ti1が上記閾値Ti2より小さく、上記閾値Ti2が上記閾値Toより小さい、請求項2に記載の信号識別装置。
  5. 上記画像情報のピクセル数を減らす低解像度化手段と、
    上記低解像度化した画像情報に対し、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う第一の物体検出手段と、
    上記第一の物体検出手段で得られた信号、横断歩道及び検出確度から現在の信号の状態を判定する第一の状態判定手段と、
    上記第一の状態判定手段の結果より、上記低解像度化する前の画像情報から探索すべき領域を切り出す、探索領域切り出し手段と、
    上記探索領域の画像情報に対し、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う第二の物体検出手段と、
    上記第二の物体検出手段で得られた信号、横断歩道及び検出確度から現在の信号の状態を判定する第二の状態判定手段
    とを備える、請求項1から4のいずれかに記載の信号識別装置。
  6. 上記探索領域の画像情報に対し輝度調整を行う輝度調整手段をさらに備え、
    この輝度調整された画像情報に対し、上記第二の物体検出手段が実施される、請求項5に記載の信号識別装置。
  7. 上記物体検出手段が、ニューラルネットワークを使用して実現されており、
    上記ニューラルネットワークでは、横断歩道の幅を規定している境界線が、この境界線を囲む矩形の領域として学習されており、
    上記境界線が、右上がりの線分の場合及び左上がりの線分の場合で、異なる物体として学習されている、請求項1から6のいずれかに記載の信号識別装置。
  8. 上記境界線が、右上がりの線分の場合、左上がりの線分の場合、及び垂直線分の場合で、互いに異なる物体として学習されている、請求項7に記載の信号識別装置。
  9. 加速度センサ及びカメラ方向補正手段をさらに備え、
    上記カメラ方向補正手段が、上記加速度センサの計測結果からこの装置の姿勢を補正するための情報を生成する、請求項1から8のいずれかに記載の信号識別装置。
  10. 演算器を有する携帯機器において動作するプログラムであって、
    上記演算器に対して、
    周囲の環境を撮影した画像情報から、信号及び横断歩道の検出、並びにこれらの検出結果の確からしさを表す検出確度の生成を行う物体検出処理と、
    上記信号、横断歩道及び検出確度から現在の信号の状態を判定する、状態判定処理
    とを実行させる、歩行者信号機用の信号識別プログラム。
JP2020019528A 2020-02-07 2020-02-07 歩行者信号識別装置 Expired - Fee Related JP6737968B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020019528A JP6737968B1 (ja) 2020-02-07 2020-02-07 歩行者信号識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020019528A JP6737968B1 (ja) 2020-02-07 2020-02-07 歩行者信号識別装置

Publications (2)

Publication Number Publication Date
JP6737968B1 JP6737968B1 (ja) 2020-08-12
JP2021125076A true JP2021125076A (ja) 2021-08-30

Family

ID=71949386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020019528A Expired - Fee Related JP6737968B1 (ja) 2020-02-07 2020-02-07 歩行者信号識別装置

Country Status (1)

Country Link
JP (1) JP6737968B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7219834B1 (ja) 2022-03-22 2023-02-08 三菱電機インフォメーションシステムズ株式会社 状態判定装置、状態判定方法及び状態判定プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0546897A (ja) * 1991-08-09 1993-02-26 Omron Corp 衝突防止装置
JP2003256987A (ja) * 2002-03-01 2003-09-12 Nec Corp 交差点信号案内補助システム
JP2014013204A (ja) * 2012-07-05 2014-01-23 Casio Comput Co Ltd 方角表示装置及び方角表示システム
JP2016197310A (ja) * 2015-04-03 2016-11-24 三菱電機株式会社 車両用映像記録装置および車両周辺映像の記録方法
JP2020021121A (ja) * 2018-07-30 2020-02-06 エヌ・ティ・ティ・コムウェア株式会社 路面標示画像処理装置、路面標示画像処理方法及び路面標示画像処理プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0546897A (ja) * 1991-08-09 1993-02-26 Omron Corp 衝突防止装置
JP2003256987A (ja) * 2002-03-01 2003-09-12 Nec Corp 交差点信号案内補助システム
JP2014013204A (ja) * 2012-07-05 2014-01-23 Casio Comput Co Ltd 方角表示装置及び方角表示システム
JP2016197310A (ja) * 2015-04-03 2016-11-24 三菱電機株式会社 車両用映像記録装置および車両周辺映像の記録方法
JP2020021121A (ja) * 2018-07-30 2020-02-06 エヌ・ティ・ティ・コムウェア株式会社 路面標示画像処理装置、路面標示画像処理方法及び路面標示画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7219834B1 (ja) 2022-03-22 2023-02-08 三菱電機インフォメーションシステムズ株式会社 状態判定装置、状態判定方法及び状態判定プログラム
JP2023139590A (ja) * 2022-03-22 2023-10-04 三菱電機インフォメーションシステムズ株式会社 状態判定装置、状態判定方法及び状態判定プログラム

Also Published As

Publication number Publication date
JP6737968B1 (ja) 2020-08-12

Similar Documents

Publication Publication Date Title
JP6421754B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN110100251B (zh) 用于处理文档的设备、方法和计算机可读存储介质
KR101660576B1 (ko) 시각 장애 사용자들에 의한 이미지 캡처 및 이미지 검토의 촉진
US20110317031A1 (en) Image pickup device
US20140232645A1 (en) Method and apparatus for providing input through an apparatus configured to provide for display of an image
WO2019128101A1 (zh) 一种投影区域自适应的动向投影方法、装置及电子设备
JP5854280B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2013235582A (ja) ユーザの顔分析結果によって移動端末を制御する装置及び方法
TWI617994B (zh) 使用於互動裝置並用於辨識使用者操作該互動裝置的行為的方法,以及相關互動裝置與電腦可讀媒體
TW201633215A (zh) 護眼系統及方法
WO2020248950A1 (zh) 一种面部特征的有效性判定方法及电子设备
CN105957037B (zh) 图像增强方法及装置
JP2012079167A (ja) 情報処理装置、情報処理システムおよび情報処理方法
KR20130122411A (ko) 이미지 획득 장치 및 이미지 획득 장치의 동작 방법
US20220329729A1 (en) Photographing method, storage medium and electronic device
JP6737968B1 (ja) 歩行者信号識別装置
JP6651086B1 (ja) 画像分析プログラム、情報処理端末、及び画像分析システム
WO2022057384A1 (zh) 拍摄方法和装置
CN110286813A (zh) 图标位置确定方法和装置
US8736705B2 (en) Electronic device and method for selecting menus
WO2022266998A1 (zh) 一种智能交互平板及其亮度调节方法
WO2021197085A1 (zh) 屏下摄像头终端设备的误触提醒方法和装置
JP2008130015A (ja) 被写体識別プログラム、および被写体識別装置
CN111899615B (zh) 实验的评分方法、装置、设备及存储介质
TW201826250A (zh) 顯示裝置及其顯示參數調整方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200207

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200210

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200716

R150 Certificate of patent or registration of utility model

Ref document number: 6737968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees