JP2021519968A - 交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器 - Google Patents

交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器 Download PDF

Info

Publication number
JP2021519968A
JP2021519968A JP2020550090A JP2020550090A JP2021519968A JP 2021519968 A JP2021519968 A JP 2021519968A JP 2020550090 A JP2020550090 A JP 2020550090A JP 2020550090 A JP2020550090 A JP 2020550090A JP 2021519968 A JP2021519968 A JP 2021519968A
Authority
JP
Japan
Prior art keywords
signal light
traffic signal
state
traffic
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020550090A
Other languages
English (en)
Other versions
JP7111827B2 (ja
Inventor
▲賀▼璋 王
▲賀▼璋 王
宇宸 ▲馬▼
宇宸 ▲馬▼
天▲曉▼ 胡
天▲曉▼ 胡
星宇 ▲曾▼
星宇 ▲曾▼
俊杰 ▲イェン▼
俊杰 ▲イェン▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Publication of JP2021519968A publication Critical patent/JP2021519968A/ja
Application granted granted Critical
Publication of JP7111827B2 publication Critical patent/JP7111827B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/09623Systems involving the acquisition of information from passive traffic signs by means mounted on the vehicle
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18154Approaching an intersection
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18159Traversing an intersection
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/04Detecting movement of traffic to be counted or controlled using optical or ultrasonic detectors
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2552/00Input parameters relating to infrastructure
    • B60W2552/53Road markings, e.g. lane marker or crosswalk

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)
  • Lighting Device Outwards From Vehicle And Optical Signal (AREA)

Abstract

本開示の実施形態では、交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器を開示し、交通信号灯検出方法は、交通信号灯を含むビデオストリームを取得し、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定することを含む。【選択図】図1

Description

<関連出願の相互参照>
本願は、2018年6月29日に中国特許局に提出された、出願番号CN201810697683.9、発明の名称「交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器」の中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。
本開示は、コンピュータビジョン技術に関し、特に、交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器に関する。
交通信号灯の検出及びその状態判定は、インテリジェントドライブの分野での重要な課題です。交通信号灯は重要な交通信号であって、現代交通システムにおける代替不可能な作用を有する。交通信号灯の検出及びその状態判定は、自動運転中に車両の停止または進行を指示して車両の安全的な走行を保証することができる。
本開示の実施形態には、交通信号灯検出及びインテリジェントドライブの技術を提供する。
本開示の実施形態の一態様には、交通信号灯検出方法を提供し、検出ネットワークは、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークを含み、
前記交通信号灯検出方法は、
交通信号灯を含むビデオストリームを取得し、
前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、
前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定することを含む。
本開示の実施形態の別の態様には、インテリジェントドライブ方法を提供し、
前記インテリジェントドライブ方法は、車両に配置された画像収集装置により交通信号灯を含むビデオストリームを取得し、
前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、
前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定し、
前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定し、
前記交通信号灯の状態により前記車両に対してインテリジェント制御を実行することを含む。
本開示の実施形態の更に別の態様には、交通信号灯検出装置を提供し、
前記交通信号灯検出装置は、ビデオストリーム取得ユニットと、領域決定ユニットと、属性認識ユニットとを含み、
前記ビデオストリーム取得ユニットは、交通信号灯を含むビデオストリームを取得するために用いられ、
前記領域決定ユニットは、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定するために用いられ、
前記属性認識ユニットは、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定するために用いられる。
本開示の実施形態のまた1つの態様には、インテリジェントドライブ装置を提供し、
前記インテリジェントドライブ装置は、ビデオストリーム取得ユニットと、領域決定ユニットと、属性認識ユニットと、状態決定ユニットと、インテリジェント制御ユニットとを含み、
前記ビデオストリーム取得ユニットは、車両に配置された画像収集装置により交通信号灯を含むビデオストリームを取得するために用いられ、
前記領域決定ユニットは、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定するために用いられ、
前記属性認識ユニットは、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定するために用いられ、
前記状態決定ユニットは、前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定するために用いられ、
前記インテリジェント制御ユニットは、前記交通信号灯の状態により前記車両に対してインテリジェント制御を実行するために用いられる。
本開示の実施形態の更にまた1つの態様には、以上のいずれか一項に記載の交通信号灯検出装置又は以上のいずれか一項に記載のインテリジェントドライブ装置を含む車両を提供する。
本開示の実施形態の更にまた1つの態様には、プロセッサを含む電子機器を提供し、前記プロセッサは、以上のいずれか一項に記載の交通信号灯検出装置又は以上のいずれか一項に記載のインテリジェントドライブ装置を含む。
本開示の実施形態の別の態様には、メモリと、プロセッサとを含む電子機器を提供し、前記メモリは、実行可能コマンドを記憶するために用いられ、前記プロセッサは、前記メモリと通信して前記実行可能コマンドを実行して以上のいずれか一項に記載の交通信号灯検出方法の操作を完成するか、又は以上のいずれか一項に記載のインテリジェントドライブ方法の操作を完成するために用いられる。
本開示の実施形態の更に別の態様には、コンピュータ読取可能コマンドを記憶するためのコンピュータ読取可能記憶媒体を提供し、前記コンピュータ読取可能コマンドが機器で実行されると、前記機器のプロセッサは、以上のいずれか一項に記載の交通信号灯検出方法又は以上のいずれか一項に記載のインテリジェントドライブ方法の操作を実行するためのコマンドを実行する。
本開示の実施形態の別の態様には、コンピュータ可読コードを含むコンピュータプログラム製品を提供し、前記コンピュータ可読コードが機器上で実行されると、前記機器中のプロセッサは以上のいずれか一項に記載の交通信号灯検出方法又は以上のいずれか一項に記載のインテリジェントドライブ方法を実現するためのコマンドを実行する。
本開示の上記実施形態で提供された交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器によれば、交通信号灯を含むビデオストリームを取得し、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定し、交通信号灯の少なくとも2種の属性を取得することにより信号灯の多種の情報の認識を実現する。これにより、認識時間が少なくなり、交通信号灯の認識の正確率が高められる。
以下、図面及び実施形態を通じて本開示の技術的手段をさらに詳しく説明する。
明細書の一部を構成する図面は、本発明の実施形態を説明し、その説明と共に本発明の原理を解釈することに用いられる。
図面を参照し、以下の詳細な説明により本発明をより明瞭に理解することができる。
本開示により提供された交通信号灯検出方法のフローチャートである。 本開示により提供された交通信号灯検出装置の構造模式図である。 本開示により提供されたインテリジェントドライブ方法のフローチャートである。 本開示により提供されたインテリジェントドライブ装置の構造模式図である。 本開示の実施形態の端末装置又はサーバを実現するのに適する電子機器の構造模式図である。
ここで、図面を参照しながら本発明の様々な例示的な実施形態を詳細に説明する。なお、特に断らない限り、これらの実施形態で記述した部材及びステップの相対的配置、数式及び値は本発明の範囲を限定するものではないことに注意すべきである。
同時に、説明の便宜上、図面に示した各部分の寸法は実際の比例関係に従って描いたものではないことを理解すべきである。
以下の少なくとも一つの例示的な実施形態に対する説明は、実際に単なる例示に過ぎず、本発明及びその適用または使用を何ら限定するものではない。
関連分野の当業者に既知の技術、方法及び機器は、詳細に説明されない場合があるが、適切な場合によって、前記技術、方法及び機器は明細書の一部と見なされるべきである。
なお、類似する符号及び英文字は以下の図面における類似項目を表し、従って、ある一項が一つの図面における定義されれば、以降の図面におけるそれをさらに説明する必要がないことに注意すべきである。
本発明の実施形態はコンピュータシステム/サーバに適用可能であり、それは他の様々な共通または専用計算システム環境または構成と共に動作することができる。コンピュータシステム/サーバとの併用に適する公知の計算システム、環境及び/または構成の例は、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、ファットクライアント、手持ちまたはラップトップデバイス、マイクロプロセッサに基づくシステム、セットトップボックス、プログラマブル消費者用電子機器、ネットワークパソコン、小型コンピュータシステム、大型コンピュータシステム及び前記の任意のシステムを含む分散型クラウドコンピューティング技術環境などを含むが、これらに限定されない。
コンピュータシステム/サーバはコンピュータシステムにより実行されるコンピュータシステム実行可能コマンド(例えば、プログラムモジュール)の一般的な言語環境における記述できる。通常、プログラムモジュールはルーチン、プログラム、目的プログラム、コンポーネント、ロジック、データ構造などを含んでよく、それらは特定のタスクを実行するかまたは特定の抽象データ型を実現する。コンピュータシステム/サーバは分散型クラウドコンピューティング環境における実施でき、分散型クラウドコンピューティング環境における、タスクは通信ネットワークを介してリンクされた遠隔処理機器により実行される。分散型クラウドコンピューティング環境における、プログラムモジュールは記憶機器を含むローカル計算システムまたは遠隔計算システムの記憶媒体に存在してもよい。
図1は本開示により提供された交通信号灯検出方法のフローチャートである。この方法は、例えば端末装置、サーバ、携帯機器、車載機器等の任意の電子機器により実行することができる。図1に示すように、この実施形態の方法は、以下のステップを含む。
ステップ110で、交通信号灯を含むビデオストリームを取得する。
あるいは、交通信号灯の認識は、一般的には車両走行中記録される車載ビデオに基づいて、車載ビデオを解析して少なくとも1つのフレームの画像を含むビデオストリームを取得する。例えば、車両に取り付けられた撮影装置により車両進行方向又は周囲環境を撮影することができる。車両進行方向又は周囲環境に交通信号灯が存在する場合、撮影装置により撮影されることが、撮影したビデオストリームが交通信号灯を含むビデオストリームとなる。このビデオストリームのフレームごとの画像は交通信号灯の画像を含んでもよいし、または少なくとも1つのフレームの画像は交通信号灯の画像を含んでもよい。
任意の一例では、このステップ110はプロセッサによりメモリに記憶された対応するコマンドを呼び出して実行されてもよく、プロセッサにより作動するビデオストリーム取得ユニット21によって実行されてもよい。
ステップ120で、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定する。
あるいは、ビデオストリームにおける交通信号灯を含む画像から候補領域を決定し、この候補領域は、画像に交通信号灯を含む可能性がある領域を指す。
交通信号灯の領域の検出は、ニューラルネットワーク又は他の種類の検出モデルに基づいて実行することができる。
1つ又は複数の任意の実施形態では、領域に基づく完全畳み込みネットワークを用いて、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定する。領域に基づく完全畳み込みネットワーク(region−based、fully convolutional networks、R−FCN)により信号画像を検出して交通信号灯を含む可能性がある候補領域を取得し、R−FCNは高速畳み込みニューラルネットワーク(Faster Regions with CNN、Faster RCNN)を改良したものと見なしてよく、検出速度がFaster RCNNと比べて速くなった。
任意の一例では、このステップ120はプロセッサによりメモリに記憶された対応するコマンドを呼び出して実行されてもよく、プロセッサにより作動する領域決定ユニット22によって実行されてもよい。
ステップ130で、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定する。
交通信号灯の属性は、交通信号灯を記述するためのものであり、実際の要求に応じて定義してよく、例えば、交通信号灯の絶対位置又は相対位置を記述するための位置領域属性、交通信号灯の色(例えば、赤、緑、黄等)を記述するための属性、交通信号灯の形状(例えば、円形、直線矢印、折り線矢印等)を記述するための属性、及び交通信号灯の他の方面を記述するための他の属性等を含んでよい。
あるいは、交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含む。
あるいは、交通信号灯の色は赤、黄、緑という3種を含み、形状は矢印、円形又は他の形状等を含み、異なる形状の交通信号灯は、その位置のみを認識する場合、信号を精度よく認識できない可能性があるので、本実施形態では、位置領域、色及び形状の少なくとも2種を認識することにより、例えば、交通信号灯の位置領域と色を決定する場合に、現在の交通信号灯が画像のどの位置にあるか(車両のどの方向に対応するか)を決定でき、色により交通信号灯が表示する状態を決定でき(赤、緑又は黄がそれぞれ異なる状態に対応し)、交通信号灯の異なる状態の認識により運転支援又は自動運転を実現でき、また、交通信号灯の位置領域と形状を決定する場合に、現在の交通信号灯が画像のどの位置にあるか(車両のどの方向に対応するか)を決定でき、形状により交通信号灯が表示する状態を決定でき(例えば、異なる方向を指す矢印は異なる状態を示し、又は異なる形状の人体アイコンは異なる状態を示す)、また、交通信号灯の色と形状を決定する場合に、色と形状の両方を基に現在の交通信号灯の状態を決定でき(例えば、左方向を指す緑矢印は左折通行を示し、前を指す赤矢印は前方通行禁止を示す)、また、交通信号灯の位置領域、色及び形状を決定する場合に、交通信号灯が画像のどの位置にあるかを分かった上で、色と形状の両方を基に現在の交通信号灯の状態を決定でき、本実施形態では、これらの3種の属性のうちの2種又は2種以上を組み合わせることにより、交通信号灯の属性特徴を更に明らかにすることができ、検出、認識等の処理の効果が高められることに有利である。
任意の一例では、このステップ130はプロセッサによりメモリに記憶された対応するコマンドを呼び出して実行されてもよく、プロセッサにより作動する属性認識ユニット23によって実行されてもよい。
本開示の上記実施形態で提供された交通信号灯検出方法によれば、交通信号灯を含むビデオストリームを取得し、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定し、交通信号灯の少なくとも2種の属性を取得することにより信号灯の多種の情報の認識を実現する。認識時間が少なくなり、交通信号灯の認識の正確率が高められる。
交通信号灯の少なくとも2種の属性の決定は、ニューラルネットワーク又は他の種類の認識モデルに基づいて実行することができる。1つ又は複数の任意の実施形態では、操作130は、マルチタスク認識ネットワークを用いて、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定するステップを含んでよい。
本実施形態では、1つのネットワークにより交通信号灯の少なくとも2種の属性の認識を実現する。それぞれ少なくとも2つのネットワークに基づいて少なくとも2種の属性を認識する場合と比べて、ネットワークの大きさが小さくなり、交通信号灯の属性認識の効率が高められる。
マルチタスク認識ネットワークにより交通信号灯を含む可能性がある候補領域を認識する認識プロセスは、特徴抽出と属性認識という2つの部分を含んでよく、この2部分の機能を実現するために、マルチタスク認識ネットワークは、特徴抽出ブランチと、それぞれ特徴抽出ブランチに接続される少なくとも2つのタスクブランチとを含んでよく、異なるタスクブランチは、交通信号灯の様々の属性を決定するために用いられる。
すべての属性認識タスクは、いずれも候補領域に対して特徴抽出を実行する必要があり、本実施形態では、特徴抽出ブランチをそれぞれ少なくとも2つのタスクブランチに接続して、少なくとも2つのタスクブランチの特徴抽出操作を同じ特徴抽出ブランチで合わせて実行することにより、少なくとも2つのタスクブランチのそれぞれについての特徴抽出が必要とされなく、マルチタスク認識ネットワークの構造が縮減され、属性認識の速度が速くなった。
あるいは、少なくとも2種の属性を取得することは、
特徴抽出ブランチに基づいて候補領域に対して特徴抽出を実行して候補特徴を取得し、
それぞれ少なくとも2つのタスクブランチに基づいて候補特徴を処理して画像における交通信号灯の少なくとも2種の属性を取得することを含んでよい。
あるいは、特徴抽出ブランチは、少なくとも1層の畳み込み層を含んでよく、候補領域を入力画像として、特徴抽出ブランチにより候補領域に対して特徴抽出を実行して候補領域の候補特徴(特徴マップ又は特徴ベクトル)を取得し、この候補特徴に基づいて、少なくとも2つのタスクブランチにより交通信号灯の位置と色、又は交通信号灯の位置と形状、又は交通信号灯の色と形状を取得することができる。より良い効果の実施形態では、マルチタスクブランチにより信号灯の色、位置及び形状が同時に取得され、信号灯位置を検出すると共に、信号灯の色により現在の信号灯状態を認識することが実現される。これは、自動運転分野に好適に適用することができ、信号灯形状の認識により信号灯認識の正確率が高められることができる。
あるいは、少なくとも2つのタスクブランチは、検出ブランチ、認識ブランチ及び分類ブランチを含むが、それらに限定されなく、この方法は、
それぞれ少なくとも2つのタスクブランチに基づいて候補特徴を処理して画像における交通信号灯の少なくとも2種の属性を取得し、
検出ブランチにより候補特徴に対して位置検出を実行して交通信号灯の位置領域を決定し、
分類ブランチにより候補特徴に対して色の分類を実行して、交通信号灯の所在する位置領域の色を決定して、交通信号灯の色を決定し、
認識ブランチにより候補特徴に対して形状認識を実行して、交通信号灯の所在する位置領域の形状を決定して、交通信号灯の形状を決定することを含む。
本実施形態では、異なるブランチにより交通信号灯の位置領域、色、形状の任意2種又は3種の属性の認識を同時に実現することにより、マルチタスク認識の時間が節約され、検出ネットワークの大きさが縮小され、マルチタスク認識ネットワークがトレーニングと応用プロセスですべて速くなる。先に交通信号灯の位置領域を取得する場合に、交通信号灯の色と形状をより速く得ることができ、信号灯の色が通常3種(赤、緑及び黄)しかないので、色の認識はトレーニングされた分類ブランチ(一般マルチタスク認識ネットワークの畳み込み層以外の他のネットワーク層)を用いて実現することができる。
実際のシーンでの交通信号灯検出及びその状態判定が非常に困難となっており、まず、光照射、天気等の環境因子に影響されて、交通信号灯の色判定が非常に困難となっており、また、複雑な現実的シーンにおける例えば、車両のライト、街灯等の多くの類似的な妨害要素が存在して交通信号灯の検出に影響を及ぼす。本開示の上記実施形態に基づいて、交通信号灯の位置領域、色、形状の2種以上を同時に検出することにより、検出時間が節約され、検出の正確度が高められる。
1つ又は複数の任意の実施形態では、ステップ120の前に、この方法は、
ビデオストリームの少なくとも1つのフレームの画像に対してキーポイント認識を実行して、画像における交通信号灯のキーポイントを決定し、
ビデオストリームの交通信号灯のキーポイントを追跡して追跡結果を取得し、
追跡結果に基づいて交通信号灯の位置領域を調整することを更に含んでもよい。
ビデオストリームの連続したフレームの間に存在する差異が小さいことがあり、少なくとも1つのフレームの画像における交通信号灯の候補領域のみに基づいて交通信号灯の位置認識を実行する場合に、連続したフレーム中の位置領域を同様の位置領域と認識して、認識された位置領域が不精確になる可能性がある。本実施形態では、画像に対してキーポイント認識を実行し、キーポイントに基づいて交通信号灯の画像における位置領域を決定し、このキーポイントの位置領域に基づいてマルチタスク認識ネットワークが取得した交通信号灯の位置を調整することにより、位置領域認識の正確率が高められる。
キーポイント認識及び/又は追跡は、従来技術におけるキーポイント認識及び/又は追跡を実現する可能な任意の技術に基づいて実現することができる。あるいは、静的キーポイント追跡技術に基づいてビデオストリームの交通信号灯のキーポイントの追跡を実現することで、ビデオストリームにおける交通信号灯のキーポイントが存在する可能な領域を取得する。
検出ブランチにより取得される交通信号灯の位置領域には、連続した画像の間の微細の差と閾値の選択によってはあるフレームの検出漏れが発生しやすく、静的キーポイント追跡技術を利用することにより、検出ネットワークによる車載ビデオの検出効果が高められる。
画像の特徴点は、画像における比較的著しい点、例えば角点、暗い領域における輝点等と簡単に理解できる。まず特徴検出と記述(Oriented FAST and Rotated BRIEF、ORB)特徴点を認識し、ORB特徴点は特徴点の周囲の画像の階調値に基づいて定義され、検出する時に、候補特徴点の周囲の一回りの画素値を考慮し、候補点の周囲領域に、十分な画素点と候補特徴点の間の階調値の差が所定値に達した場合、この候補点が1つのキー特徴点見なされる。本実施形態では、交通信号灯のキーポイントを認識するので、キーポイントが交通信号灯のキーポイントであり、この交通信号灯のキーポイントによりビデオストリームでの交通信号灯の静的追跡を実現する。交通信号灯は、通常、画像内の1つの画素点を占用するだけでなく、即ち、本実施形態では、取得される交通信号灯のキーポイントは少なくとも1つの画素点を含み、交通信号灯のキーポイントが1つの位置領域に対応すると理解してもよい。
あるいは、ビデオストリームの交通信号灯のキーポイントを追跡することは、
連続した2つのフレームの画像における交通信号灯のキーポイントの間の距離を基礎とし、
交通信号灯のキーポイントの間の距離に基づいてビデオストリームの交通信号灯のキーポイントを追跡することを含む。
本実施形態では、いわゆる連続した2つのフレームは、ビデオストリームにおけるタイミングが連続した2つの収集フレームであってもよく、ビデオストリームにおけるタイミングが連続した2つの検出フレームであってもよく(ビデオストリームにおけるフレームごとに検出することも可能であって、サンプリングして検出することも可能であるので、検出フレームと収集フレームの両方の意味は完全に同様であるというわけではない)、ビデオストリームにおける複数の連続した2つのフレームの画像の交通信号灯のキーポイントを関連付けることにより、ビデオストリームにおける交通信号灯のキーポイントを追跡することを実現することができ、追跡結果に基づいてビデオストリームの少なくとも1つのフレームの画像に対して位置領域の調整を実行することができる。あるいは、交通信号灯のキーポイントの間のハミング距離、ユークリッド距離、結合ベイズ距離又はコサイン距離等に基づいて、ビデオストリームにおける交通信号灯のキーポイントを追跡することを実現することができる。本実施には、具体的に交通信号灯のキーポイントの間のどのような距離を限定するものではない。
ここで、ハミング距離はデータ伝送誤り制御コードに用いられるものであり、ハミング距離は概念であり、(等しい文字数を持つ)2つの文字列の中で、対応する位置にある異なった文字の個数を示し、2つの文字列に対して排他的論理和演算を実行して結果が1である個数を計測してこの個数がハミング距離となり、2つの画像の間のハミング距離は2つの画像の間の異なったデータビットの数である。2つのフレームの信号画像における少なくとも1つの交通信号灯のキーポイントの間のハミング距離に基づいて2つの信号画像の間で信号灯が移動する距離を知ることができ、即ち交通信号灯のキーポイントの追跡を実現することができる。
あるいは、交通信号灯のキーポイントの間の距離に基づいてビデオストリームの交通信号灯のキーポイントを追跡することは、
交通信号灯のキーポイントの間の距離に基づいて、連続した2つのフレームの画像における同じ交通信号灯のキーポイントの位置領域を決定し、
同じ交通信号灯のキーポイントが連続した2つのフレームの画像に所在する位置領域により、ビデオストリームにおける交通信号灯のキーポイントを追跡することを含む。
交通信号灯は、一般的には単独して現れるものではなく、且つ画像における1つのキーポイントにより表示することができないため、画像に少なくとも1つの交通信号灯のキーポイントを含み、異なる交通信号灯(例えば、同じ画像における進行交通信号灯、左折交通信号灯同時に表示することができる)についてはそれぞれ追跡する必要がある。本実施形態では、同じ交通信号灯のキーポイントに基づいて連続したフレームにおける追跡することにより、異なる交通信号灯の追跡が混乱に陥るという問題が克服される。
あるいは、連続した2つのフレームの画像における同じ交通信号灯のキーポイントの位置領域の決定は、少なくとも1つの交通信号灯のキーポイントの間のハミング距離のより小さい値(例えば、最小値)に基づいて実行することができる。
例えば、力まかせ(Brute Force)アルゴリズムにより前後の2つのフレームにおける画像の座標系のハミング距離の小さい特徴点(交通信号灯のキーポイント)記述子をマッチングし、即ち交通信号灯のキーポイントペアごとにその特徴記述子の距離を計算し、距離がより小さい(例えば、最も小さい)交通信号灯のキーポイントに基づいて前後のフレーム中のORB特徴点のマッチングを実現することにより、静的特徴点の追跡を実現することができる。また、交通信号灯のキーポイントのピクチャの座標系が信号灯の候補領域内にあるので、この交通信号灯のキーポイントが信号灯検出の静的キーポイントであると判定される。力まかせ(Brute Force)アルゴリズムは、一般的なパターンマッチングアルゴリズムであり、Brute Forceアルゴリズムの構想は、目標文字列Sの1番目の文字とパターン文字列Tの1番目の文字をマッチングする。これらが等しい場合は、Sの2番目の文字とTの2番目の文字を比較し続け、等しくない場合、Sの2番目の文字とTの1番目の文字を比較し、最後のマッチング結果が取得されるまでそれらを順番に比較する。Brute Forceアルゴリズムは力まかせアルゴリズムである。
1つ又は複数の任意の実施形態では、追跡結果に基づいて信号灯の位置領域を調整することは、
追跡結果と信号灯の位置領域とが重なり合うか否かを比較して比較結果を取得し、
比較結果に基づいて信号灯の位置領域を調整することを含む。
追跡結果に基づいて信号灯の位置領域を調整した後、信号灯の位置領域がより安定的になり、ビデオシーンへの応用にさらに適するようになった。
本実施形態では、追跡結果に基づいてビデオストリームの少なくとも1つのフレームの画像における交通信号灯のキーポイントに対応する位置領域を決定し、追跡結果中の位置領域と信号灯の位置領域とが重なり合う部分が信号灯の位置領域に占める割合は設定された割合を超えた場合に、追跡結果と信号灯の位置領域とが重なり合うことを決定し、そうでない場合、追跡結果と信号灯の位置領域とが重なり合わないことを決定する。
あるいは、比較結果に基づいて信号灯の位置領域を調整することは、
交通信号灯のキーポイントに対応する位置領域と信号灯の位置領域とが重なり合わないことに応答して、信号灯の位置領域を交通信号灯のキーポイントに対応する位置領域に置換することを含む。
信号画像における交通信号灯のキーポイントに対応する位置領域と信号灯の位置領域とが重なり合うか否かを比較した比較結果は、以下の3種の場合を含んでよい。
交通信号灯のキーポイントに対応する位置領域と信号灯の位置領域とがマッチングする場合(重なり合う場合)、即ち前後の2つのフレームにおけるマッチングする交通信号灯のキーポイントの位置領域の移動は検出された信号灯の位置領域と同様である場合、修正しなくてもよい。交通信号灯のキーポイントの位置領域と検出された信号灯の位置領域とが大体マッチングする場合、前後のフレームにおける交通信号灯のキーポイントの位置領域のずれにより、検出信号灯の幅や高さが変わらないことを前提として交通信号灯のキーポイントの位置領域の移動に基づいて現在のフレームの検出枠の位置領域を計算する。現在のフレームから交通信号灯の位置領域が検出されないが、前の1フレームから交通信号灯の位置領域が検出された場合、交通信号灯のキーポイントにより現在のフレームの信号灯の位置領域がカメラの範囲を超えていないことを決定し、範囲を超えていない場合、交通信号灯のキーポイントにより計算した結果に基づいて現在のフレームの交通信号灯の位置領域を決定し、検出漏れを減少する。
1つ又は複数の任意の実施形態では、操作120の前に、この方法は、
収集されたトレーニング画像の集合に基づいて、領域に基づく完全畳み込みネットワークをトレーニングし、トレーニング画像の集合は、ラベル付け属性を有する複数のトレーニング画像を含み、
トレーニング画像の集合に基づいて、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークのパラメータを調整することを更に含んでもよい。
現実的なシーンにおいて、交通信号灯うちの黄信号は赤信号と緑信号の間の過渡状態に過ぎないので、存在する時間が赤信号と緑信号より短い。従来技術において、R−FCNによる検出枠に、1回に限定的な画像のみが入力されるので、画像中の黄信号の数が赤信号と緑信号より非常に少なくて、検出ネットワークを効果的にトレーニングしてモデルの黄信号に対する感知度が高められることができなく、従って、本開示は、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークをトレーニングすることによって信号灯の位置、色及び/又は形状を同時に認識する。
検出ネットワークの黄信号に対する感知度が高められるために、あるいは、トレーニング画像の集合に基づいて、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークのパラメータを調整するステップの前に、この方法は、
トレーニング画像の集合に基づいて交通信号灯の色の割合が所定割合に合致する新しいトレーニング画像の集合を取得し、
新しいトレーニング画像の集合に基づいて、交通信号灯の色に基づいてトレーニング画像を分類するための分類ネットワークをトレーニングすることを更に含んでもよい。
あるいは、この分類ネットワークは、従来技術における検出ネットワークから候補領域ネットワーク(Region Proposal Network、RPN)とプロポーザル(proposal)層を除去して取得されるものである。あるいは、この分類ネットワークは、マルチタスク認識ネットワークの特徴抽出ブランチと分類ブランチを含んでよく、単独して所定割合の新しいトレーニング画像の集合に基づいて分類ネットワークをトレーニングすることで、分類ネットワークによる交通信号灯の色の分類の正確率が高められることができる。
トレーニングするネットワークのトレーニング画像の集合を収集を通じて取得し、収集されたトレーニング画像の集合によりR−FCN、即ち領域に基づく完全畳み込みネットワークをトレーニングし、収集されたトレーニング画像の集合における交通信号灯と黄信号の数を調整する。あるいは、所定割合において異なった色の交通信号灯の数が同様であるか、又は数量の差が許容閾値より小さい。
交通信号灯の色は赤、黄及び青を含む。
実際には黄信号が現れる確率が赤信号と緑信号より遥かに低いので、収集されたトレーニング画像における黄信号が占める割合は赤信号と緑信号より遥かに小さい。本実施形態では、分類ネットワークの正確性が高められるために、赤、黄、緑の3種の色の割合を同じな割合(例えば、赤:黄:緑1:1:1)に設定し、赤、黄、緑の3種の色の数量差を許容閾値より小さくして3種の色の割合を1:1:1に近づけさせるようにしてもよい。トレーニング画像の集合から交通信号灯の画像を対応する色のトレーニング画像として抽出することより、新しいトレーニング画像の集合を構成するか、または黄信号画像の数と赤信号画像および緑信号画像の数が所定割合に合致するようにトレーニング画像の集合中の黄信号画像を繰り返して呼び出し、この調整された新しいトレーニング画像の集合により分類ネットワークをトレーニングすることにより、黄信号画像の数が交通信号灯の画像データより遥かに小さいという欠点が克服され、分類ネットワークの黄信号の認識の正確率を高める。
あるいは、トレーニング画像の集合に基づいて、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークのパラメータを調整するステップの前に、この方法は、トレーニングされた分類ネットワークのパラメータに基づいてマルチタスク認識ネットワークの少なくとも一部のパラメータを初期化することを更に含む。
あるいは、トレーニングされた分類ネットワークのパラメータに基づいてマルチタスク認識ネットワークの一部又は全部のパラメータを初期化してもよく、例えば、トレーニングされた分類ネットワークのパラメータによりマルチタスク認識ネットワークの特徴抽出ブランチと分類ブランチを初期化し、ここで、パラメータは、例えば畳み込みカーネルの大きさ、畳み込みの接続の重み等を含んでよい。
黄信号についての認識の正確率が高められる分類ネットワークを得た後、初期のトレーニング画像の集合により領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークをトレーニングし、トレーニングする前に、トレーニングされた分類ネットワークのパラメータにより検出ネットワークの一部のパラメータを初期化する。この時に取得される特徴抽出ブランチと分類ブランチは交通信号灯の色の分類に好ましい効果を有する。更に、黄信号分類の正確率が高められる。
本開示の交通信号灯検出方法は、インテリジェントドライブ、高精度地図等の分野に利用することができる。
車載ビデオを入力とし交通信号灯の位置とその状態を出力して車両の安全的な走行を支援することができる。
更に、高精度地図を生成して交通信号灯の位置を検出することに利用することができる。
1つ又は複数の任意の実施形態では、この方法は、
画像における交通信号灯の少なくとも2種の属性に基づいて交通信号灯の状態を決定し、
交通信号灯の状態により車両に対してインテリジェントドライブ制御を実行することを更に含む。
本実施形態では、交通信号灯の少なくとも2種の属性が自動的に認識され、ビデオストリームの交通信号灯の状態が取得され、運転者は運転中交通信号灯を観察するために注意が散漫することがなく、車両走行の安全性が高められ、人為的な誤動作による交通危険が減少された。
あるいは、インテリジェントドライブ制御は、通知情報又は警告情報を送信する及び/又は交通信号灯の状態による車両走行状態を制御することを含む。
交通信号灯の少なくとも2種の属性を認識することにより、インテリジェントドライブに基礎を提供することができ、インテリジェントドライブは、自動運転と支援運転を含み、自動運転の場合に、交通信号灯の状態により車両の走行状態(例えば、停車、減速、転向等)を制御すると共に、通知情報又は警告情報を送信して運転者に現在の交通信号灯の状態を通知することができ、支援運転の場合に、一般的には通知情報又は警告情報の送信のみを実行し、車両を制御する権限が依然として運転者に属し、運転者は通知情報又は警告情報により車両に対して対応の制御を実行する。
あるいは、この方法は、交通信号灯の属性、状態及び対応する画像を記憶することを更に含む。
本実施形態では、交通信号灯の属性、状態及び対応する画像を記憶し、より多い交通信号灯の情報(属性、状態及び対応する画像)を取得することにより、インテリジェントドライブに操作の根拠をより多く提供する。さらに記憶された交通信号灯に対応する時間と位置に基づいて高精度地図を生成し、記憶された交通信号灯に対応する画像に基づいて高精度地図における交通信号灯の位置を決定することができる。
あるいは、交通信号灯の状態は、通行許可状態、通行禁止状態又は待ち状態を含むが、それらに限定されなく、この方法は、
画像における交通信号灯の少なくとも2種の属性に基づいて交通信号灯の状態を決定し、
交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、交通信号灯の状態が通行許可状態であると決定し、
交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、交通信号灯の状態が通行禁止状態であると決定し、
交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、交通信号灯の状態が待ち状態であると決定することの少なくとも1つを含む。
現行の交通法規によれば分かるように、交通信号灯の色は赤、緑及び黄を含み、異なる色は異なる通行状態に対応し、赤は車両及び/又は歩行者の通行が禁止されることを示し、緑は車両及び/又は歩行者の通行が許可されることを示し、黄は車両及び/又は歩行者が暫く待つ必要があることを示し、また、色を支援するために、交通信号等の形状を更に含んでもよく、例えば、+形状(任意の第1の所定形状)は通行許可を示し、×形状(任意の第2の所定形状)は通行禁止を示し、−形状(任意の第3の所定形状)は待ち状態を示すなどのことになっている。異なった交通信号灯の状態に応じて異なった対策を提供することで、自動、半自動のインテリジェントドライブが実現され、運転の安全性が高められる。
あるいは、交通信号灯の状態により車両に対してインテリジェントドライブ制御を実行することは、
交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯、車両の通行を制御する過程に必要な他の制御等の1種又は複数種の操作を実行するように車両を制御し、
交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯、車両の通行禁止を制御する又は待ち状態で車両を制御する過程に必要な他の制御の1種又は複数種の操作を実行するように車両を制御することを含む。
例えば、交通信号灯の色が緑であり且つ形状が左向きの矢印である時に、自動的に(左へ)転向し及び/又は自動的にウインカー(左折ランプ)を点灯するように車両を制御することができ、交通信号灯の色が緑であり且つ形状が前を指す矢印である時に、減速して交差点を通過するように車両を制御することができる。もちろん、具体的にどのように車両の走行を制御することは、現在の車両に設定される目的地と現在の交通信号灯の状態を総合した結果に基づいて考える。交通信号灯の状態に対応する操作を実行するように車両を自動的に制御することにより、安全性がより高いインテリジェントドライブが実現可能になり、運転の安全性が高められ、人為的な誤動作による安全上の問題が少なくなる。
当業者であれば、上記方法の実施形態を実現する全てまたは一部のステップは、プログラム命令に関連するハードウェアによって完成することができることを理解できる。前記プログラムは、コンピュータ読み取り可能記憶媒体に記憶することができる。当該プログラムが実行される時に、上記の方法の実施形態を含むステップを実行する。上記の記憶媒体は、ROM、RAM、磁気ディスクまたは光ディスクなどのプログラムコードを記憶する様々な媒体を含む。
図2は本開示の交通信号灯検出装置の実施形態の構造模式図である。この実施形態の交通信号灯検出装置は、本開示の上記の各交通信号灯検出方法の実施形態を実現するために用いられることができる。図2に示すように、この実施形態の装置は、ビデオストリーム取得ユニット21と、領域決定ユニット22と、属性認識ユニット23と、を含む。
ビデオストリーム取得ユニット21は、交通信号灯を含むビデオストリームを取得するために用いられる。
あるいは、交通信号灯の認識は、一般的には車両走行中記録される車載ビデオに基づいて、車載ビデオを解析して少なくとも1つのフレームの画像を含むビデオストリームを取得し、例えば、車両に取り付けられた撮影装置により車両の進行方向又は周囲環境を撮影してビデオを取得する。車両の進行方向又は周囲環境に交通信号灯が存在する場合、交通信号灯を撮影装置より撮影することができ、撮影したビデオストリームが交通信号灯を含むビデオストリームとなる。このビデオストリームの各フレームの画像は交通信号灯を含んでもよいし、少なくとも1つのフレームの画像は交通信号灯を含んでもよい。
領域決定ユニット22は、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定するために用いられる。
あるいは、ビデオストリームにおける交通信号灯を含む画像から候補領域を決定し、この候補領域は、画像に交通信号灯を含む可能性がある領域を指す。
交通信号灯の領域の検出は、ニューラルネットワーク又は他の種類の検出モデルに基づいて実行することができる。1つ又は複数の任意の実施形態では、領域に基づく完全畳み込みネットワークを用いて、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定する。領域に基づく完全畳み込みネットワーク(R−FCN)により信号画像を検出して交通信号灯を含む可能性がある候補領域が取得され、R−FCNはFaster RCNNを改良したものと見なしてよく、検出速度がFaster RCNNと比べて速くなった。
属性認識ユニット23は、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定するために用いられる。
交通信号灯の属性は、交通信号灯を記述するためのものであり、実際の要求に応じて定義してよく、例えば、交通信号灯の絶対位置又は相対位置を記述するための位置領域属性、交通信号灯の色(例えば、赤、緑、黄等)を記述するための属性、交通信号灯の形状(例えば、円形、直線矢印、折り線矢印等)を記述するための属性、及び交通信号灯の他の方面を記述するための他の属性等を含んでよい。
本開示の上記実施形態で提供された交通信号灯検出装置によれば、交通信号灯の少なくとも2種の属性を取得することにより信号灯の多種の情報の認識が実現され、認識時間が少なくなり、交通信号灯の認識の正確率が高められる。
あるいは、交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含む。
交通信号灯の少なくとも2種の属性の決定は、ニューラルネットワーク又は他の種類の認識モデルに基づいて実行することができる。1つ又は複数の任意の実施形態では、属性認識ユニット23は、マルチタスク認識ネットワークを用いて、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定するために用いられる。
本実施形態は1つのネットワークにより交通信号灯の少なくとも2種の属性の認識を実現し、それぞれ少なくとも2つのネットワークに基づいて少なくとも2種の属性を認識する場合と比べて、ネットワークの大きさが小さくなり、交通信号灯の属性認識の効率が高められる。
あるいは、マルチタスク認識ネットワークは、特徴抽出ブランチと、それぞれ前記特徴抽出ブランチに接続される少なくとも2つのタスクブランチとを含み、異なるタスクブランチは、交通信号灯の様々の属性を決定するために用いられ、
属性認識ユニット23は、特徴抽出モジュールと、ブランチ属性モジュールと、を含み、
特徴抽出モジュールは、特徴抽出ブランチに基づいて前記候補領域に対して特徴抽出を実行して候補特徴を取得するために用いられ、
ブランチ属性モジュールは、それぞれ少なくとも2つのタスクブランチに基づいて候補特徴を処理して画像における交通信号灯の少なくとも2種の属性を取得するために用いられる。
あるいは、少なくとも2つのタスクブランチは、検出ブランチ、認識ブランチ及び分類ブランチを含むが、それらに限定されなく、
ブランチ属性モジュールは、検出ブランチにより候補特徴に対して位置検出を実行して交通信号灯の位置領域を決定し、分類ブランチにより候補特徴に対して色の分類を実行して、交通信号灯の所在する位置領域の色を決定して、交通信号灯の色を決定し、認識ブランチにより候補特徴に対して形状認識を実行して、交通信号灯の所在する位置領域の形状を決定して、交通信号灯の形状を決定するために用いられる。
1つ又は複数の任意の実施形態では、この装置は、キーポイント決定ユニットと、キーポイント追跡ユニットと、位置調整ユニットとを更に含み、
キーポイント決定ユニットは、ビデオストリームの少なくとも1つのフレームの画像に対してキーポイント認識を実行して、画像における交通信号灯のキーポイントを決定するために用いられ、
キーポイント追跡ユニットは、ビデオストリームの交通信号灯のキーポイントを追跡して追跡結果を取得するために用いられ、
位置調整ユニットは、追跡結果に基づいて交通信号灯の位置領域を調整するために用いられる。
ビデオストリームの連続したフレームの間に存在する差異が小さいことがあり、各フレーム画像における交通信号灯の候補領域のみに基づいて交通信号灯の位置認識を実行する場合、連続したフレーム中の位置領域を同様の位置領域と認識して、認識された位置領域が不精確になる可能性がある。本実施形態では、画像に対してキーポイントを認識し、キーポイントに基づいて交通信号灯の画像における位置領域を決定し、このキーポイントの位置領域に基づいてマルチタスク認識ネットワークにより得た交通信号灯の位置を調整することにより、位置領域認識の正確率が高められる。
キーポイント認識及び/又は追跡は、従来技術におけるキーポイントの認識及び/又は追跡を実現可能な任意の技術に基づいて実現することができる。あるいは、静的キーポイント追跡技術に基づいてビデオストリームの交通信号灯のキーポイントの追跡を実現することで、ビデオストリームにおける交通信号灯のキーポイントが存在する可能な領域を取得する。
あるいは、キーポイント追跡ユニットは、連続した2つのフレームの画像における交通信号灯のキーポイントの間の距離を基礎とし、交通信号灯のキーポイントの間の距離に基づいてビデオストリームの交通信号灯のキーポイントを追跡するために用いられる。
本実施形態でいわゆる連続した2つのフレームはビデオストリームにおけるタイミングが連続した2つの収集フレームであってもよく、ビデオストリームにおけるタイミングが連続した2つの検出フレームであってもよく(ビデオストリームにおけるフレームごとに検出することも可能であって、サンプリングして検出することも可能であるので、検出フレームと収集フレームの両方の意味は完全に同様であるというわけではない)、ビデオストリームにおける複数の連続した2つのフレームの画像の交通信号灯のキーポイントを関連付けることにより、ビデオストリームにおける交通信号灯のキーポイントを追跡することを実現でき、追跡結果に基づいてビデオストリームの各フレーム画像に対して位置領域の調整を実行することができる。あるいは、交通信号灯のキーポイントの間のハミング距離、ユークリッド距離、結合ベイズ距離又はコサイン距離等に基づいて、ビデオストリームにおける交通信号灯のキーポイントを追跡することを実現できる。本実施形態では具体的に交通信号灯のキーポイントの間のどのような距離を限定するものではない。
あるいは、キーポイント追跡ユニットは、交通信号灯のキーポイントの間の距離に基づいてビデオストリームの交通信号灯のキーポイントを追跡する時に、交通信号灯のキーポイントの間の距離に基づいて、連続した2つのフレームの画像における同じ交通信号灯のキーポイントの位置領域を決定し、同じ交通信号灯のキーポイントが連続した2つのフレームの画像に所在する位置領域により、ビデオストリームにおける交通信号灯のキーポイントを追跡するために用いられる。
1つ又は複数の任意の実施形態では、位置調整ユニットは、追跡結果と信号灯の位置領域とが重なり合うか否かを比較して比較結果を取得し、比較結果に基づいて信号灯の位置領域を調整するために用いられる。
追跡結果に基づいて信号灯の位置領域を調整した後、信号灯の位置領域がより安定的になり、ビデオシーンへの応用にさらに適するようになった。
本実施形態では、追跡結果に基づいてビデオストリームの少なくとも1つのフレームの画像における交通信号灯のキーポイントに対応する位置領域を決定し、追跡結果中の位置領域と信号灯の位置領域との重なり合う部分が信号灯の位置領域に占める割合が設定割合を超えた場合に、追跡結果と信号灯の位置領域とが重なり合うと決定でき、そうでなければ、追跡結果と信号灯の位置領域とが重なり合わないと決定する。
あるいは、位置調整ユニットは、比較結果に基づいて信号灯の位置領域を調整する時に、交通信号灯のキーポイントに対応する位置領域と信号灯の位置領域とが重なり合わないことに応答して、信号灯の位置領域を交通信号灯のキーポイントに対応する位置領域に置換するために用いられる。
1つ又は複数の任意の実施形態では、この装置は、事前トレーニングユニットと、トレーニングユニットと、を更に含んでもよく、
事前トレーニングユニットは、収集された、ラベル付け属性を有する複数のトレーニング画像を含むトレーニング画像の集合に基づいて、領域に基づく完全畳み込みネットワークをトレーニングするために用いられ、
トレーニングユニットは、レーニング画像の集合に基づいて、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークのパラメータを調整するために用いられる。
現実的なシーンにおける、交通信号灯うちの黄信号は赤信号と緑信号の間の過渡状態に過ぎないので、存在する時間が赤信号と緑信号より短い。従来技術における、R−FCNに基づく検出仕組みは、1回に限定的な画像のみが入力されるので、画像中の黄信号の数が赤信号と緑信号より非常に少なくて、検出ネットワークを効果的にトレーニングしてモデルの黄信号に対する感知度が高められることができなる。従って、本開示では、領域に基づく完全畳み込みネットワークとマルチタスク認識ネットワークをトレーニングすることによって信号灯の位置、色及び/又は形状を同時に認識する。
検出ネットワークの黄信号に対する感知度が高められるために、あるいは、この装置は、事前トレーニングユニットとトレーニングユニットの間に、分類トレーニングユニットを更に含んでもよく、
分類トレーニングユニットは、トレーニング画像の集合に基づいて交通信号灯の色の割合が所定割合に合致する新しいトレーニング画像の集合を取得し、新しいトレーニング画像の集合に基づいて分類ネットワークをトレーニングするために用いられ、この分類ネットワークは、交通信号灯の色に基づいてトレーニング画像を分類するために用いられる。
あるいは、所定割合において異なった色の交通信号灯の数が同様であるか又は数量差が許容閾値より小さく、
交通信号灯の色は赤、黄及び青を含む。
実際には黄信号が現れる確率が赤信号と緑信号より遥かに低いので、収集されたトレーニング画像における黄信号が占める割合が赤信号と緑信号より遥かに小さく、本実施形態では、分類ネットワークの正確性が高められるために、赤、黄、緑の3種の色の割合を同じな割合(例えば、赤:黄:緑1:1:1)に設定しておくか、赤、黄、緑の3種の色の数量差を許容閾値より小さくして3種の色の割合を1:1:1に近づけさせるようにしてもよい。トレーニング画像の集合から交通信号灯を対応する色のトレーニング画像として抽出して新しいトレーニング画像の集合を構成するか、または、黄信号画像の数と赤信号画像、緑信号画像の数が所定割合に合致するようにトレーニング画像の集合中の黄信号画像を繰り返して呼び出して、この調整された新しいトレーニング画像の集合により分類ネットワークをトレーニングすることにより、黄信号画像の数が交通信号灯画像データより遥かに小さいという欠点が克服され、分類ネットワークの黄信号認識の正確率が高められる。
あるいは、分類トレーニングユニットの後に、この装置は、初期化ユニットを更に含んでもよく、
初期化ユニットは、トレーニングされた分類ネットワークのパラメータに基づいてマルチタスク認識ネットワークの少なくとも一部のパラメータを初期化するために用いられる。
1つ又は複数の任意の実施形態では、本実施形態の装置は、状態決定ユニットと、インテリジェント制御ユニットと、を更に含んでもよく、
状態決定ユニットは、画像における交通信号灯の少なくとも2種の属性に基づいて交通信号灯の状態を決定するために用いられ、
インテリジェント制御ユニットは、交通信号灯の状態により車両に対してインテリジェントドライブ制御を実行するために用いられる。
本実施形態では、交通信号灯の少なくとも2種の属性が自動的に認識され、ビデオストリームの交通信号灯の状態が取得され、運転者は運転中交通信号灯を観察するために注意が散漫することがなく、車両走行の安全性が高められ、人為的な誤動作による交通危険が減少される。
あるいは、インテリジェントドライブ制御は、通知情報又は警告情報を送信する及び/又は交通信号灯の状態による車両走行状態を制御することを含む。
あるいは、本実施形態の装置は、記憶ユニットと、状態決定ユニットと、インテリジェント制御ユニットとを更に含み、記憶ユニットは、交通信号灯の属性、状態及び対応する前記画像を記憶するために用いられる。
あるいは、交通信号灯の状態は、通行許可状態、通行禁止状態又は待ち状態を含むが、それらに限定されなく、
状態決定ユニットは、交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、交通信号灯の状態が通行許可状態であると決定し、
交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、交通信号灯の状態が通行禁止状態であると決定し、
交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、交通信号灯の状態が待ち状態であると決定するために用いられる。
あるいは、インテリジェント制御ユニットは、交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯の1種又は複数種の操作を実行するように車両を制御するために用いられ、
交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯の1種又は複数種の操作を実行させるように車両を制御するために用いられる。
本開示の実施形態で提供された交通信号灯検出装置のいずれか1つの実施形態の動作プロセス及び配置形態については、全て本開示の上記の対応方法の実施形態の具体的な説明を参照してよく、紙数に限りがあるので、ここで詳しい説明を省略する。
図3は本開示のインテリジェントドライブ方法の一実施形態のフローチャットである。図3に示すように、この実施形態の方法は、以下のステップを含む。
ステップ310で、車両に配置された画像収集装置により交通信号灯を含むビデオストリームを取得する。
あるいは、車両走行中記録される車載ビデオに基づいて、車載ビデオを解析して少なくとも1つのフレームの画像を含むビデオストリームを取得する。例えば、車両に取り付けられた撮影装置により車両進行方向又は周囲環境を撮影してビデオを取得する。車両進行方向又は周囲環境に交通信号灯が存在する場合、撮影装置により撮影されることが可能であり、撮影したビデオストリームが交通信号灯を含むビデオストリームとなる。このビデオストリームの各フレームの画像は交通信号灯を含んでもよいし、少なくとも1つのフレームの画像は交通信号灯を含んでもよい。
任意の一例では、このステップ310はプロセッサによりメモリに記憶された対応するコマンドを呼び出して実行されてもよく、プロセッサにより作動するビデオストリーム取得ユニット21によって実行されてもよい。
ステップ320で、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定する。
任意の一例では、このステップ320はプロセッサによりメモリに記憶された対応のコマンドを呼び出して実行されてもよく、プロセッサにより作動する領域決定ユニット22によって実行されてもよい。
ステップ330で、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定する。
交通信号灯の属性は、交通信号灯を記述するためのものであり、実際の要求に応じて定義してよく、例えば、交通信号灯の絶対位置又は相対位置を記述するための位置領域属性、交通信号灯の色(例えば、赤、緑、黄等)を記述するための属性、交通信号灯の形状(例えば、円形、直線矢印、折り線矢印等)を記述するための属性、及び交通信号灯の他の方面を記述するための他の属性等を含んでよい。
あるいは、交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含む。
あるいは、交通信号灯の色は赤、黄、緑という3種を含み、形状は矢印、円形又は他の形状等を含み、異なる形状の交通信号灯は、その位置のみを認識する場合、信号を精度よく認識できない可能性がある。本実施形態では、位置領域、色及び形状の少なくとも2種を認識することにより、例えば、交通信号灯の位置領域と色を決定する場合に、現在の交通信号灯が画像のどの位置にあるか(車両のどの方向に対応するか)を決定し、色により交通信号灯が表示している状態を決定し(赤、緑又は黄がそれぞれ異なる状態に対応)、交通信号灯の異なる状態の認識により支援運転又は自動運転を実現することができる。また、交通信号灯の位置領域と形状を決定する場合に、現在の交通信号灯が画像のどの位置にあるか(車両のどの方向に対応するか)を決定し、形状により交通信号灯が表示している状態を決定し(例えば、異なる方向に向ける矢印は異なる状態を示し、又は異なる形状の人体アイコンは異なる状態を示す)。また、交通信号灯の色と形状を決定する場合に、色と形状の両方を基に現在の交通信号灯の状態を決定する(例えば、左側を指す緑矢印は左折通行を示し、前方を指す赤矢印は前方通行禁止を示す)。また、交通信号灯の位置領域、色及び形状を決定する場合に、交通信号灯が画像のどの位置にあるかを分かった上で、色と形状の両方を基に現在の交通信号灯の状態を決定することができる。
任意の一例では、このステップ330はプロセッサによりメモリに記憶された対応のコマンドを呼び出して実行されてもよく、プロセッサにより作動する属性認識ユニット23によって実行されてもよい。
ステップ340で、画像における交通信号灯の少なくとも2種の属性に基づいて交通信号灯の状態を決定する。
既存の画像処理方法では、一般的に1種のタスクしか処理できなく(例えば、位置認識又は色の分類のうちの1種)、しかし、交通信号灯は位置領域、色及び形状等の情報を含み、交通信号灯の状態を決定する必要がある時に、交通信号等の位置領域を決定することが必要とされるだけでなく、少なくとも色又は形状を決定しなければならない。従って、通常の画像処理方法を用いる場合、現在の交通信号灯の状態を決定するために、ビデオストリームを処理するための少なくとも2つのニューラルネットワークが必要とされ、更に処理結果を総合することが必要とされる。本実施形態は、交通信号灯の少なくとも2種の属性を同時に取得して、少なくとも2種の属性により交通信号灯の状態を決定して、交通信号灯の状態を高速且つ精度よく認識する。
任意の一例では、このステップ340はプロセッサによりメモリに記憶された対応のコマンドを呼び出して実行されてもよく、プロセッサにより作動する状態決定ユニット44によって実行されてもよい。
ステップ350で、交通信号灯の状態により車両に対してインテリジェントドライブ制御を実行する。
任意の一例では、このステップ350はプロセッサによりメモリに記憶された対応するコマンドを呼び出して実行されてもよく、プロセッサにより作動するインテリジェント制御ユニット45によって実行されてもよい。
本実施形態は、車両における画像収集装置によりリアルタイムでビデオストリームを取得して交通信号灯の属性のリアルタイムな認識を実現して、交通信号灯の状態を決定し、交通信号灯の状態に基づいてインテリジェントドライブを実現することができる。運転者は運転中交通信号灯を観察するために注意が散漫することがなく、交通安全上の問題が減少され、人為的な誤動作による交通危険がある程度で低減された。インテリジェントドライブは支援運転と自動運転を含んでよく、一般的には、支援運転は信号灯を用いて警報通知を実行し、自動運転は信号灯を用いて運転制御を実行する。
あるいは、インテリジェントドライブ制御は、通知情報又は警告情報を送信する及び/又は交通信号灯の状態による車両走行状態を制御することを含む。
通信号灯の少なくとも2種の属性を認識することにより、インテリジェントドライブに基礎を提供することができる。インテリジェントドライブは、自動運転と支援運転を含む。自動運転の場合に、交通信号灯の状態により車両の走行状態(例えば、停車、減速、転向等)を制御すると共に、通知情報又は警告情報を送信して運転者に現在の交通信号灯の状態を通知することができる。運転支援の場合に、一般的には通知情報又は警告情報の送信のみを実行し、車両制御権限が依然として運転者に属し、運転者は通知情報又は警告情報により車両に対して対応の制御を実行する。
あるいは、本願の実施形態で提供されたインテリジェントドライブ方法は、交通信号灯の属性、状態及びそれらに対応する画像を記憶することを更に含む。
本実施形態は、交通信号灯の属性、状態及び対応する画像を記憶し、より多い交通信号灯の情報(属性、状態及びそれらに対応する画像)を取得することにより、インテリジェントドライブに操作の根拠をより多く提供する。さらに記憶された交通信号灯に対応する時間と位置に基づいて高精度地図を生成し、記憶された交通信号灯に対応する画像に基づいて高精度地図における交通信号灯の位置を決定することができる。
あるいは、交通信号灯の状態は、通行許可状態、通行禁止状態及び待ち状態を含むが、それらに限定されなく、
ステップ340は、
交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、交通信号灯の状態が通行許可状態であると決定し、
交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、交通信号灯の状態が通行禁止状態であると決定し、
交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、交通信号灯の状態が待ち状態であると決定することを含んでよい。
現行の交通法規によれば分かるように、交通信号灯の色は赤、緑及び黄を含み、異なる色は異なる通行状態に対応して、赤は車両及び/又は歩行者の通行が禁止されることを示し、緑は車両及び/又は歩行者の通行が許可されることを示し、黄は車両及び/又は歩行者が暫く待つ必要があることを示し、また、色を支援するために、交通信号等の形状を更に含んでもよく、例えば、+形状(任意の第1の所定形状)は通行許可を示し、×形状(任意の第2の所定形状)は通行禁止を示し、−形状(任意の第3の所定形状)は待ち状態を示すなどのことになる。異なった交通信号灯の状態に応じて異なった対策を提供することで、自動、半自動のインテリジェントドライブが実現され、運転の安全性が高められる。
あるいは、ステップ350には、
交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯、車両の通行を制御する過程に必要な他の制御の1種又は複数種の操作を実行するように車両を制御し、
交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯、車両通行禁止制御又は待ち状態にある過程に必要な他の制御の1種又は複数種の操作を実行させるように車両を制御することを含んでよい。
例えば、交通信号灯の色が緑であり且つ形状が左を指す矢印である時に、自動的に(左へ)転向し及び/又は自動的にウインカー(左折ランプ)を点灯するように車両を制御することができる。交通信号灯の色が緑であり且つ形状が前方を指す矢印である時に、減速して交差点を通過するように車両を制御することができる。具体的にどのように車両の走行を制御することは、現在車両に設定される目的地と現在の交通信号灯の状態を総合した結果に基づいて考える。交通信号灯の状態に対応する操作を実行するように車両を自動的に制御することにより、安全性がより高いインテリジェントドライブが実現可能になり、人為的な誤動作による安全上の問題が少なくなる。
当業者であれば、上記方法の実施形態を実現する全てまたは一部のステップは、プログラム命令に関連するハードウェアによって完成することができることを理解できる。前記プログラムは、コンピュータ読み取り可能記憶媒体に記憶することができる。当該プログラムは実行される時に、上記の方法の実施形態を含むステップを実行する。上記の記憶媒体は、ROM、RAM、磁気ディスクまたは光ディスクなどのプログラムコードを記憶する様々な媒体を含む。
図4は本開示のインテリジェントドライブ装置の一実施形態の構造模式図である。この実施形態のインテリジェントドライブ装置は、本開示の上記の各インテリジェントドライブ方法の実施形態を実現するために利用することができる。図4に示すように、この実施形態の装置は、ビデオストリーム取得ユニット21と、域決定ユニット22と、属性認識ユニット23と、状態決定ユニット44、インテリジェント制御ユニット45とを含む。
ビデオストリーム取得ユニット21は、車両に配置された画像収集装置により交通信号灯を含むビデオストリームを取得するために用いられる。
あるいは、車両走行中記録される車載ビデオに基づいて、車載ビデオを解析して少なくとも1つのフレームの画像を含むビデオストリームを取得し、例えば、車両に取り付けられた撮影装置により車両進行方向又は周囲環境を撮影してビデオを取得する。車両進行方向又は周囲環境に交通信号灯が存在する場合、撮影装置により撮影されることが可能であり、撮影したビデオストリームが交通信号灯を含むビデオストリームとなる。このビデオストリームの各フレームの画像は交通信号灯を含んでもよいし、少なくとも1つのフレームの画像は交通信号灯を含んでもよい。
領域決定ユニット22は、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定するために用いられる。
属性認識ユニット23は、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定するために用いられる。
交通信号灯の属性は、交通信号灯を記述するためのものであり、実際の要求に応じて定義してよく、例えば、交通信号灯の絶対位置又は相対位置を記述するための位置領域属性、交通信号灯の色(例えば、赤、緑、黄等)を記述するための属性、交通信号灯の形状(例えば、円形、直線矢印、折り線矢印等)を記述するための属性、及び交通信号灯の他の方面を記述するための他の属性等を含んでよい。
状態決定ユニット44は、画像における交通信号灯の少なくとも2種の属性に基づいて交通信号灯の状態を決定するために用いられる。
既存の画像処理方法では、一般的に1種のタスクしか処理できなく(例えば、位置認識又は色の分類のうちの1種)、しかし、交通信号灯は位置領域、色及び形状等の情報を含み、交通信号灯の状態を決定する必要がある時に、交通信号等の位置領域を決定することが必要とされるだけでなく、少なくとも色又は形状を決定しなければならない。従って、通常の画像処理方法を用いる場合、現在の交通信号灯の状態を決定するために、ビデオストリームを処理するための少なくとも2つのニューラルネットワークが必要とされ、更に処理結果を総合することが必要とされる。本実施形態では、交通信号灯の少なくとも2種の属性を同時に取得して、少なくとも2種の属性により交通信号灯の状態を決定して、交通信号灯の状態を高速且つ精度よく認識する。
インテリジェント制御ユニット45は、交通信号灯の状態により車両に対してインテリジェントドライブ制御を実行するために用いられる。
本実施形態は、車両における画像収集装置によりリアルタイムでビデオストリームを取得して交通信号灯の属性のリアルタイムな認識を実現して、交通信号灯の状態を決定し、交通信号灯の状態に基づいてインテリジェントドライブを実現することができる。運転者は運転中交通信号灯を観察するために注意が散漫することがなく、交通安全上の問題が減少され、人為的な誤動作による交通危険がある程度で低減された。インテリジェントドライブは運転支援と自動運転を含んでよく、一般的には、運転支援は信号灯を用いて警報通知を実行し、自動運転は信号灯を用いて運転制御を実行する。
あるいは、インテリジェントドライブ制御は、通知情報又は警告情報を送信する及び/又は交通信号灯の状態による車両走行状態を制御することを含む。
あるいは、この装置は、交通信号灯の属性、状態及びそれらに対応する画像を記憶するための記憶ユニットを更に含む。
あるいは、交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含む。
あるいは、交通信号灯の状態は、通行許可状態、通行禁止状態及び待ち状態を含むが、それらに限定されなく、この装置は、状態決定ユニット44と、インテリジェント制御ユニット45とさらに含み、
状態決定ユニット44は、交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、交通信号灯の状態が通行許可状態であると決定し、
交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、交通信号灯の状態が通行禁止状態であると決定し、
交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、交通信号灯の状態が待ち状態であると決定するために用いられる。
あるいは、インテリジェント制御ユニット45は、交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯の1種又は複数種の操作を実行するように車両を制御し、
交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯の1種又は複数種の操作を実行させるように車両を制御するために用いられる。
本開示の実施形態で提供されたインテリジェントドライブ装置のいずれか1つの実施形態の動作プロセス及び配置形態については、全て本開示の上記の対応方法の実施形態の具体的な説明を参照してよく、紙数に限りがあるので、ここで詳しい説明を省略する。
本開示の実施形態の別の態様によれば、上記のいずれか1つの実施形態に記載の交通信号灯検出装置又は上記のいずれか1つの実施形態に記載のインテリジェントドライブ装置を含む車両を提供する。
本開示の実施形態の別の態様によれば、以上のいずれか一項に記載の交通信号灯検出装置又は上記のいずれか1つの実施形態に記載のインテリジェントドライブ装置を備えたプロセッサを含む電子機器を提供する。
本開示の実施形態の更に別の態様によれば、メモリと、プロセッサと、を含む電子機器を提供し、
プロセッサは、実行可能コマンドを記憶するために用いられ、
プロセッサは、前記メモリと通信して前記実行可能コマンドを実行して上記のいずれか1つの実施形態に記載の交通信号灯検出方法の操作を完成するか、又は上記のいずれか1つの実施形態に記載のインテリジェントドライブ方法の操作を完成するために用いられる。
本開示の実施形態は、電子機器を更に提供する。 例えば、電子機器は、携帯端末、パーソナルコンピュータ(PC)、タブレット型コンピュータ、サーバなどであってよい。以下、本開示の実施形態の端末装置又はサーバを実現するのに適する電子機器500の構造模式図を示す図5を参照し、図5に示すように、電子機器500は1つ又は複数のプロセッサ、通信部などを含み、前記1つ又は複数のプロセッサは、例えば、1つ又は複数の中央処理ユニット(CPU)501、及び/又は1つ又は複数の画像プロセッサ(GPU)513などであり、プロセッサは、読み取り専用メモリ(ROM)502に記憶された実行可能コマンド又は記憶部508からランダムアクセスメモリ(RAM)503にロードされた実行可能コマンドによって各種の適切な動作及び処理を実現することができる。通信部512はネットワークカードを含んでよいが、それに限定されなく、前記ネットワークカードはIB(Infiniband)ネットワークカードを含んでよいが、それに限定されない。
プロセッサは読み取り専用メモリ502及び/又はランダムアクセスメモリ503と通信して実行可能コマンドを実行し、通信バス504を介して通信部512に接続され、通信部512を介して他のターゲットデバイスと通信してよく、それにより本開示の実施形態で提供されるいずれか一項の方法に対応する操作を完成し、例えば、交通信号灯を含むビデオストリームを取得し、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定する。
また、RAM503には、装置の操作に必要な各種のプログラムやデータが記憶されていてもよい。CPU501、ROM502及びRAM503は、通信バス504を介して相互に接続される。RAM503を有する場合に、ROM502は任意のモジュールである。RAM503は実行可能コマンドを記憶するか、または動作時に実行可能コマンドをROM502に書き込み、実行可能コマンドによって中央処理ユニット501に上記通信方法に対応する操作を実行する。入力/出力(I/O)インタフェース505も通信バス504に接続される。通信部512は、統合的に配置されてもよく、バスを介してリンクされる複数のサブモジュール(例えば複数のIBネットワークカード)を有するように配置されてもよい。
キーボード、マウスなどを含む入力部506と、陰極線管(CRT)、液晶ディスプレイー(LCD)など及びスピーカなどを含む出力部507と、ハードディスクなどを含む記憶部508と、LANカード、モデムなどのネットワークインタフェースカードを含む通信部509とがI/Oインタフェース505に接続される。通信部509は例えばインターネットのようなネットワークを介して通信処理を実行する。ドライブ510も必要に応じてI/Oインタフェース505に接続される。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどのリムーバブル媒体511は、必要に応じてドライブ510上に装着され、そこから読み出されたコンピュータプログラムを必要に応じて記憶部508にインストールする。
なお、図5に示す構造は任意の一実施形態に過ぎず、具体的な実践過程では、実際の必要に応じて上記図5の部品の数及び種類を選択、削除、追加、または置換することができ、異なる機能部品の配置で、分離配置または統合配置などの実施形態を採用でき、例えばGPU513とCPU501は分離配置するかまたはGPU513をCPU501に統合するようにしてよく、通信部512は分離して配置されるか、またはCPU501やGPU513に統合的に配置されることなども可能であることを説明する必要がある。これらの置換可能な実施形態はいずれも本開示の保護範囲に属する。
特に、本開示の実施形態によれば、フローチャートを参照しながら上述したプロセスはコンピュータソフトウェアプログラムとして実現できる。例えば、本開示の実施形態は機械可読媒体に有形に具現化されたコンピュータプログラム製品を含み、このコンピュータプログラム製品はコンピュータプログラムを含み、このコンピュータプログラムは、フローチャートに示す方法を実行するためのプログラムコードを含み、プログラムコードは本開示の実施形態により提供される方法のステップを対応して実行する対応するコマンドを含んでよく、例えば、交通信号灯を含むビデオストリームを取得し、ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、候補領域に基づいて画像における交通信号灯の少なくとも2種の属性を決定する。このような実施形態では、該コンピュータプログラムは通信部509によってネットワークからダウンロード及びインストールされ、及び/又はリムーバブル媒体511からインストールされる。中央処理ユニット(CPU)501によって該コンピュータプログラムを実行する時に、本開示の方法で限定された上記機能の操作を実行する。
本開示の実施形態のまた1つの態様によれば、コンピュータ読取可能コマンドを記憶するためのコンピュータ読取可能記憶媒体を提供し、このコマンドが実行されると、以上のいずれか一項に記載の交通信号灯検出方法又は以上のいずれか一項に記載のインテリジェントドライブ方法の操作が実行される。
本開示の実施形態の更に1つの態様によれば、コンピュータ可読コードを含むコンピュータプログラム製品を提供し、コンピュータ可読コードを機器上で作動する時に、この機器中のプロセッサは以上のいずれか一項に記載の交通信号灯検出方法又は以上のいずれか一項に記載のインテリジェントドライブ方法を実現するためのコマンドを実行する。
本明細書における様々な実施形態は漸進的に説明され、各実施形態は他の実施形態との相違点に集中して説明したが、各実施形態間の同じまたは類似の部分については相互に参照すればよい。システム実施形態については、それは基本的に方法実施形態に対応するので、説明は比較的簡単であり、関連部分は方法実施形態の説明の一部を参照すればよい。
本発明の方法及び装置は、様々な形態で実現され得る。例えば、ソフトウェア、ハードウェア、ファームウェアまたはソフトウェア、ハードウェア、ファームウェアの任意の組合わせによって本発明の方法及び装置を実現することができる。前記方法のステップのための上記順序は説明することのみを目的とし、本発明の方法のステップは、特に断らない限り、以上で具体的に説明した順序に限定されない。また、いくつかの実施形態では、本発明は記録媒体に記憶されたプログラムとしてもよく、これらのプログラムは本発明の方法を実現するための機械可読コマンドを含む。従って、本発明は本発明の方法を実行するためのプログラムが記憶された記録媒体も含む。
本発明の説明は、例示及び説明のために提示されたものであり、網羅的なものでありもしくは開示された形式に本発明を限定するというわけでない。当業者にとっては多くの修正及び変形を加えることができるのは明らかであろう。実施形態は本発明の原理及び実際応用をより明瞭に説明するため、かつ当業者が本発明を理解して特定用途に適した各種の修正を加えた各種の実施形態を設計可能にするように選択され説明されたものである。

Claims (57)

  1. 交通信号灯検出方法であって、
    当該方法は、
    交通信号灯を含むビデオストリームを取得し、
    前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、
    前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定することを含むことを特徴とする方法。
  2. 前記交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含むことを特徴とする請求項1に記載の方法。
  3. 前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定することは、領域に基づく完全畳み込みネットワークを用いて、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定することを含むことを特徴とする請求項1又は2に記載の方法。
  4. 前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定することは、マルチタスク認識ネットワークを用いて、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定することを含むことを特徴とする請求項1〜3のいずれか一項に記載の方法。
  5. 前記マルチタスク認識ネットワークは、特徴抽出ブランチと、少なくとも2つの前記特徴抽出ブランチにそれぞれ接続されるタスクブランチとを含み、異なったタスクブランチは、前記交通信号灯の異なった種類の属性を決定するために用いられ、
    マルチタスク認識ネットワークを用いて、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定することは、
    前記特徴抽出ブランチに基づいて前記候補領域に対して特徴抽出を実行して候補特徴を取得し、
    それぞれ前記少なくとも2つのタスクブランチに基づいて前記候補特徴を処理して前記画像における交通信号灯の少なくとも2種の属性を取得することを含むことを特徴とする請求項4に記載の方法。
  6. 前記少なくとも2つのタスクブランチは、検出ブランチ、認識ブランチ及び分類ブランチを含み、
    それぞれ前記少なくとも2つのタスクブランチに基づいて前記候補特徴を処理して前記画像における交通信号灯の少なくとも2種の属性を取得することは、
    前記検出ブランチにより前記候補特徴に対して位置検出を実行して、交通信号灯の位置領域を決定し、
    前記分類ブランチにより前記候補特徴に対して色の分類を実行して、交通信号灯の所在する位置領域の色を決定して、前記交通信号灯の色を決定し、
    前記認識ブランチにより前記候補特徴に対して形状認識を実行して、前記交通信号灯の所在する位置領域の形状を決定して、前記交通信号灯の形状を決定することを含むことを特徴とする請求項5に記載の方法。
  7. 前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定ことの前に、
    前記方法は、
    前記ビデオストリームの少なくとも1つのフレームの画像に対してキーポイント認識を実行して前記画像における交通信号灯のキーポイントを決定し、
    前記ビデオストリームの交通信号灯のキーポイントを追跡して追跡結果を取得し、
    前記追跡結果に基づいて前記交通信号灯の位置領域を調整することを更に含むことを特徴とする請求項1〜6のいずれか一項に記載の方法。
  8. 前記ビデオストリームの交通信号灯のキーポイントを追跡することは、
    連続した2つのフレームの前記画像における前記交通信号灯のキーポイントの間の距離を基礎とし、
    前記交通信号灯のキーポイントの間の距離に基づいて前記ビデオストリームの交通信号灯のキーポイントを追跡することを含むことを特徴とする請求項7に記載の方法。
  9. 前記交通信号灯のキーポイントの間の距離に基づいて前記ビデオストリームの交通信号灯のキーポイントを追跡することは、
    前記交通信号灯のキーポイントの間の距離に基づいて、連続した2つのフレームの画像における同じ交通信号灯のキーポイントの位置領域を決定し、
    前記同じ交通信号灯のキーポイントが連続した2つのフレームの前記画像に所在する位置領域により、前記ビデオストリームにおける交通信号灯のキーポイントを追跡することを含むことを特徴とする請求項8に記載の方法。
  10. 前記追跡結果に基づいて前記信号灯の位置領域を調整することは、
    前記追跡結果と前記信号灯の位置領域とが重なり合うか否かを比較して比較結果を取得し、
    前記比較結果に基づいて前記信号灯の位置領域を調整することを含むことを特徴とする請求項7〜9のいずれか一項に記載の方法。
  11. 前記比較結果に基づいて前記信号灯の位置領域を調整することは、
    前記交通信号灯のキーポイントに対応する位置領域と前記信号灯の位置領域とが重なり合わないことに応答して、前記信号灯の位置領域を前記交通信号灯のキーポイントに対応する位置領域に置換することを含むことを特徴とする請求項10に記載の方法。
  12. 前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定する前に、
    前記方法は、
    収集されたトレーニング画像の集合に基づいて、前記領域に基づく完全畳み込みネットワークをトレーニングし、前記トレーニング画像の集合がラベル付け属性を有する複数のトレーニング画像を含み、
    前記トレーニング画像の集合に基づいて前記領域に基づく完全畳み込みネットワークと前記マルチタスク認識ネットワークのパラメータを調整することを更に含むことを特徴とする請求項4〜11のいずれか一項に記載の方法。
  13. 前記トレーニング画像の集合に基づいて前記領域に基づく完全畳み込みネットワークと前記マルチタスク認識ネットワークのパラメータを調整する前に、
    前記方法は、
    前記トレーニング画像の集合に基づいて、交通信号灯の色の割合が所定割合に合致する新しいトレーニング画像の集合を取得し、
    前記新しいトレーニング画像の集合に基づいて、分類ネットワークをトレーニングすることを更に含み、前記分類ネットワークは、前記交通信号灯の色に基づいて前記トレーニング画像を分類するために使用されることを特徴とする請求項12に記載の方法。
  14. 前記所定割合において異なった色の交通信号灯の数が同様であるか又は数量差が許容閾値より小さく、
    前記交通信号灯の色は赤、黄及び青であることを特徴とする請求項13に記載の方法。
  15. 前記トレーニング画像の集合に基づいて前記領域に基づく完全畳み込みネットワークと前記マルチタスク認識ネットワークのパラメータを調整する前に、
    前記方法は、前記トレーニングされた分類ネットワークのパラメータに基づいて前記マルチタスク認識ネットワークの少なくとも一部のパラメータを初期化することを更に含むことを特徴とする請求項14に記載の方法。
  16. 前記方法は、前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定し、
    前記交通信号灯の状態により前記車両に対してインテリジェントドライブ制御を実行することを更に含むことを特徴とする請求項1〜15のいずれか一項に記載の方法。
  17. 前記インテリジェントドライブ制御は、通知情報又は警告情報を送信する及び/又は前記交通信号灯の状態による前記車両の走行状態を制御することを含むことを特徴とする請求項16に記載の方法。
  18. 前記方法は、前記交通信号灯の属性、状態及び対応する前記画像を記憶することを更に含むことを特徴とする請求項16又は17に記載の方法。
  19. 前記交通信号灯の状態は、通行許可状態、通行禁止状態又は待ち状態を含み、
    前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定することは、
    前記交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、前記交通信号灯の状態が通行許可状態であると決定し、
    前記交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、前記交通信号灯の状態が通行禁止状態であると決定し、
    前記交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、前記交通信号灯の状態が待ち状態であると決定することの少なくとも一項を含むことを特徴とする請求項16〜18のいずれか一項に記載の方法。
  20. 前記交通信号灯の状態により前記車両に対してインテリジェントドライブ制御を実行することは、
    前記交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯のうちの1種又は複数種の操作を実行するように車両を制御し、
    前記交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯のうちの1種又は複数種の操作を実行させるように前記車両を制御することを含むことを特徴とする請求項19に記載の方法。
  21. インテリジェントドライブ方法であって、
    当該方法は、
    車両に配置された画像収集装置により交通信号灯を含むビデオストリームを取得し、
    前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、
    前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定し、
    前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定し、
    前記交通信号灯の状態により前記車両に対してインテリジェントドライブ制御を実行することを含むことを特徴とする方法。
  22. 前記インテリジェントドライブ制御は、通知情報又は警告情報を送信する及び/又は前記交通信号灯の状態による前記車両の走行状態を制御することを含むことを特徴とする請求項21に記載の方法。
  23. 前記方法は、前記交通信号灯の属性、状態及び対応する前記画像を記憶することを更に含むことを特徴とする請求項21又は22に記載の方法。
  24. 前記交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含むことを特徴とする請求項21〜23のいずれか一項に記載の方法。
  25. 前記交通信号灯の状態は、通行許可状態、通行禁止状態及び待ち状態を含み、
    前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定することは、
    前記交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、前記交通信号灯の状態が通行許可状態であると決定し、
    前記交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、前記交通信号灯の状態が通行禁止状態であると決定し、
    前記交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、前記交通信号灯の状態が待ち状態であると決定することを含むことを特徴とする請求項24に記載の方法。
  26. 前記交通信号灯の状態により前記車両に対してインテリジェントドライブ制御を実行することは、
    前記交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯のうちの1種又は複数種の操作を実行するように車両を制御し、
    前記交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯のうちの1種又は複数種の操作を実行するように車両を制御することを含むことを特徴とする請求項25に記載の方法。
  27. 交通信号灯検出装置であって
    当該交通信号灯検出装置は、ビデオストリーム取得ユニットと、領域決定ユニットと、属性認識ユニットとを含み、
    前記ビデオストリーム取得ユニットは、交通信号灯を含むビデオストリームを取得するために用いられ、
    前記領域決定ユニットは、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定するために用いられ、
    前記属性認識ユニットは、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定するために用いられることを特徴とする装置。
  28. 前記交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含むことを特徴とする請求項27に記載の装置。
  29. 前記領域決定ユニットは、領域に基づく完全畳み込みネットワークを用いて、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定するために用いられることを特徴とする請求項27又は28に記載の装置。
  30. 前記属性認識ユニットは、マルチタスク認識ネットワークを用いて、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定するために用いられることを特徴とする請求項27〜29のいずれか一項に記載の装置。
  31. 前記マルチタスク認識ネットワークは、特徴抽出ブランチと、少なくとも2つの前記特徴抽出ブランチにそれぞれ接続されるタスクブランチとを含み、異なったタスクブランチは、前記交通信号灯の異なった種類の属性を決定するために用いられ、
    前記属性認識ユニットは、特徴抽出モジュールと、ブランチ属性モジュールと、を含み、
    前記特徴抽出モジュールは、前記特徴抽出ブランチに基づいて前記候補領域に対して特徴抽出を実行して候補特徴を取得するために用いられ、
    前記ブランチ属性モジュールは、それぞれ前記少なくとも2つのタスクブランチに基づいて前記候補特徴を処理して前記画像における交通信号灯の少なくとも2種の属性を取得するために用いられることを特徴とする請求項30に記載の装置。
  32. 前記少なくとも2つのタスクブランチは、検出ブランチ、認識ブランチ及び分類ブランチを含み、
    前記ブランチ属性モジュールは、前記検出ブランチにより前記候補特徴に対して位置検出を実行して、交通信号灯の位置領域を決定し、前記分類ブランチにより前記候補特徴に対して色の分類を実行して、交通信号灯の所在する位置領域の色を決定して、前記交通信号灯の色を決定し、前記認識ブランチにより前記候補特徴に対して形状認識を実行して、前記交通信号灯の所在する位置領域の形状を決定して、前記交通信号灯の形状を決定するために用いられることを特徴とする請求項31に記載の装置。
  33. 前記装置は、キーポイント決定ユニットと、キーポイント追跡ユニットと、位置調整ユニットとを更に含み、
    前記キーポイント決定ユニットは、前記ビデオストリームの少なくとも1つのフレームの画像に対してキーポイント認識を実行して前記画像における交通信号灯のキーポイントを決定するために用いられ、
    前記キーポイント追跡ユニットは、前記ビデオストリームの交通信号灯のキーポイントを追跡して追跡結果を取得するために用いられ、
    前記位置調整ユニットは、前記追跡結果に基づいて前記交通信号灯の位置領域を調整するために用いられることを特徴とする請求項27〜32のいずれか一項に記載の装置。
  34. 前記キーポイント追跡ユニットは、連続した2つのフレームの前記画像における前記交通信号灯のキーポイントの間の距離を基礎とし、前記交通信号灯のキーポイントの間の距離に基づいて前記ビデオストリームの交通信号灯のキーポイントを追跡するために用いられることを特徴とする請求項33に記載の装置。
  35. 前記キーポイント追跡ユニットは、前記交通信号灯のキーポイントの間の距離に基づいて前記ビデオストリームの交通信号灯のキーポイントを追跡する時に、前記交通信号灯のキーポイントの間の距離に基づいて、連続した2つのフレームの画像における同じ交通信号灯のキーポイントの位置領域を決定し、前記同じ交通信号灯のキーポイントが連続した2つのフレームの前記画像に所在する位置領域により、前記ビデオストリームにおける交通信号灯のキーポイントを追跡するために用いられることを特徴とする請求項34に記載の装置。
  36. 前記位置調整ユニットは、前記追跡結果と前記信号灯の位置領域とが重なり合うか否かを比較して比較結果を取得し、前記比較結果に基づいて前記信号灯の位置領域を調整するために用いられることを特徴とする請求項33〜35のいずれか一項に記載の装置。
  37. 前記位置調整ユニットは、前記比較結果に基づいて前記信号灯の位置領域を調整する時に、前記交通信号灯のキーポイントに対応する位置領域と前記信号灯の位置領域とが重なり合わないことに応答して、前記信号灯の位置領域を前記交通信号灯のキーポイントに対応する位置領域に置換するために用いられることを特徴とする請求項36に記載の装置。
  38. 前記装置は、事前トレーニングユニットと、トレーニングユニットとを更に含み、
    前記事前トレーニングユニットは、収集されたトレーニング画像の集合に基づいて前記領域に基づく完全畳み込みネットワークをトレーニングするために用いられ、前記トレーニング画像の集合は、ラベル付け属性を有する複数のトレーニング画像を含み、
    前記トレーニングユニットは、前記トレーニング画像の集合に基づいて前記領域に基づく完全畳み込みネットワークと前記マルチタスク認識ネットワークのパラメータを調整するために用いられることを特徴とする請求項30〜37のいずれか一項に記載の装置。
  39. 前記装置は、分類トレーニングユニットを更に含み、
    前記分類トレーニングユニットは、前記トレーニング画像の集合に基づいて、交通信号灯の色の割合が所定割合に合致する新しいトレーニング画像の集合を取得し、前記新しいトレーニング画像の集合に基づいて、分類ネットワークをトレーニングするために用いられ、前記分類ネットワークは、前記交通信号灯の色に基づいて前記トレーニング画像を分類するために用いられることを特徴とする請求項38に記載の装置。
  40. 前記所定割合において異なった色の交通信号灯の数が同様であるか又は数量差が許容閾値より小さく、
    前記交通信号灯の色は赤、黄及び青であることを特徴とする請求項39に記載の装置。
  41. 前記装置は、初期化ユニットを更に含み、
    前記初期化ユニットは、前記トレーニングされた分類ネットワークのパラメータに基づいて前記マルチタスク認識ネットワークの少なくとも一部のパラメータを初期化するために用いられることを特徴とする請求項40に記載の装置。
  42. 前記装置は、状態決定ユニットと、インテリジェント制御ユニットとを更に含み、
    前記状態決定ユニットは、前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定するために用いられ、
    前記インテリジェント制御ユニットは、前記交通信号灯の状態により前記車両に対してインテリジェントドライブ制御を実行するために用いられることを特徴とする請求項27〜41のいずれか一項に記載の装置。
  43. 前記インテリジェントドライブ制御は、通知情報又は警告情報の送信する及び/又は前記交通信号灯の状態による前記車両の走行状態の制御することを含むことを特徴とする請求項42に記載の装置。
  44. 前記装置は、記憶ユニットを更に含み、
    前記記憶ユニットは、前記交通信号灯の属性、状態及び対応する前記画像を記憶するために用いられることを特徴とする請求項42又は43に記載の装置。
  45. 前記交通信号灯の状態は、通行許可状態、通行禁止状態又は待ち状態を含み、
    前記状態決定ユニットは、
    前記交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、前記交通信号灯の状態が通行許可状態であると決定し、
    前記交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、前記交通信号灯の状態が通行禁止状態であると決定し、
    前記交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、前記交通信号灯の状態が待ち状態であると決定するために用いられることを特徴とする請求項42〜44のいずれか一項に記載の装置。
  46. 前記インテリジェント制御ユニットは、
    前記交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯のうちの1種又は複数種の操作を実行するように車両を制御し、
    前記交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯のうちの1種又は複数種の操作を実行するように車両を制御するために用いられることを特徴とする請求項45に記載の装置。
  47. インテリジェントドライブ装置であって
    当該インテリジェントドライブ装置は、ビデオストリーム取得ユニットと、領域決定ユニットと、属性認識ユニットと、状態決定ユニットと、インテリジェント制御ユニットとを含み、
    前記ビデオストリーム取得ユニットは、車両に配置された画像収集装置により交通信号灯を含むビデオストリームを取得し、
    前記領域決定ユニットは、前記ビデオストリームの少なくとも1つのフレームの画像における交通信号灯の候補領域を決定し、
    前記属性認識ユニットは、前記候補領域に基づいて前記画像における交通信号灯の少なくとも2種の属性を決定し、
    前記状態決定ユニットは、前記画像における交通信号灯の少なくとも2種の属性に基づいて前記交通信号灯の状態を決定し、
    前記インテリジェント制御ユニットは、前記交通信号灯の状態により前記車両に対してインテリジェントドライブ制御を実行するために用いられることを特徴とする装置。
  48. 前記インテリジェントドライブ制御は、通知情報又は警告情報の送信する及び/又は前記交通信号灯の状態による前記車両の走行状態の制御することを含むことを特徴とする請求項47に記載の装置。
  49. 前記装置は、記憶ユニットを更に含み、
    前記記憶ユニットは、前記交通信号灯の属性、状態及び対応する前記画像を記憶するために用いられることを特徴とする請求項47又は48に記載の装置。
  50. 前記交通信号灯の少なくとも2種の属性は、位置領域、色及び形状の任意の2種又は2種以上を含むことを特徴とする請求項47〜49のいずれか一項に記載の装置。
  51. 前記交通信号灯の状態は、通行許可状態、通行禁止状態及び待ち状態を含み、
    前記状態決定ユニットは、
    前記交通信号灯の色が緑であり及び/又は形状が第1の所定形状であることに応答して、前記交通信号灯の状態が通行許可状態であると決定し、
    前記交通信号灯の色が赤であり及び/又は形状が第2の所定形状であることに応答して、前記交通信号灯の状態が通行禁止状態であると決定し、
    前記交通信号灯の色が黄であり及び/又は形状が第3の所定形状であることに応答して、前記交通信号灯の状態が待ち状態であると決定するために用いられることを特徴とする請求項50に記載の装置。
  52. 前記インテリジェント制御ユニットは、
    前記交通信号灯の状態が通行許可状態であることに応答して、起動、走行状態保持、減速、転向、ウインカーの点灯、ブレーキランプの点灯のうちの1種又は複数種の操作を実行するように車両を制御し、
    前記交通信号灯の状態が通行禁止状態又は待ち状態であることに応答して、停車、減速、ブレーキランプの点灯のうちの1種又は複数種の操作を実行させるように前記車両を制御するために用いられることを特徴とする請求項51に記載の装置。
  53. 車両であって、
    当該車両は、請求項27〜46のいずれか一項に記載の交通信号灯検出装置又は請求項47〜52のいずれか一項に記載のインテリジェントドライブ装置を含むことを特徴とする車両。
  54. 電子機器であって、
    当該電子機器は、プロセッサを含み、
    前記プロセッサは、請求項27〜46のいずれか一項に記載の交通信号灯検出装置又は請求項47〜52のいずれか一項に記載のインテリジェントドライブ装置を含むことを特徴とする電子機器。
  55. 電子機器であって、
    当該電子機器は、メモリと、プロセッサとを含み、
    前記メモリは、実行可能コマンドを記憶するために用いられ、
    前記プロセッサは、前記メモリと通信して前記実行可能コマンドを実行して請求項1〜20のいずれか一項に記載の交通信号灯検出方法の操作を完成するか、又は請求項21〜26のいずれか一項に記載のインテリジェントドライブ方法の操作を完成するために用いられることを特徴とする電子機器。
  56. コンピュータ読取可能コマンドを記憶するためのコンピュータ読取可能記憶媒体であって、
    前記コマンドが実行されると、請求項1〜20のいずれか一項に記載の交通信号灯検出方法又は請求項21〜26のいずれか一項に記載のインテリジェントドライブ方法の操作が実行されることを特徴とするコンピュータ読取可能記憶媒体。
  57. コンピュータ可読コードを含むコンピュータプログラム製品であって、
    前記コンピュータ可読コードが機器上で作動すると、前記機器中のプロセッサは請求項1〜20のいずれか一項に記載の交通信号灯検出方法又は請求項21〜26のいずれか一項に記載のインテリジェントドライブ方法を実現するためのコマンドを実行することを特徴とするコンピュータプログラム製品。
JP2020550090A 2018-06-29 2019-05-29 交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器 Active JP7111827B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810697683.9A CN110660254B (zh) 2018-06-29 2018-06-29 交通信号灯检测及智能驾驶方法和装置、车辆、电子设备
CN201810697683.9 2018-06-29
PCT/CN2019/089062 WO2020001223A1 (zh) 2018-06-29 2019-05-29 交通信号灯检测及智能驾驶方法和装置、车辆、电子设备

Publications (2)

Publication Number Publication Date
JP2021519968A true JP2021519968A (ja) 2021-08-12
JP7111827B2 JP7111827B2 (ja) 2022-08-02

Family

ID=68985543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020550090A Active JP7111827B2 (ja) 2018-06-29 2019-05-29 交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器

Country Status (6)

Country Link
US (1) US20200353932A1 (ja)
JP (1) JP7111827B2 (ja)
KR (1) KR102447352B1 (ja)
CN (1) CN110660254B (ja)
SG (1) SG11202007333PA (ja)
WO (1) WO2020001223A1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10836393B2 (en) * 2017-12-10 2020-11-17 Anatoly S. Weiser Smart traffic control devices and beacons, methods of their operation, and use by vehicles of information provided by the devices and beacons
US11866046B2 (en) * 2017-12-10 2024-01-09 Anatoly S. Weiser Smart traffic control devices and beacons, methods of their operation, and use by vehicles of information provided by the devices and beacons
CN113987228A (zh) * 2018-06-20 2022-01-28 华为技术有限公司 一种数据库构建方法、一种定位方法及其相关设备
DE112020002604T5 (de) * 2019-05-29 2022-03-03 Mobileye Vision Technologies Ltd. Systeme und verfahren für die fahrzeugnavigation
CN112149697A (zh) * 2019-06-27 2020-12-29 商汤集团有限公司 指示灯的指示信息识别方法及装置、电子设备和存储介质
CN111292531B (zh) * 2020-02-06 2022-07-29 阿波罗智能技术(北京)有限公司 交通信号灯的跟踪方法、装置、设备及存储介质
CN111400531B (zh) * 2020-03-13 2024-04-05 广州文远知行科技有限公司 目标标注方法、装置、设备与计算机可读存储介质
JP7115502B2 (ja) 2020-03-23 2022-08-09 トヨタ自動車株式会社 物体状態識別装置、物体状態識別方法及び物体状態識別用コンピュータプログラムならびに制御装置
JP7359735B2 (ja) * 2020-04-06 2023-10-11 トヨタ自動車株式会社 物体状態識別装置、物体状態識別方法及び物体状態識別用コンピュータプログラムならびに制御装置
JP7388971B2 (ja) 2020-04-06 2023-11-29 トヨタ自動車株式会社 車両制御装置、車両制御方法及び車両制御用コンピュータプログラム
US11328519B2 (en) 2020-07-23 2022-05-10 Waymo Llc Detecting traffic signaling states with neural networks
CN112289021A (zh) * 2020-09-24 2021-01-29 深圳一清创新科技有限公司 一种交通信号灯的检测方法、装置及自动驾驶汽车
KR20220083945A (ko) * 2020-12-11 2022-06-21 현대자동차주식회사 신호등 정보 제공 장치, 그를 포함한 차량 시스템 및 그 방법
CN112507951B (zh) * 2020-12-21 2023-12-12 阿波罗智联(北京)科技有限公司 指示灯识别方法、装置、设备、路侧设备和云控平台
US11776281B2 (en) * 2020-12-22 2023-10-03 Toyota Research Institute, Inc. Systems and methods for traffic light detection and classification
CN112699773B (zh) * 2020-12-28 2023-09-01 阿波罗智联(北京)科技有限公司 交通灯识别方法、装置及电子设备
CN112349101B (zh) * 2021-01-08 2021-04-27 深圳裹动智驾科技有限公司 高精地图生成方法、以及识别交通灯的方法及系统
CN113011251B (zh) * 2021-02-03 2024-06-04 深圳大学 一种基于交通灯几何属性的行人交通灯识别方法
US12014549B2 (en) 2021-03-04 2024-06-18 Toyota Research Institute, Inc. Systems and methods for vehicle light signal classification
CN113033464B (zh) * 2021-04-10 2023-11-21 阿波罗智联(北京)科技有限公司 信号灯检测方法、装置、设备以及存储介质
CN113077630B (zh) * 2021-04-30 2022-06-28 安徽江淮汽车集团股份有限公司 基于深度学习的红绿灯检测方法、装置、设备及存储介质
CN113450588B (zh) * 2021-06-28 2023-04-07 通视(天津)信息技术有限公司 交通信号灯时信息的处理方法、装置以及电子设备
CN113469109B (zh) * 2021-07-16 2022-09-13 阿波罗智联(北京)科技有限公司 交通灯识别结果处理方法、装置、路侧设备及云控平台
CN113674544A (zh) 2021-07-21 2021-11-19 阿波罗智联(北京)科技有限公司 信号机的报警方法、装置、电子设备和可读存储介质
KR102472649B1 (ko) * 2021-12-28 2022-11-30 포티투닷 주식회사 객체를 트래킹하기 위한 방법 및 장치
CN114782924B (zh) * 2022-05-10 2024-07-12 智道网联科技(北京)有限公司 用于自动驾驶的交通灯检测方法、装置及电子设备
CN114973205B (zh) * 2022-06-28 2024-08-13 深圳一清创新科技有限公司 一种红绿灯跟踪方法、装置、及无人驾驶汽车
CN115984823B (zh) * 2023-02-27 2023-06-09 安徽蔚来智驾科技有限公司 交通信号灯感知方法、车辆控制方法、设备、介质及车辆
WO2024197629A1 (zh) * 2023-03-29 2024-10-03 华为技术有限公司 检测方法、装置以及智能驾驶设备
CN116681935B (zh) * 2023-05-31 2024-01-23 国家深海基地管理中心 一种深海热液喷口自主识别定位方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150210276A1 (en) * 2014-01-30 2015-07-30 Mobileye Vision Technologies Ltd. Systems and methods for determining the status of a turn lane traffic light
CN106650641A (zh) * 2016-12-05 2017-05-10 北京文安智能技术股份有限公司 一种交通信号灯定位识别方法、装置及系统
CN106837649A (zh) * 2017-03-03 2017-06-13 吉林大学 基于信号灯倒计时识别的自学习智能起停系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4357137B2 (ja) * 2001-05-11 2009-11-04 富士通マイクロエレクトロニクス株式会社 移動体追跡方法及びシステム
US6999004B2 (en) * 2002-06-17 2006-02-14 Siemens Corporate Research, Inc. System and method for vehicle detection and tracking
CN103489324B (zh) * 2013-09-22 2015-09-09 北京联合大学 一种基于无人驾驶的实时动态红绿灯检测识别方法
KR20150047214A (ko) * 2013-10-24 2015-05-04 현대모비스 주식회사 카메라 센서를 이용한 scc 시스템 및 방법
US20170102467A1 (en) * 2013-11-20 2017-04-13 Certusview Technologies, Llc Systems, methods, and apparatus for tracking an object
CN103729863B (zh) * 2013-12-06 2016-05-25 南京金智视讯技术有限公司 基于自主学习的交通信号灯全自动定位识别的方法
WO2015175826A1 (en) * 2014-05-14 2015-11-19 Kapach Yair Systems and methods for detecting traffic signs
US9779314B1 (en) * 2014-08-21 2017-10-03 Waymo Llc Vision-based detection and classification of traffic lights
CN105893971A (zh) * 2016-04-01 2016-08-24 上海理工大学 一种基于Gabor和稀疏表示的交通信号灯识别方法
CN107527511B (zh) * 2016-06-22 2020-10-09 杭州海康威视数字技术股份有限公司 一种智能车辆行车提醒方法及装置
CN106023623A (zh) * 2016-07-28 2016-10-12 南京理工大学 基于机器视觉的车载交通信号与标志的识别及预警方法
CN106570494A (zh) * 2016-11-21 2017-04-19 北京智芯原动科技有限公司 基于卷积神经网络的交通信号灯识别方法及装置
CN106909937B (zh) * 2017-02-09 2020-05-19 北京汽车集团有限公司 交通信号灯识别方法、车辆控制方法、装置及车辆
CN106897742B (zh) * 2017-02-21 2020-10-27 北京市商汤科技开发有限公司 用于检测视频中物体的方法、装置和电子设备
US11067995B2 (en) * 2017-03-20 2021-07-20 Mobileye Vision Technologies Ltd. Navigation by augmented path prediction
US10699142B2 (en) * 2017-04-20 2020-06-30 GM Global Technology Operations LLC Systems and methods for traffic signal light detection
CN107978165A (zh) * 2017-12-12 2018-05-01 南京理工大学 基于计算机视觉的交叉口标志标线与信号灯智能感知方法
CN108108761B (zh) * 2017-12-21 2020-05-01 西北工业大学 一种基于深度特征学习的快速交通信号灯检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150210276A1 (en) * 2014-01-30 2015-07-30 Mobileye Vision Technologies Ltd. Systems and methods for determining the status of a turn lane traffic light
CN106650641A (zh) * 2016-12-05 2017-05-10 北京文安智能技术股份有限公司 一种交通信号灯定位识别方法、装置及系统
CN106837649A (zh) * 2017-03-03 2017-06-13 吉林大学 基于信号灯倒计时识别的自学习智能起停系统

Also Published As

Publication number Publication date
CN110660254A (zh) 2020-01-07
KR20200128145A (ko) 2020-11-11
US20200353932A1 (en) 2020-11-12
SG11202007333PA (en) 2020-08-28
CN110660254B (zh) 2022-04-08
JP7111827B2 (ja) 2022-08-02
KR102447352B1 (ko) 2022-09-23
WO2020001223A1 (zh) 2020-01-02

Similar Documents

Publication Publication Date Title
JP2021519968A (ja) 交通信号灯検出方法、インテリジェントドライブ方法及び装置、車両並びに電子機器
US20200272835A1 (en) Intelligent driving control method, electronic device, and medium
JP7024115B2 (ja) 区画線に基づくインテリジェントドライブ制御方法および装置、ならびに電子機器
JP2021530048A (ja) 多階層化目標類別方法及び装置、交通標識検出方法及び装置、機器並びに媒体
Yuan et al. Robust traffic sign recognition based on color global and local oriented edge magnitude patterns
Romdhane et al. An improved traffic signs recognition and tracking method for driver assistance system
KR20210080459A (ko) 차선 검출방법, 장치, 전자장치 및 가독 저장 매체
CN105205785B (zh) 一种可定位的大型车辆运行管理系统及其运行方法
CN111767831B (zh) 用于处理图像的方法、装置、设备及存储介质
CN111428663A (zh) 红绿灯状态的识别方法、装置、电子设备和存储介质
Saleh et al. Traffic signs recognition and distance estimation using a monocular camera
US20230130355A1 (en) Image processing method and apparatus
Xu et al. Convolutional neural network based traffic sign recognition system
CN108762250A (zh) 设备的控制方法和装置、设备、计算机程序和存储介质
Liu et al. Real-time traffic light recognition based on smartphone platforms
US11314968B2 (en) Information processing apparatus, control method, and program
KR101877809B1 (ko) Gpu를 이용한 신호등 인식 장치 및 방법
Kishor et al. Real-Time Traffic Signs and Lane Line Detection
US20220292749A1 (en) Scene content and attention system
Symeonidis et al. Traffic light detection and recognition using image processing and convolution neural networks
Zhu Design and implementation of intelligent remote multimedia physical education teaching system
Ganesh Parking lot monitoring system using an autonomous quadrotor UAV
Michalewicz AI-Driven Systems for Autonomous Vehicle Road Sign Detection and Classification
Pinto et al. Analysis and Deployment of an OCR—SSD Deep Learning Technique for Real-Time Active Car Tracking and Positioning on a Quadrotor
Show et al. Biologically inspired composite vision system for traffic monitoring

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200917

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220721

R150 Certificate of patent or registration of utility model

Ref document number: 7111827

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150