JP2021530388A - レールセグメント化に基づいて、鉄道障害物を検出するための方法およびシステム - Google Patents

レールセグメント化に基づいて、鉄道障害物を検出するための方法およびシステム Download PDF

Info

Publication number
JP2021530388A
JP2021530388A JP2020570136A JP2020570136A JP2021530388A JP 2021530388 A JP2021530388 A JP 2021530388A JP 2020570136 A JP2020570136 A JP 2020570136A JP 2020570136 A JP2020570136 A JP 2020570136A JP 2021530388 A JP2021530388 A JP 2021530388A
Authority
JP
Japan
Prior art keywords
training
image frame
rssd
train
rail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020570136A
Other languages
English (en)
Other versions
JP7343531B2 (ja
Inventor
サギ ドルバーグ
ナタリー デイ
マイケル レヴィー
アヴィシャイ アルファンダリー
アヴラハム ラム グイシン
シャロン バソン
ゾハール ズィーヴ シェクター
シャハール ハニア
ヨタム アズリエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rail Vision Ltd
Original Assignee
Rail Vision Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rail Vision Ltd filed Critical Rail Vision Ltd
Publication of JP2021530388A publication Critical patent/JP2021530388A/ja
Application granted granted Critical
Publication of JP7343531B2 publication Critical patent/JP7343531B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L23/00Control, warning or like safety means along the route or between vehicles or trains
    • B61L23/04Control, warning or like safety means along the route or between vehicles or trains for monitoring the mechanical state of the route
    • B61L23/041Obstacle detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10048Infrared image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

前方監視電気光学撮像と、新規なシステムアーキテクチャと、新規なシーン解析および画像処理に基づいて、レールおよび障害物を検出するためのシステムおよび方法が開示される。この処理解決策は、前方撮像で列車の鉄道経路を決定するレール・スイッチ状態検出ニューラルネットワークと、決定した鉄道経路の近傍を分析し、差し迫った障害物を検出する物体・障害物検出・追跡ニューラルネットワーク(OODT NN)とに基づく深層学習意味的シーンセグメント化アプローチを利用する。【選択図】図1A

Description

本発明は、鉄道のアプリケーションにおいて、衝突を回避し、状況を認識すべく、レールをセグメント化し、障害物を検出するためのシステムおよび方法の分野に関し、より具体的には、そのコンピュータ支援撮像と認知処理とをベースにする技法に関する。
典型的な電気光学コンピュータ支援撮像技法では、領域またはシーンのリアルタイム撮像を生成し、それを処理して、分析し、そこから所望のデータを抽出する。
例えば、鉄道を安全にし、衝突を回避するためのアプリケーションでは、種々の電気光学センサが、鉄道シーンを調査し、監視するために使用される。例えば、沿線センサおよび/または列車(例えば、機関車)に取り付けられたセンサを使用することができる。このような列車に取り付けられた前方監視センサは、鉄道のシーンをリアルタイムで調査するために使用され、それによって、レールの両方を検出し、および/または検出されたレール上またはその近傍の潜在的な障害物を検出/分類する。そのような機能および関連するアラートおよびアラームは、列車運転士の操作を補助し、列車操作(例えば、自律列車操作のために)の安全機能を提供するのに使用されてもよい。
公知の列車でのアプリケーションには、例えば、都市列車(例えば、路面電車)、幹線列車、高速列車、貨物列車と、貨物機関車を使用する操車場の操作が含まれ得る。関心のある多種多様な潜在的な軌道上の障害物には、例えば、人間、動物、車両、列車、貨車、人工物、自然の残骸(例えば、倒木の幹)が含まれ得る。軌道上の安全性およびセキュリティの課題に加えて、自殺行為の問題もあり、これには、切迫した自殺事例に迅速に対応し、分析することが、さらに必要である。
電気光学昼夜画像フレームをベースとして、鉄道シーンにおける物体および障害物を検出して、分類することは、そのような感知および画像フレーム/シーン解析に必要な拡張された範囲および多様な気象条件のために、またそのような差し迫った衝突に迅速に対応するために(例えば、アラームの生成、列車の減速、時間内の列車の停止)、困難なことがある。
本発明の一態様は、レールおよび障害物を検出する方法を提供することができる。この方法は、列車の機関車に設置された少なくとも1つの撮像センサから複数の画像フレームを受信するステップであって、少なくとも1つの撮像センサは列車の進行方向に向いている、ステップと、複数の画像フレームのサブセットの各画像フレームについて、それぞれの画像フレームと履歴要素とを含む入力データ構造を決定するステップであって、履歴要素は、それぞれの画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測を含み得る、ステップと、サブセットの画像フレームのそれぞれの入力データ構造に基づいて、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)を使用して、それぞれの画像フレームのセグメント化マスク予測を決定するステップであって、セグメント化マスク予測は、列車が沿って移動する現鉄道経路を少なくとも含み得る、ステップと、を含み得る。
いくつかの実施形態では、セグメント化マスク予測は、現鉄道経路に沿った対応する少なくとも1つのスイッチの状態を表す現鉄道経路に沿った少なくとも1つの分岐をさらに含み得る。
いくつかの実施形態では、方法は、RSSD NNを、その推論する前に訓練するステップをさらに含み、訓練は、訓練画像フレームの訓練サブセットに基づき、所定数の訓練サイクルを含み、訓練サイクルのそれぞれは、訓練サブセットの各訓練画像フレームについて、それぞれの訓練画像フレームおよび訓練履歴要素を含む訓練入力データ構造を決定するステップであって、訓練履歴要素は、それぞれの訓練画像フレームに先行する訓練画像フレームについて決定された訓練セグメント化マスク予測を含む、ステップと、訓練サブセットの訓練画像フレームのそれぞれの訓練入力データ構造に基づいて、RSSD NNを使用して、それぞれの訓練画像フレームの訓練セグメント化マスク予測を決定するステップと、訓練サブセットの訓練画像フレームのそれぞれについて決定した訓練セグメント化マスク予測を、訓練画像フレームの少なくとも1つの所定の注釈付きマスクと比較するステップと、訓練サブセットの訓練画像フレームのそれぞれについて、比較に基づいて、決定した訓練セグメント化マスク予測を更新するステップと、を含み得る。
いくつかの実施形態では、この方法は、所定数のサイクルの少なくとも1つの訓練サイクル中に決定された訓練セグメント化マスク予測を増強するステップをさらに含み、訓練セグメント化マスク予測を増強するステップは、訓練セグメント化マスク予測の全体をゼロにするステップ、訓練セグメント化マスク予測の所定の部分をゼロにするステップ、および訓練セグメント化マスク予測の所定の部分を、現鉄道経路の形状および位置を保持し、現鉄道経路と、現鉄道経路に沿った少なくとも1つの分岐との区別を無視する指定ラベルに置き換えるステップのうちの少なくとも1つを含み得る。
いくつかの実施形態では、本方法は、サブセットの少なくとも1つの画像フレームにおいて、それぞれのフレームについて決定されたセグメント化マスク予測に基づいて、物体・障害物検出・追跡ニューラルネットワーク(OODT NN)を使用して、現鉄道経路上またはその近傍の少なくとも1つの物体/障害物を決定するステップをさらに含み得る。
本発明の別の態様は、レールおよび障害物を検出するためのシステムを提供することができ、このシステムは、複数の画像フレームを取得するために、列車の機関車に設置され、列車の進行方向に向いた少なくとも1つの撮像センサと、レール・スイッチ状態検出(RSSD)ニューラルネットワーク(RSSD NN)を含み得るRSSDモジュールと、を含むことができ、RSSDモジュールは、複数の画像フレームのサブセットの各画像フレームについて、それぞれの画像フレームと履歴要素とを含む入力データ構造を決定することであって、履歴要素は、それぞれの画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測を含む、ことと、サブセットの画像フレームのそれぞれの入力データ構造に基づいて、RSSD NNを使用して、それぞれの画像フレームのセグメント化マスク予測を決定することであって、セグメント化マスク予測は、列車が沿って移動する現鉄道経路を少なくとも含む、ことと、を行うように構成される。
いくつかの実施形態では、セグメント化マスク予測は、現鉄道経路に沿った対応する少なくとも1つのスイッチの状態を表す現鉄道経路に沿った少なくとも1つの分岐をさらに備える。
いくつかの実施形態では、システムは、物体・障害物検出・追跡(OODT)ニューラルネットワーク(OODT)を含むことができるOODTモジュールをさらに含むことができ、OODTモジュールは、サブセットの少なくとも1つの画像フレームにおいて、それぞれの画像フレームについて決定されたセグメント化マスク予測に基づいて、OODT NNを使用して、現鉄道経路上またはその近傍の少なくとも1つの物体/障害物を決定するように構成される。
いくつかの実施形態では、少なくとも1つのセンサは、視覚帯域撮像センサおよび熱赤外線センサのうちの少なくとも1つである。
いくつかの実施形態では、少なくとも1つのセンサは、狭視野撮像センサおよび広視野撮像センサのうちの少なくとも1つである。
本発明のこれらの、追加および/または他の態様および/または利点は、以下の詳細な説明に記載されており、おそらく詳細な説明から推論することが可能であり、および/または本発明の実施によって学習することが可能である。
本発明の実施形態をより良く理解し、本発明をどのように実施することができるかを示すために、ここで、単に一例として、添付の図面を参照する(ここで、同様の数字は、全体を通して対応する要素またはセクションを示す)。
本発明のいくつかの実施形態に従って、レールおよび障害物を検出(ROD)するために、列車などの車両に取り付けられたシステムの概略図である。 本発明のいくつかの実施形態に従って、レール・障害物検出用システムの撮像センサによって生成された画像フレームと、レール・スイッチ状態検出(RSSD)モジュールによって生成されたセグメント化マスク予測の一例である。 本発明のいくつかの実施形態に従って、レールおよび障害物を検出(ROD)するためのシステムの概略ブロック図である。 本発明のいくつかの実施形態に従って、長距離レールおよび物体/障害物を検出するために、列車に取り付けられた狭視野撮像センサ(NFS)の狭視野の概略図である。 本発明のいくつかの実施形態に従って、短距離レールおよび物体/障害物を検出するために、列車に取り付けられた広視野撮像センサ(WFS)の広視野の概略図である。 本発明のいくつかの実施形態に従って、列車に取り付けられた狭視野撮像センサ(NFS)と広視野センサ(WFS)とを組み合わせた狭視野と広視野の上面図の例を示す。 2つのそれぞれの広視野シーンおよび狭視野シーンを示すことで、本発明のいくつかの実施形態に従って、物体/障害物検出および衝突回避を改善するために、WFSの短距離カバレージをNFSの長距離カバレージと組み合わせることの有用性を示す。 種々のレール分岐、スリップおよび轍叉の例を示す。 前方監視車載撮像センサによってフレーム化された画像として、レールスイッチ分岐の一例と、そのスイッチを超える列車のオプションの経路を決定する軌道の概略部分を示す。 本発明のいくつかの実施形態に従って、列車の現鉄道経路を識別するために、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)を訓練し、推論するための様々なアプローチの概略図である。 本発明のいくつかの実施形態に従って、列車の現鉄道経路を識別するために、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)を訓練し、推論するための様々なアプローチの概略図である。 本発明のいくつかの実施形態に従って、列車の現鉄道経路を識別するために、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)を訓練し、推論するための様々なアプローチの概略図である。 本発明のいくつかの実施形態に従って、列車の現鉄道経路を識別するために、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)を訓練し、推論するための様々なアプローチの概略図である。 スイッチの通過後に続くレールシーンを示す。 列車経路のグラフィカルマスクと、それぞれの分岐を有する2つの差し迫ったスイッチとを含む例示的な鉄道シーンを示す。 本発明のいくつかの実施形態に従うレール・障害物検出ニューラルネットワーク(RSSD NN)のオフライン訓練フェーズのフローチャートである。 本発明のいくつかの実施形態に従うレール・障害物検出ニューラルネットワーク(RSSD NN)のオフライン訓練フェーズのフローチャートである。 本発明のいくつかの実施形態に従うレール・障害物検出ニューラルネットワーク(RSSD NN)のオフライン訓練フェーズのフローチャートである。 本発明のいくつかの実施形態に従うレール・障害物検出ニューラルネットワーク(RSSD NN)の前方推論プロセスのフローチャートである。 本発明のいくつかの実施形態に従って、レールおよび物体を検出するためのシステムの第一の特定の実装の概略ブロック図である。 本発明のいくつかの実施形態に従って、レールおよび物体を検出するためのシステムの第二の特定の実装の概略ブロック図である。 本発明のいくつかの実施形態に従って、VIS撮像センサからの画像フレームに適用される物体・障害物検出・追跡ニューラルネットワーク(OODT NN)の2つの実装の例を示す。 本発明のいくつかの実施形態に従って、画像フレームの関心領域(ROI)内に適用される物体・障害物検出・追跡ニューラルネットワーク(OODT NN)のプロセスのフローチャートである。 本発明のいくつかの実施形態に従って、可視帯域(VIS)センサおよび熱赤外線(TIR)センサから、物体・障害物検出・追跡ニューラルネットワーク(OODT NN)の境界ボックスを融合するプロセスのフローチャートである。 本発明のいくつかの実施形態に従って、可視帯域(VIS)センサおよび熱赤外線(TIR)センサから、物体・障害物検出・追跡ニューラルネットワーク(OODT NN)の境界ボックスを融合するプロセスのフローチャートである。 物体・障害物検出・追跡ニューラルネットワーク(OODT NN)のプロセスのフローチャートであり、これには、本発明のいくつかの実施形態に従って、第一の短距離検出用と、第二の長距離検出用との2つの関心領域(ROI)インスタンスが含まれている。 本発明のいくつかの実施形態に従って、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)の出力の一例を示す。 本発明のいくつかの実施形態に従って、典型的な駅シナリオと、対応するレールおよび障害物を検出するための解決策をそれぞれ示す。 本発明のいくつかの実施形態に従って、典型的な駅シナリオと、対応するレールおよび障害物を検出するための解決策をそれぞれ示す。 本発明のいくつかの実施形態に従って、運転士支援、予防保守およびビッグデータ支援をするためのシステムの概略ブロック図である。
説明を簡略で明確なものにするために、図に示されている要素は、必ずしも一定の縮尺で描かれていないことが理解されるであろう。例えば、いくつかの要素の寸法は、明確にするために、他の要素に対して誇張されていることがある。さらに、適切であると考えられる場合、参照番号は、対応または類似する要素を示すために、図面の間で繰り返すこともある。
以下の説明では、本発明の様々な態様について記載がなされる。説明をするために、特定の構成および詳細を記載し、本発明の完全な理解を提供する。しかしながら、本発明は、本明細書に提示される特定の詳細がなくても実施できることは当業者には明らかであろう。さらに、本発明を曖昧にしないために、周知の特徴は、省略または簡略化されている。特に図面を参照すると、示された詳細は、例として、本発明の例示的な議論のみを目的とし、本発明の原理および概念的態様の最も有用で容易に理解される説明であると考えられるものを提供するために、提示されることを強調する。この点に関して、本発明の基本的な理解のために必要である以上に詳細に本発明の構造的詳細を示す試みはなされておらず、図面を用いてなされた説明は、本発明のいくつかの形態が実際にどのように具現化され得るかを当業者に明らかにするものである。
本発明の少なくとも1つの実施形態を詳細に説明する前に、本発明は、その用途において、以下の説明に記載されるか、または図面に示される構成要素の構成および配置の詳細に限定されないことを理解されたい。本発明は、様々な方法で実施または実行することができる他の実施形態にも、開示された実施形態の組合せにも適用することが可能である。また、本明細書で使用される語法および用語は、説明の目的のためのものであり、限定とみなされるべきではないことを理解されたい。
特に明記しない限り、以下の説明から明らかなように、本明細書の説明全体にわたって使用される「処理する」、「算出する」、「計算する」、「決定する」、「強化する」などの用語は、コンピューティングシステムのレジスタおよび/またはメモリ内の電子量などの物理量として表されるデータを、コンピューティングシステムのメモリ、レジスタ、または他のそのような情報記憶、伝送、もしくは表示装置内の物理量として同様に表される他のデータに操作および/または変換する、コンピュータまたはコンピューティングシステム、または同様の電子コンピューティング装置の動作および/またはプロセスを指すことが理解される。開示されたモジュールまたはユニットのいずれも、コンピュータプロセッサによって少なくとも部分的に実装することができる。
一般に、前方監視電気光学撮像と、新規なシステムアーキテクチャと、新規なシーン解析および画像処理に基づいて、レールおよび障害物を検出するためのシステムおよび方法が開示される。この処理解決策は、前方撮像で列車の鉄道経路を決定し得るレール・スイッチ状態検出ニューラルネットワークと、決定した鉄道経路の近傍を分析し、差し迫った障害物を検出し得る物体・障害物検出・追跡ニューラルネットワーク(OODT NN)とに基づく深層学習意味的シーンセグメント化アプローチを利用し得る。様々な実施形態では、RSSD NNおよび/またはOODT NNからの出力に基づいて、アラームを生成することができる。
様々な実施形態では、RSSD NNおよび/またはOODT NNは、検出されたおよび/または分類された物体に近づくことができ、これによって、RSSD NNおよび/またはOODT NNの微調整を提供する様々な短期および長期機械学習のプロセスが可能になる。例えば、短期機械学習の適応として、スタンドオフ範囲で物体が分類されると、列車の減速を要求することもあるが、列車がそのような物体に近づいて、同じ物体が再分類されると、その直後にそのような決定が取り消されることも、あるいは変更されることもある。別の例では、長期機械学習プロセスは、そのような誤った決定を精査して、調整し得るように、処理アルゴリズムを更新し得る。
様々な実施形態では、システムおよび方法は、列車の運転士に対する人間参加型決定支援、および/または無人運転列車操作の完全自動化決定を提供するためのシーン理解能力を提供する状況認識機能において、撮像センサの全てと、オプションで非撮像センサの全てを統合することを可能にできる。また、開示されるシステムおよび方法によって、列車運転士の能力を向上させて、鉄道シーンにおける遠隔物体および潜在的な障害物を視覚的に知覚すること、および/または多様な操作条件を検出し、分類し、かつ対応する知覚処理を加速することができる。したがって、開示されるシステムおよび方法は、列車運転士の作業負荷を大幅に低減することができる。
いくつかの実施形態では、開示されるシステムは、一般に、1つまたは複数の撮像センサ(例えば、視覚帯域または熱赤外線センサ)を含む撮像構成を含むことができる。システムは、撮像センサによって取得された画像を処理するための1つまたは複数の画像処理ユニットを含むことができる。そのような処理ユニットには、コンピュータ、コントローラ、DSP、GPU、および処理ユニットによって実行するために設計されたソフトウェアモジュール、または専用ハードウェアモジュール(例えば、IC、ASIC、FPGA)を含むことができる。いくつかの実施形態では、システムには、ユーザインタフェースおよび表示モニタ(例えば、タッチスクリーンインタフェース付き、または無し)を含む制御および表示ユニットを含むことができる。
異なる関心物体は、移動する列車に対して様々な課題および決定を提起する可能性がある。例えば、静止および移動している人間、動物、および車両は、移動する列車で、異なる決定および対応を必要とすることがある。泥、水、水溜り、雪、葉および枝葉などの自然の影響も、気象条件および大気条件も、あらゆる感知および分析処理と、それぞれの意思決定プロセスに課題を提起し得る。レールの誤作動には、例えば、レールが接続しなくなることも、レールセグメントが欠落することも含む。曲線レールによるレールの閉塞などの沿線の影響も、レールの近傍の背景シーン(橋梁、マストなど)も、誤まった検出および分類を生成することがある。したがって、本発明のいくつかの実施形態は、異なる関心物体ための異なる処理スキームを(例えば、個別に、または並列に)利用できるように、そのような物体特性の多様性を考慮する。例えば、検出された物体が予め規定された寸法よりも大きい寸法を有する場合、システム/方法は「レールの終端(EOR)」のアラームを提供することができる。これは、また、右/左方向に向かう途中でスタックして誤動作しているスイッチがある場合にも、関連することがある。別の例では、レール軌道の端部に近づくとき、車止めの有無にかかわらず、システム/方法は、緊急制動をトリガし得るEORアラートを提供することができる。
いくつかの実施形態では、開示されるシステムおよび方法によって、そのパラメータ(例えば、検出確率(PD)、分類確率(PC)、誤検出率(FDR)、誤分類率(FCR)、および応答時間(RT)など)を調整することが可能になり、こうして、性能要件に準拠しながら、様々な関心物体および鉄道条件に対処することに関して、柔軟に検出して、分類することができる。
ここで、図1Aを参照すると、この図は、本発明のある実施形態に従って、列車90に取り付けられたレールおよび障害物を検出する(ROD)ためのシステム100の概略図である。
図1Bも参照すると、本発明のいくつかの実施形態に従って、レール・障害物検出用システム100の撮像センサ110によって取得された画像フレーム110aと、レール・スイッチ状態検出(RSSD)モジュール120によって生成されたセグメント化マスク予測120aの一例である。
いくつかの実施形態によれば、システム100は、少なくとも1つの撮像センサ110と、レール・スイッチ状態検出(RSSD)モジュール120と、物体・障害物検出・追跡(OODT)モジュール130を含むことができる。
いくつかの実施形態によれば、撮像センサ110は、撮像センサ110が列車90の進行方向を向くことができるように、列車90の機関車92に取り付けることができる。撮像センサ110は、図1に概略的に示すように、前方監視性能をより良くするために、例えば、高所に取り付けられてもよい。
撮像センサ110は、移動する列車90の前方にある鉄道シーンの複数の画像フレームを取得することができる。これにより、画像フレームセンサ110は、列車90の運転士および/または監督者などの第三者または制御室に、鉄道シーンの視覚化を提供することができる。撮像センサ110は、昼夜とも、全ての気象条件下でも、また極端な環境条件下でも動作するように選択することができる。
様々な実施形態では、撮像センサ110は、広視野センサ(WFS)および/または狭視野センサ(NFS)であってもよい。いくつかの実施形態では、撮像センサ110は、可視帯域センサ(例えば、以下、本明細書では、互換的に「VISセンサ」と呼ぶ)とすることができる。例えば、撮像センサ110は、CCD、CMOS、および/または超低光CMOS、VIS、NIR、SWIR、MWIR、LWIR、または極めて低い読み出しノイズおよび極めて高いダイナミックレンジを有する任意の他の撮像スペクトル装置などの昼光ビデオカメラとすることができる。いくつかの実施形態では、撮像センサ110は、熱赤外線センサ(例えば、以下で、互換的に「TIRセンサ」と呼ぶ)とすることができる。例えば、撮像センサ110は、長波赤外線カメラなどのような冷却サーマルカメラであっても、あるいは非冷却サーマルカメラであってもよい。
いくつかの実施形態によれば、RSSDモジュール120は、撮像センサ110から画像フレームを受信することができる。レール、安全ゾーン、スイッチ、スイッチの状態、および列車90が移動する、または移動しようとしている現鉄道経路のうちの少なくとも1つを決定し、画像フレームの対応するセグメント化マスク予測を生成するように構成され得る。動的セグメント化は、例えば、ニューラルネットワーク(例えば、畳み込みニューラルネットワーク)を使用するような深層学習の手段および方法を利用することによって実行されてもよい。例えば、RSSDモジュール120は、画像フレームの動的セグメント化を実行するように構成されたRSSDニューラルネットワーク(RSSD NN)122を含むことができる。
例えば、図1Bは、システム100の撮像センサ110によって取得された画像フレーム110aと、システム100のRSSDモジュール120によって生成されたそのセグメント化マスク予測120aの一例を示す。セグメント化マスク予測120aは、例えば、RSSDモジュール120によって検出/決定されたレール120bの周囲のレール120bおよび安全ゾーン120cを示す。
いくつかの実施形態によれば、OODTモジュール130は、撮像センサ110から画像フレームを受信することができる。OODTモジュール130は、画像フレームの動的セグメント化を実行し、それによって、レール上またはレール近傍の物体および/または障害物を決定し、および/または検出された物体および/または障害物の移動方向を追跡するように構成されてもよい。セグメント化は、例えば、ニューラルネットワーク(例えば、畳み込みニューラルネットワーク)のような深層学習方法を利用することによって実行されてもよい。例えば、OODTモジュール130は、画像フレームの動的セグメント化を実行するように構成されたOODTニューラルネットワーク(OODT NN)132を含むことができる。物体および/または障害物は、例えば、車両、機関車、列車、貨車、人間、動物などを含むことができる。
種々の静止および移動している物体が、移動または静止している列車90上に設置された前方監視撮像センサ110の撮像に現れることがある。そのような物体は、列車の軌道上またはその軌道近傍に位置するとき、潜在的な障害物となり得る。したがって、列車の軌道の画像フレーム領域を正確かつロバストに指定し、セグメント化する機能は、このような衝突を回避する性能を高くするために、非常に重要である。
鉄道軌道は、通常、複数の轍叉およびスイッチ(例えば、左分岐、右分岐、三枝分岐、シングルスリップおよびダブルスリップ)を有する軌道の複雑なネットワークから構成されている。轍叉は固定され、変動しないが、スイッチは、個別のスイッチ状態に依存して列車の経路を変更させる手段である。機能しているスイッチは、(スイッチが状態間で遷移している短い期間を除いて)一定の時間に1つの離散状態にあるだけでよい。したがって、所与の軌道に沿って移動する列車の鉄道経路を決定する際に、列車が配置されている軌道を前方視野撮像フレーム内で検出することも、差し迫ったスイッチの位置およびそのそれぞれのスイッチ状態を決定し、それによって、潜在的な軌道変更に対する空間およびタイムライン内の位置を予測することが必要である。
前方監視撮像では、所与の経路へのいくつかのそれぞれ差し迫ったスイッチがあり得、現プリセット経路をリアルタイムで決定する能力は、決定された経路上またはその近傍の検出された物体との衝突する可能性または切迫状況を前方予測する際に重要である。予測された経路に沿ったスイッチの状態は、(例えば、制御センタから)予測された経路を決定する間に、電気的に、遠隔で(例えば、RSSDモジュール120によって)または手動で変更されてもよい。スイッチおよびそれらのそれぞれの状態を十分に長い距離で光学的に検出する能力は、撮像センサ110の分解能、レールコントラスト、スイッチの近傍における散乱破片または他の妨害効果(例えば、葉、砂、雪)、視線の制限などのために制限されることがある。したがって、RSSDモジュール120は、現在の軌道をマッピングし、その軌道に沿ったスイッチを検出し、そのような検出されたスイッチについて、それぞれのスイッチ状態を決定することが必要とされ得る。ある時点で、より近いスイッチが検出されることがあるが、それらの検出されたスイッチのいくつかについては、列車が近づくまで、それらのそれぞれのスイッチ状態が決定されないことがある。したがって、動的に変化するマッピングRSSDモジュール120が必要とされ、これは、列車が前記経路を下って前記スイッチに近づくにつれて、経時的にそのような変化するマッピングを反映する。
したがって、軌道シーンのラベル付き動的マッピング/セグメント化は、以下のように、バックグラウンドとして分類される画素領域(例えば、「0」とラベル付け)、現在の軌道として分類される画素領域(例えば、「1」とラベル付け)、スイッチ(例えば、「2」としてラベル付けされる)として分類される画素領域、そのスイッチ状態がまだ決定されていないため、スイッチを越える有効軌道としてまだ決定されていない軌道分岐として分類される画素領域(例えば、「3」とラベル付け)、およびスイッチ状態の成功の決定に基づいて、有効軌道として定義される所与のスイッチを越える軌道分岐として分類される画素領域(例えば、「4」とラベル付け)を表現するために必要とされる。
シーンの複雑さおよびシステムの操作論理に基づいて、様々なラベル構成を定義することができる。例えば、3ラベル構成は、背景、有効軌道、および有効軌道として決定されない(またはまだ決定されていない)分岐軌道を用いて定義され得る。そのような動的マッピング/セグメント化は、その後、障害物および差し迫った衝突を決定する際に、物体検出に関連付けられることがある。
いくつかの実施形態によれば、VIS撮像センサ、TIR撮像センサ、またはVIS撮像センサとTIR撮像センサの両方、あるいはセンサ(例えば、撮像センサ110)の任意の他の組合せのうちの少なくとも1つを使用して取得された鉄道シーンの前方監視画像フレームの動的マッピング/セグメント化は、その画像フレームに深層学習ニューラルネットワークを適用することによって(例えば、RSSD NN122によって)達成され得る。ニューラルネットワークの適用は、ニューラルネットワークのオフライン訓練フェーズと、それに続くニューラルネットワークのオンライン前方推論とを含むことができる。
いくつかの実施形態では、RSSD NN122への新規な入力データ構造が提供されてもよく、この入力は、一意のフィードバックセグメント化マスクを含んでもよい。RSSD NN122に入力される新規なデータ構造は、撮像センサ110によって取得された鉄道シーンの現在の画像フレーム(例えば、カラー鉄道シーンのグレースケール)と、履歴要素とを含む2層画像フレーム表現を含んでもよい。履歴要素は、例えば、現在の画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測であってもよい。
このプロセスは、ビデオセグメント化のためのニューラルネットワーク解決策の一般的な方針に従うことができ、ここでは、連続するビデオ画像フレームのシーケンスがニューラルネットワークへの入力であるが、現在の方法は、以前に処理された履歴要素を入力データ構造に組み込むという違いがある。現在の画像フレーム時間とともに入力データ構造の一部として履歴要素を使用することは、本発明のいくつかの実施形態による新規な要素であり、この解決策は、元の画像フレームに加えて1つの追加のデータ層のみを使用する。入力データ構造の履歴要素は、過去の画像フレームの情報を単一の表現でカプセル化する。これは、短期間のモーション計算を使用したり、ニューラルネットワークアプローチによって提供されるような実際の以前の画像フレームをいくつか保持したりする現在のオプティカルフローアプローチとは対照的である。
履歴要素を使用する別の利点は、列車速度と比較してフレームレートが比較的高いことであり、その結果、現在の画像フレームとマスク履歴との間に高い相関が生じ、したがって、容易に、現在のフレームのセグメント化性能を著しく改善することができる。
履歴要素を使用する別の利点は、履歴要素がスイッチ状態の情報をネットワークに供給することができることである。これは、機関車(または列車)がスイッチ内またはその近傍にある間に、新しい画像フレームを取得する場合に特に重要である。過去のスイッチ状態のメモリがないシステムでは、正しい列車の経路をそれぞれのスイッチ分岐から区別することができない。
RSSDモジュール120が、(例えば、RSSD NN機能122が決定したセグメント化画像フレームに基づいて決定された)更新されたリアルタイムの列車経路を供給すると、衝突および事故を回避するために、潜在的障害物検出処理の追加手段が、OODTモジュール130によって適用され得る。いくつかの実施形態では、OODT NN機能132は、画像フレーム内の物体を検出するために適用され得、これらの物体の検出は、これらの物体を潜在的な障害物として決定し、それぞれのアラートを提供する際に、セグメント化された経路ファインダ出力に空間的に関連付けられ得る。別の好ましい実施形態は、OODT NN機能132が、非最大サスペンション(NMS)および追跡のための追加の後処理で増強されることである。
いくつかの実施形態では、鉄道シーンの前方監視画像フレームの動的マッピング/セグメント化は、前処理画像フレーム融合マッピングを介して、例えば、VIS撮像センサおよびTIR撮像センサ、または任意の他のセンサ(例えば、LIDAR)によって取得された画像フレームを多重スペクトルで組み合わせて、履歴マスク増強の前に2層画像フレームを生成することを含んでもよい。
いくつかの実施形態では、画像フレームの動的マッピング/セグメント化は、前処理画像フレーム融合マッピングを介して、VIS撮像センサおよびTIR撮像センサによって取得された画像フレームを多重スペクトルで組み合わせて、OODT NN機能132に入力される2層画像フレームを生成し、続いて、物体を追跡すること含み得る。
いくつかの実施形態では、単一のニューラルネットワーク機能は、セグメント化機能および検出機能のそれぞれについて異なる重み付け関数を決定および定義しながら、同じ特徴的な深層を共有することによって、RSSD NN122とOODT NN132とを組み合わせることができる。
いくつかの実施形態では、画像フレームの動的マッピング/セグメント化は、VIS撮像センサおよびTIR撮像センサのそれぞれに対して異なる機能フローチャート構成を提供することができる。
ここで、図2を参照すると、この図は、本発明のいくつかの実施形態に従って、レールおよび障害物を検出する(ROD)ためのシステム200の概略ブロック図である。
いくつかの実施形態によれば、システム200は、例えば、移動または静止している列車が、レールおよび障害物を検出するために使用することができる。例えば、システム200は、図1Aに関して上述したシステム100と同様であってもよい。
いくつかの実施形態では、システム200は、少なくとも1つの撮像センサ202を含むことができる。撮像センサ202は、図1Aに関して上述した撮像センサ110と同様であってもよい。撮像センサ202は、例えば、高解像度または低解像度の高感度CMOS VIS帯域センサ、大フォーマットTIR帯域センサ(WFOV、NFOV)、WFOV VIS結合センサ(例えば、スイッチヤード用途の場合)、TIR帯域または光ゲートカテナリーセンサなどを含んでもよい。
いくつかの実施形態では、システム200は、1つまたは複数の追加のセンサ204を含むことができる。追加のセンサ204は、例えば、GPS、INS、加速度計などの動的センサ、および/または温度センサ、湿度センサ、および圧力センサなどの環境センサを含むことができる。
いくつかの実施形態では、システム200は、撮像制御処理モジュール206を含むことができる。撮像制御処理モジュール206は、例えば、撮像センサ202を自動的に制御し、撮像センサ202のダイナミックレンジを分析して、制御し、撮像センサ202のノイズを分析して、低減し、撮像センサ202の視線を分析して、安定化し、画像フレーム焦点撮像センサ202、超分解能(例えば、改善された分解能を達成するための機械的機構)などを分析して、補正するように構成されてもよい。
いくつかの実施形態では、システム200は、センサ処理モジュール208を含んでもよい。センサ処理モジュール208は、例えば、追加のセンサ204の較正および/または読み取り誤差を訂正するように構成することができる。
いくつかの実施形態では、システム200は、レール・スイッチ状態検出(RSSD)モジュール210を含むことができる。RSSDモジュール210は、図1Aに関して上述したRSSDモジュール120と同様であってもよい。RSSDモジュール210は、撮像センサ202から画像フレームを受信し、画像フレームのセグメント化を実行し、それによって、画像フレーム内のレール、安全ゾーン、スイッチ、およびスイッチ状態のうちの少なくとも1つを決定し、および/または列車90が載っている鉄道経路または載るべき鉄道経路を、そのセグメント化に基づいて決定することができる。
いくつかの実施形態では、システム200は、物体・障害物検出・追跡(OODT)モジュール212を含むことができる。OODTモジュール212は、図1Aに関して上述したOODTモジュール130と同様であってもよい。OODTモジュール212は、撮像センサ202から画像フレームを受信し、画像フレームのセグメント化を実行し、それによって、レール上またはレール近傍の物体および/または障害物を決定すること、および/またはその物体および/または障害物を追跡することができる。
いくつかの実施形態では、システム200は、ビルトインテスト(BIT)モジュール214を含むことができる。BITモジュール214は、システム200のモジュールの少なくとも一部の性能(撮像および感知、照明および熱条件、大気および視線のダイナミクスおよび妨害を含む)を検証するように構成することができる。BITモジュール214は、例えば、撮像センサ202によってフレーム化された画像としての鉄道シーンに依存することができ、これは、ビルトインテストのためにVISとTIRとのスペクトル帯域の両方で基準を提供する細長い基準構造(例えば、レール)を含むことができる。BITモジュール214は、また、例えば、レールベースの大気分析、放射輝度(例えば、範囲の関数として)、視界(例えば、範囲の関数として)、透過率(例えば、範囲の関数として)、霧(例えば、範囲の関数として)、ヘイズ(例えば、範囲の関数として)、雨/雪(例えば、範囲の関数として)、乱流(例えば、範囲の関数として)、散乱(例えば、範囲の関数として)、振動ぼけ(例えば、範囲の関数として)、動作ぼけ(例えば、範囲および/または角度の関数として)、被写界深度(例えば、範囲の関数として)に依存してもよい。
いくつかの実施形態では、システム200は、運転士支援モジュール216を含むことができる。運転士支援モジュール216は、信号の検出および/または追跡、標識の識別/追跡、信号/標識の安全ゾーンとの関連付け、GISの利用および更新、障害の解析、機関車のブレーキ戦略の定義、機関車の安全速度解析(例えば、現在および今後の鉄道曲率半径などのGISリアルタイム情報および安全な速度制御に影響を及ぼす他の鉄道情報)を実行するように構成され得る。
いくつかの実施形態では、システム200は、表示処理モジュール218を含むことができる。表示処理モジュール218は、異なる撮像センサ202(例えば、WFS、NFS、VISおよび/またはTIRセンサ)からの画像フレームを融合し、画像フレームの輝度および/またはコントラストなどを自動的に調整するように構成されてもよい。
いくつかの実施形態では、システム200は、アプリケーションに対するアラート、ステータス、および制御を扱うように適合されたモジュール220を含むことができる。
いくつかの実施形態では、システム200は、GIS処理モジュール222を含むことができる。GIS処理モジュール222は、システムが様々な状況に、より良く応答することを支援する地理的情報を用いて認知処理を実行するように構成されてもよい。そのような地理的情報は、地理的位置モジュール(GLM)(例えば、GPS<INS、事前に知られたデータベースなどを含む)、より正確な位置決めのためのランドマークおよびデータベースおよび/またはデジタル地図の作成および/または更新を使用する画像フレームベースナビゲーション(IBN)、地理的情報モジュール(GIM)および3Dモジュール(3DM)から導出され、および/またはそれらと比較され、および/またはそれらから更新されてもよく、それらの全ては、レール検出および物体検出ソリューションのための重要なリアルタイムデータを提供する。GLMは、例えば、リアルタイムの位置情報および/または導出された速度情報を提供することができ、これらの情報は、様々な列車安全基準を監視するために使用することができる。GIM情報とともにGLMは、例えば、鉄道レイアウトおよび3D地形データ、沿線インフラ機器(信号柱、電気機器、レール分岐、スイッチ)、轍叉などに関するリアルタイムの3D地理的情報を提供することができる。これらは、3D情報のカメラ視点を生成するために3DMに供給することができ、さらに、画像フレームベースのレールマップ(IBRM)と組み合わせることができるジオベースのレールマップ(GBRM)での利用のために利用することができる。これによって、様々な典型的な列車運行状況に対してロバストな解決策を提供することができ、システム200の性能の改善を達成できる。
いくつかの実施形態では、システム200は、インフラ処理モジュール224を含むことができる。
いくつかの実施形態では、システム200は、表示・ユーザインタフェースモジュール226を含むことができる。表示・ユーザインタフェースモジュール226は、例えば、列車の運転士への情報を表示するための1つまたは複数のディスプレイ、および/または、運転士によるシステムへの入力を受信するための1つまたは複数のユーザインタフェース(例えば、キーボード、タッチスクリーンなど)を含むことができる。
いくつかの実施形態では、システム200は、制御・認識モジュール228を含むことができる。制御・認識モジュール228は、決定支援、アラート管理、およびBIT支援を提供するように構成され得、その結果、システム200は、撮像センサによってフレーム化された鉄道シーン画像と、信号、標識などの追加情報とに基づいて、操作状況を継続的に監視することが可能である。
ここで、図3Aを参照すると、この図は、本発明のいくつかの実施形態に従って、長距離レールおよび物体/障害物を検出するために、列車90に取り付けられた狭視野撮像センサ(NFS)の狭視野301の概略図である。
図3Bも参照すると、この図は、本発明のいくつかの実施形態に従って、短距離レールおよび物体/障害物を検出するために、列車90に取り付けられた広視野撮像センサ(WFS)の広視野306の概略図である。
図1Aに関して上述したシステム100のように、レールおよび障害物を検出する(ROD)ためのシステムは、十分に長い距離があるときに障害物を検出し、アラームすることが必要とすることがあり、それによって、高速で移動する列車を停止させること、または少なくとも減速させることが可能になる。こうして、追加の応答手段は、障害物を回避すること、または少なくとも損傷を最小限に抑えることが可能になり、それに応じて(運転士操作列車の)運転士が応答することが可能になる。撮像センサの用途では、これは、通常、例えば、狭視野撮像センサ(NFS)によって提供される高解像度の光学系を必要とする。NFSは、物体および障害物を検出して、分類するために十分な解像度を提供する一方で、列車の正面軸で固定されている場合、レールが湾曲している状況において制限が課されることもある。拡張された範囲にあるレールの区間は、NFSの狭視野から外れることもある。さらに、鉄道は、多くの場合、隣接して交差する多数のレールを備えているので、その結果、NFSが移動する列車のそれぞれのレールに関して混同する可能性があり、それによって、そのレールに関連する特定の障害物(例えば、差し迫った衝突を引き起こさない隣接するレールに接近する列車)を指定するその能力を制限する。そのような状況において、広視野撮像センサ(WFS)などの追加の撮像センサは、NFSとWFSとの間で十分な範囲が重なっていると、十分に支援し得る。WFSは、それぞれのレールおよびレールマップをより短い距離でも検出し易くなり、それによって、WFS画像フレーム内のある距離まで、そのようなレールをトレースすることが可能になる。こうして、物体/障害物を正しく検出し、指定できるように、列車のそれぞれのレールについて、どこにどれがあるかを指定するNFS画像フレームへの円滑なハンドオーバが容易になる。
図3Aのイラスト301は、長距離レールおよび物体/障害物を検出するために、列車90に取り付けられた狭視野撮像センサ(NFS)の狭視野302を示す。イラスト303およびイラスト304は、2つの例示的なNFS撮像状況を示し、どのレールをそれぞれ関連付けるべきかに関する曖昧さを示している。曖昧さが典型的に生じるのは、NFSが拡張されたフレーム範囲を撮像するために、その視線(LOS)を十分に上げなければならないので、その結果、デッドゾーン305(例えば、約100〜200mの範囲になり得る)が拡張されるからである。このようなデッドゾーン内で、レールの湾曲および分岐が生じることがあり、正しいレールの選択が曖昧になる可能性がある。
このような曖昧さと拡張されたデッドゾーンは、列車90に広視野撮像センサ(WFS)を取り付けることによって解決することができる。例えば、図3Bのイラスト306は、NFSセンサのデッドゾーン305よりも実質的に小さい(例えば、約数メートル小さい)デッドゾーン309を有するWFSの広視野307を示す。イラスト308は、WFS画像フレームを示す。この画像フレームを解析することで、このように大きくなっていく湾曲および分岐を検出することができ、それによって、WFS内のレールを正確にトレーシングすることが可能になり、それらをNFS内で検出されたレールに関連付ける。
ここで、図3Cを参照すると、本発明のいくつかの実施形態に従って、列車90に取り付けられた狭視野撮像センサ(NFS)と広視野センサ(WFS)とを組み合わせた狭視野と広視野の上面図310の例を示している。
図3Cおよび図3Dにおけるイラスト310およびイラスト312は、それぞれ、狭視野撮像センサ(NFS)および広視野撮像センサ(WFS)の狭視野302および広視野307を組み合わせたカバレージを示し、これによって、レール曲率半径(RROC)が変化したときのレールカバレージを改善し易くなる。この特定の例は、限定するものではなく、様々なシステムの実装は、範囲、円弧角、および視野(FOV)について異なる値を組み込むことができる。この実証的な例では、WFSのFOV(WFOV)は2βで与えられ、NFSのFOV(NFOV)は2αで与えられる。垂直軸から始まり、それぞれのRROCでWFOVおよびNFOV角度境界と交差する角度の円弧θは、それぞれθW=2βおよびθN=2αによって与えられる。円弧が交差する点は、距離Mと横軸からのオフセットOを表し、MW=RROCSin2βおよびOW=RROC(1−Cos2β)で、MN=RROCSin2αおよびON=RROC(1−Cos2α)である。WFSカバレージ(WFSC)はWFSC=2RSinβで与えられ、NFSカバレージ(NFSC)はNFSC=2RSinαで与えられる。
例示的なパラメータの設定は、特定の動作点について定義することができる。例えば、LWIRのNFS画素サイズが17μmおよび/または14μm、12μm以下の場合、NFS焦点距離が190mmであると、1000mで瞬間視野(IFOV)が0.09mrになり得る。この結果、画素フットプリントは約9cmで、すなわち、人間の頭部直径あたり約2画素となる。結果として得られたNFOV=3.3°であり、1000mでのNFSCでのカバレージは、58mである。
別の例では、LWIRのWFS画素サイズが17μmおよび/または14μm、12μm以下の場合、WFSの焦点距離が19mmであると、500mで瞬間視野(IFOV)が0.9mrとなる。この結果、画素フットプリントは約45cm、すなわち、このような500mの距離では約3画素レールゲージとなる。結果として得られたWFOV=33°であり、500mでのWFSCでのカバレージは、592mである。
上述したように、選択された垂直方向仰角では、NFSの最大画像フレーム化範囲が1000mとなり、WFSの最大画像フレーム化範囲が800mとなり得、結果として得られるNFSのデッドゾーンは約157mになり得、その範囲で、NFSCは約9mであり、WFSのデッドゾーンは約9mであり、その範囲でWFSCは約5mである。このような仰角では、NFSとWFSとの間で、かなりの範囲が重なり合うことに留意されたい。
RROCは、以下の表1に示すように、許容可能な列車速度に密接に関連している可能性がある。
表1:RROC対許容可能な列車速度
Figure 2021530388
距離Mと横軸からのオフセットOを表す円弧が交差する点は、以下の表2に示されるように、RROCに関連してもよい。
表2:WFSおよびNFSセンサの距離M値とオフセットO値対RROC
Figure 2021530388
上記の説明から、長距離で十分な解像度を可能にするLWIRのNFSの場合、結果として得られるNFOVは非常に小さいので、レール湾曲部の面では不十分であることに留意されたい。例えば、200〜250km/hで走行する列車の場合、最小RROCで約2000mが許容され、上述のNFSの場合、これは、角度カバレージから離れる前に、約116mという比較的短い距離になる。この制限を克服するためのいくつかの実施形態には、NFSパンニング作用を可能にすることを含むことができる。WFSは、それぞれのレールの一般的な角度位置を決定することができ、NFSは、例えば、外部パンニングミラーまたはNFS全体の機械的回転を介して、そこに角度的に向けることができる。
高速列車に必要な検出範囲は、指定された停止距離に応じて、広がるので、WFS画像フレーマとNFS画像フレーマとを組み合わせて使用することが一般的に求められる。列車が減速するにつれて、例えば、市内路面電車および低速の都市列車の場合、検出範囲および停止距離が著しく小さくなるので、WFSで十分なことがある。したがって、WFS画像フレーマとNFS画像フレーマとを組み合わせて使用することは、本発明の様々な実施形態において、モジュール式とすることができる。WFS撮像センサ構成およびNFS撮像センサ構成は、汎用RODSを設計することができるようにアドオンとして設計することができ、それによって、モジュール式拡張が可能になり、こうして、様々な列車が低速および高速で移動するのをサポートする。
図3Dを参照すると、2つのそれぞれの広視野シーンおよび狭視野シーンを示すことで、本発明のいくつかの実施形態に従って、物体/障害物検出および衝突回避を改善するために、WFSの短距離カバレージをNFSの長距離カバレージと組み合わせることの有用性を示している。
画像フレーム312は、WFSの湾曲しているレールの例を示し、フレーム314は、破線の長方形によって輪郭が描かれたNFSのシーンである。画像フレーム構造が複数のレールに隣接し、それらの間にあるので、NFSのみを使用する場合、正しいレールを選択することは非常に困難である。さらに、NFSでは、接近(または静止)している列車が観察されるが、その列車が隣接するレールを使用するが、安全である場合なのか、あるいは、その同じレールを使用することで、差し迫った衝突になる場合なのかは不明である。フレーム316は、直線レールを備えた別のWFSシーンであるが、フレーム318に描かれるように、レール領域が乱雑で、列車のための正しいレールを決定することが困難である。
ここで、図4Aを参照すると、種々のレール分岐、スリップおよび轍叉の例が示されている。イラスト401、402、403、404、405、および406は、そのような事態の画像の複雑さを示しているが、衝突回避用前方監視車載システム(図1Aに関して上述したシステム100、または図2に関して上述したシステム200など)は、列車がそのような分岐、スリップ、および轍叉を越えて移動するそれぞれのレール(経路)を自動的に決定することができなければならない。いくつかの実施形態によれば、本明細書で開示されるシステムおよび方法は、そのようなインスタンスを自動的に決定することができる。
ここで、図4Bを参照すると、前方監視車載撮像センサ(例えば、図1Aに関して上述した撮像センサ110)によってフレーム化された画像として、レールスイッチ分岐410の一例と、そのスイッチを超える列車のオプションの経路を決定する軌道420(太い破線)の概略部分を示している。矢印420aはスイッチの開いている側を指し、矢印420bはスイッチの閉じている側を指している。これにより、スイッチ状態が決定され、このスイッチから列車を正しい軌道に導く。このようなスイッチ状態の判定は、本発明のいくつかの実施形態による重要な要素である。いくつかの実施形態によれば、本明細書に開示されるシステムおよび方法は、経時的に状態が変化し得るスイッチの存在下で、正しい列車経路を決定することが、列車がスイッチに近づいたときでさえ、可能である。
ここで、図5A、図5B、図5C、および図5Dを参照すると、これらの図は、本発明のいくつかの実施形態に従って、列車の現鉄道経路を識別するために、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)500を訓練し、推論するための様々なアプローチの概略図である。
RSSD NN500は、図5A、図5B、図5C、および図5Dに関して以下に説明するように、図1Aに関して上述したように、システム100のRSSDモジュール120のRSSD NN124と同様であってもよい。入力画像フレーム502、512、522および532は、例えば、図1Aに関して上述したように、システム100の撮像センサ110によって取得することができる。
図5Aは、本発明のいくつかの実施形態に従って、入力画像フレーム502の単純なアプローチ(またはプロセス)501と、列車の現鉄道経路504aを示すそのセグメント化マスク予測504を示す。RSSD NN500の訓練フェーズ中に、セグメント化マスク予測504は、例えば、人間制御のセグメント化/注釈プロセスによってオフラインで決定されてもよい。したがって、ニューラルネットワークRSSD NN500は、その推論ステージ中に、入力画像フレーム502に基づいて、列車の現鉄道経路504aを識別するセグメント化マスク予測504を生成するように訓練されてもよい。
RSSD NN500を訓練し、推論するためのアプローチ501の1つの欠点は、各画像フレームが別々にかつ独立してセグメント化されるので、画像フレームシーケンスのアクセスおよび処理のコンテキストが活用されないことであり得る。別の欠点は、列車がスイッチを通過し、2つのレール(経路および分岐部)が画像フレームの最下部(例えば、最小画像フレーム距離)に現れるとき、分岐部から経路を区別するための解決できない曖昧さがあることである。別の欠点は、スイッチ位置が何らかの方法で検出またはマークされないことである。
図5Bは、履歴要素がRSSD NN500に組み込まれている簡略化アプローチ(またはプロセス)510を示す。アプローチ510は、所望の経路にあるレールのために、入力画像フレーム512の最下部(および/または最上部)にグラフィックマーク514(例えば、履歴要素)を、イラスト512’にマークされた入力画像フレーム512の最下部/最上部の行のそれぞれの位置で追加するステップを含むことができる。
アプローチ510の利点は、正しい経路をセグメント化するために、スイッチを横切るときに追加情報を提供することであり得る。アプローチ510の一つの欠点は、グラフィックマークによって入力画像フレーム512のサイズが拡大すること、あるいはニューラルネットワークへの入力において入力画像フレーム512のサイズ変更を強制することであり、その結果、例えば、補間をするために、いくつかの画像フレーム情報を失うことであり得る。アプローチ510の別の欠点は、使用される唯一の情報が画像フレームの最下部/最上部の行であることであり得る。それによって、フレームからフレームへと発展する履歴のコンテキストにおいて、他の全ての画像フレーム情報が無視され、さらに、スイッチ位置も、いかなる方法でも検出されることも、あるいはマークされることもない。
図5Cは、履歴要素がRSSD NN500に組み込まれている改善アプローチ(またはプロセス)520を示す。アプローチ520は、現在の入力画像フレーム524と、現在の画像フレーム524(例えば、履歴要素)に先行する画像フレームのセグメント化マスク予測526とを含む入力データ構造522を生成するステップと、RSSD NN500への入力として入力データ構造522を提供するステップとを含み得る。
アプローチ520の一つの利点は、スイッチ交差の問題が解決されることであり得る。別の利点は、履歴セグメント化マスク層が画像フレームシーケンスコンテキストを利用することを含み得る。その理由は、以前に処理された順序付けられた画像フレームから漸進的に導出される最新および/または予測された以前のセグメント化結果を含むとともに、画像フレーム化されたシーンの検出された経路全体を利用するからである。別の利点は、元の画像フレームサイズ(例えば、高さおよび幅)が維持されることであり得る。アプローチ520の別の利点は、RSSD NN500のランタイムにほとんど影響を及ぼし得ないこと(例えば、入力データ構造当たり20msのランタイムに、約0.5ms以下が追加されるだけ)を含み得る。
図5Dは、履歴要素がRSSD NN500に組み込まれているさらなる改善アプローチ530を示す。アプローチ530は、現在の入力画像フレーム534と、現在の画像フレーム532に先行する画像フレームのセグメント化マスク予測536(例えば、履歴要素)とを含む入力データ構造532を生成するステップと、入力データ構造532をRSSD NN500への入力として提供するステップを含み得る。先行する画像フレームのセグメント化マスク予測536(例えば、履歴要素)は、列車の現鉄道経路536aと、その経路に沿って現れるスイッチからの追加の分岐部536bとを含み得る。
アプローチ530(例えば、ニューラルネットワーク500にサボテンマスク履歴を組み込むことの一つの利点は、スイッチ交差の問題が解決されることである。別の利点は、履歴セグメント化マスク層が画像フレームシーケンスコンテキストを利用することであり得る。その理由は、以前に処理された順序付けられた画像フレームから漸進的に導出される最新の以前のセグメント化結果を含むとともに、画像フレーム化されたシーンの検出された経路全体を利用するからである。別の利点は、元の画像フレームサイズ(高さおよび幅)が維持されることであり得る。別の利点は、スイッチ検出が、選択された経路の異なるラベルと観察された分岐部に隣接する経路に沿って画素を位置させることによって達成されることであり得る。アプローチ530は、列車の主要な駆動機能に基本であるスイッチ位置と、そのそれぞれのスイッチ状態との組み合わせた情報を提供し得る。アプローチ530の別の利点は、RSSD NN500のランタイムにほとんど影響を及ぼし得ないこと(例えば、入力データ構造当たり20msのランタイムに、約0.5ms以下が追加されるだけ)を含み得る。
基本的な鉄道スイッチは、ポイント(スイッチレールまたはポイントブレード)として知られる一対のリンクされたテーパレールからなり、例えば、図4Bに示すように、分岐する外側レール(ストックレール)の間に横たわる。これらのポイントを2つの位置のいずれかに横方向に移動して、ポイントブレードから来る列車を直線経路または分岐経路に向けることができる。狭い端部からポイントブレードに向かって移動する列車(例えば、ポイントの位置に応じて2つの経路のうちのいずれかに向けられる)は、ポイント向き移動を実行していると言われる。列車運転士は、運転中に前方を見て、来るべきスイッチの位置を視覚的に検出し、列車が最終的にスイッチに近づくにつれて、スイッチのポイントブレードの相対的な位置によって、スイッチの状態を視覚的に判断することもできる。ストックレールに対するポイントブレードの相対位置によって、現列車経路が決定する。
経路、スイッチ位置、スイッチ状態および分岐を組み合わせた情報は、全て、前方のレール配置の履歴要素(例えば、図5Dに関して上述したようなセグメント化マスク予測536)の中に表されてもよく、一方、リアルタイムシーン画像フレームは、ストックレールおよびスイッチのポイントブレード(例えば、図5Dに関して上述したような入力画像フレーム534)の更新された視覚情報を提供する。これらが一緒になって、全ての必要な情報を提供するので、RSSD NN500が推論する中で、正確で正しい経路を取得できる。列車が前方に進むにつれて、実際のレールの物理的レイアウトで変化が予測されるのは、スイッチ状態だけである。撮像センサがスイッチを実際に視覚化し、それらのスイッチに接近し、通過する間に、スイッチ状態が変化しない限り、RSSD NN500データブロック供給における履歴要素の使用は、列車の現鉄道経路を決定するのに十分である。
列車がスイッチに近づいている間に、あるいはスイッチを通過している間に、(例えば、自動または手動で)スイッチ状態を変更すると、前のスイッチ状態を参照する履歴要素(例えば、図5Cに関して上述したようなセグメント化マスク予測526または図5Dに関して上述したようなセグメント化マスク予測536)は、スイッチの新しい状態と新しいセグメント化マスク予測と断続的に矛盾する。いくつかの実施形態によれば、RSSD NN500は、このようなスイッチ状態の変化に履歴要素を適応させることができるように訓練され得る。
以下の説明は、本発明のいくつかの実施形態に従って、RSSD NN500への入力として履歴要素を組み込むときに考慮されるべきいくつかの考慮事項を提供する。
第一に、履歴要素(例えば、それぞれ図5C、図5Dに関して上述したような以前のセグメント化マスク予測526、536)に過度に依存する危険性があり得る。RSSD NN500は、履歴要素を所望の結果として解釈することがあり、それによって、リアルタイム画像フレーム入力層(例えば、図5C、図5Dに関してそれぞれ上述したような入力画像フレーム522、532)を無視することがある。この問題を解決するために、本発明のいくつかの実施形態に従って、RSSD NN500の訓練ステージ中に、(例えば、他の画像フレーム増強とは独立して)履歴要素の様々な多数の増強/更新を使用することができる。以下の表3は、システムが列車に取り付けられ、その上で動作するとき、そのシステムの異なる状態をシミュレートする履歴要素で考えられる増強/更新を提供する。
表3:列車に取り付けられたシステムの異なる状態をシミュレートする履歴要素で考えられる増強
Figure 2021530388
いくつかの実施形態によれば、履歴要素の増強/更新は、履歴要素のみで提供される情報が、RSSD NN500が正しい経路と同一の出力を生成するのに十分ではないように設計されるべきである。これによって、RSSD NN500は、リアルタイムで更新されたシーン画像フレームに与えられた情報を強制的に無視しないようにすることができる。
第二に、履歴要素は、前方監視カメラによって画像フレーム化されている間に、スイッチ状態(およびその後の経路)が変化する場合に判断を誤る可能性がある。これは、例えば、レールスイッチが(例えば、手動または自動で)変化し、実際の経路および所望の結果を変化させ、その変化が撮像センサおよびシステム/方法に(例えば、リアルタイムで)見えるときに起こり得る。
いくつかの実施形態によれば、例えば、RSSD NN500の訓練フェーズ中に、履歴要素を断続的に(例えば、T期間に1回毎に、例えば、50〜200フレーム毎に)増強/更新することにより、これらの問題を解決することができる。
いくつかの実施形態によれば、履歴要素の増強/更新は、履歴要素を完全に削除すること(例えば、セグメント化マスクをゼロにすること)を含むことができる。この場合、RSSD NN500は、履歴に追加情報が与えられていない入力画像フレームのみに基づいて決定を行い、履歴フローの人為的な再開を作成することがある。この実施形態は、以前に履歴要素層にコンパイルされた全ての情報を無視し、システムの電源投入時のように新たな開始を強制することができる。この実施形態は、カメラ視野内でスイッチの変化が生じない用途またはインスタンスで、あるいは列車がスイッチを通過する場合に、十分であり得る。
いくつかの実施形態によれば、履歴要素の増強/更新は、履歴要素を部分的に削除することを含むことができる。例えば、履歴要素マスクの上部x%は、完全に削除されるか、または注釈の中で使用されない特別なラベルに置き換えられる(例えば、訓練フェーズの間に)。
いくつかの実施形態では、T期間(約50〜200フレーム)毎に、履歴要素の最上部からx%(例えば、75%)だけゼロにして、それによって、情報を保持している履歴要素を(100−x)%残す。これにより、RSSD NN500が所望の経路位置の指定を維持する機能を維持することもあるが、可視スイッチが変更された場合は影響を受けない。なぜなら、これは、一般に、移動する列車から十分に離れた画像フレームの上部で生じ得るからである。しかしながら、これにより、履歴情報が大幅に失われ、近づいているスイッチの近くで経路指定が遅くなったり、遅れたりする可能性がある。
いくつかの実施形態では、履歴要素の増強/更新は、注釈プロセスで使用されない特別なラベルを伴って、履歴要素マスク(例えば、経路および分岐を含むレールラベルを含む)の上部x%の置換を含むことができる。この場合、履歴要素の部分のための特別なラベルは、レールの形状および位置の情報が保持されるが、レール経路とレール分岐との間の区別が無視されるように使用することもできる。これによって、レールの形状および位置の指定を容易にし、促進にしながら、更新された入力画像フレームのみに基づいて、シーン内のレールをレール経路またはレール分岐として指定する方法を強制することができる。
RSSD NN500を訓練するときに使用される訓練セットにおいて、上述の履歴要素の増補/更新には、RSSD NN500がこれらの場合も学習することができるように、顕著な表現を与えることができる。履歴要素の増強/更新は、例えば、ニューラルネットワークをそのような増強された状況に慣れさせるために、RSSD NN500の訓練フェーズにおいて重要であり得、それによって、そのような偏差および変化量に対する結果の改善されたロバスト性が得られる。
いくつかの実施形態では、履歴要素は、「t−1」セグメント化マスクと「t−2」セグメント化マスクとの間の時間差を含み、それによって、経時的に変化する履歴要素の追跡および補償を改善してもよい。
いくつかの実施形態では、履歴要素は、現在の離散一定値ではなく連続値を含むことができ、ソフト値パレットは、それぞれのラベルの保証または信頼レベル、および撮像センサからのそれぞれの範囲に応じて、様々なマスク重みを提供する際に使用することができる。
いくつかの実施形態では、ニューラルネットワークのための改善された訓練セットを使用することができ、このセットは、約80%の実画像フレームおよび約20%の誤画像/人工画像フレームの構成を含むことができる。これらの画像フレームは、約80%の部分が正しいスイッチ状態を有し、約20%の部分が反対のスイッチ状態を有するスイッチで使用することができる。
いくつかの実施形態では、履歴要素は、ニューラルネットワークの入力層ではなく、ニューラルネットワーク内の別の位置に挿入されてもよい。例えば、履歴要素は、そのargmaxの最後の層の前のニューラルネットワーク内の任意の位置に挿入することができる。
いくつかの実施形態では、入力画像フレームの注釈に少なくとも1つの「無視領域」を追加することができる。鉄道シーンの典型的な画像フレームは、有効なラベルである背景の大きな領域を有するので、訓練プロセスにおける損失計算の大部分は、背景上で行われ、非常に容易である。したがって、それが供給する損失情報は正しいが、達成された検出能力を反映しない。「無視領域」は、損失計算が無視される領域である。好ましい実施態様では、無視ラベルで背景のランダム領域を指定することにより、関心領域のよりバランスのとれた損失計算が提供される。
いくつかの実施形態では、RSSD NN500の訓練フェーズ中に、画像フレーム領域または撮像センサからの画素の範囲によって、画像フレームにわたって計算された損失の重み付けが使用され、それゆえ、より長い距離のシーン物体により高い重み付けで提供する。それによって、自然に小さくて、より微細な、より遠くのレールセグメントに沿った性能が改善する。
ここで、図6Aを参照すると、スイッチの通過後に続くレールシーン602が示されている。ニューラルネットワークによるセグメント化プロセスに履歴要素を組み込まないと(例えば、図5B、図5C、および図5Dに関して上述したように)、列車が移動している正しい経路を迅速に決定することは困難であることに留意されたい。
図6Bは、列車経路606のグラフィカルマスク605と、それぞれの分岐608を有する2つの差し迫ったスイッチとを含む、例示的な鉄道シーン604を示す。グラフィカルマスク605は、まず、ニューラルネットワークの訓練フェーズにおいて、注釈付けされ、同様のグラフィカルマスクが、(例えば、図5Cおよび図5Dに関して上述したように)ニューラルネットワークの推論フェーズにおいて後に生成され得ることに留意されたい。
ここで、本発明のいくつかの実施形態に従って、レール・障害物検出(RSSD NN)ニューラルネットワークのオフライン訓練フェーズのフローチャート700a、700b、770cである図7A、図7B、および図7Cを参照する。
図7Aは、RSSD NN704のオフライン訓練フェーズのフローチャート700aを示す。まず、入力データ構造702を生成することができる。入力データ構造702は、現在の入力画像フレーム702aおよび履歴要素702bを含むことができる。現在の入力画像フレーム702aは、撮像センサ(例えば、図1Aに関して上述した撮像センサ110など)によって得ることができる。履歴要素702bは、現在の画像フレーム702aに先行する画像フレームを決定したセグメント化マスク予測を含むことができる。例えば、履歴要素702bのセグメント化マスク予測は、図5Dに関して上述したセグメント化マスク予測536のようなものであってもよく、列車の現鉄道経路と、現鉄道経路に沿って現れるスイッチからの追加の分岐を含むことができる。
次に、入力データ構造702をRSSD NN704に供給することができる。RSSD NN704は、例えば、図1Aに関して上述したようなシステム100のRSSDモジュール120のRSSD NN122と同様であっても、あるいは図5A、図5B、図5Cおよび図5Dに関して上述したようなRSSD NN500と同様であってもよい。RSSD NN704は、入力データ構造702に基づいて、現在の入力画像フレーム702aのセグメント化マスク予測706を決定することができる。
現在の入力画像フレーム702aのセグメント化マスク予測706は、少なくとも1つの注釈付きセグメント化マスク710と比較すること708ができる。更新されたセグメント化マスク予測712は、現在の入力画像フレーム702aのセグメント化マスク予測706と注釈付きセグメント化マスク710との比較708に基づいて決定され得る。更新されたセグメント化マスク予測712は、新たな履歴要素702bとして新たな入力データ構造702にさらに組み合わされてもよく、これは、さらにRSSD NN704に供給されてもよい。
フローチャート700aに記載されるプロセスは、(例えば、図5A、図5B、図5C、図5D、および表3に関して上述したように)典型的で極端で増強された/更新された鉄道シーンの画像フレームデータベースのコンパイルに基づくことができる。手動および/またはコンピュータ化による注釈がデータベース画像フレームに適用されてもよく、それぞれのマルチラベルマスクが生成されてもよい(例えば、背景、訓練によって追跡される現鉄道経路、およびそれぞれのスイッチによって選択されない分岐経路を含む3つのラベル)。
いくつかの実施形態では、履歴要素702bは、現在の入力画像フレーム702aの注釈付きセグメント化マスクを使用して、現在の入力画像フレーム702aの最高で8画像フレーム前までシミュレートすることができる。これによって、例えば、異なる列車速度のシミュレーションが可能になる。
様々な実施形態では、例えば、データベースを拡大するために、入力画像フレーム702aおよび/または注釈付きマスク710を増強/更新して、コンパイルされた訓練データベースで発生しなかった可能性のある以前の画像フレームの予測をシミュレートすることができる。
いくつかの実施形態では、現在の入力画像フレーム702aのセグメント化マスク予測706も、増強/更新することができる。セグメント化マスク予測706の増強/更新は、例えば、各Tの画像フレーム(例えば、各50〜200の画像フレーム)で実行されてもよい。例えば、図7Bは、各Tのセグメント化マスク予測706(例えば、T=5〜200の画像フレーム)が増強/更新716されて増強/更新されたセグメント化マスク予測718を生成し、その後、新たな履歴要素702bとして新しい入力データ構造702に供給され得るフローチャート700bを示す。増強/更新プロセスの様々な例は、図5A、図5B、図5C、および図5D、ならびに表3に関して上述されている。
図7Cは、ニューラルネットワーク(例えば、図7Aおよび7Bに関して上述したRSSD NN704)のオフライン訓練フェーズの一般的なステージのフローチャート700cを示す。
ステージ720において、入力データ構造は、現在の入力画像フレームと、先行する画像フレームについて決定されたセグメント化マスク予測(例えば、図7Aおよび図7Bに関して上述した入力データ構造702など)とを組み合わせることによって定義され得る。
ステージ722において、ニューラルネットワーク(例えば、図7Aおよび図7Bに関して上述したRSSD NN704)の構成(例えば、セグネットおよび/または任意の他のもの)を定義することができる。
ステージ724において、ニューラルネットワークは、現在の画像フレームのセグメント化マスク予測(例えば、図7Aおよび図7Bに関して上述したセグメント化マスク予測706)を生成するように起動されてもよい。ニューラルネットワークの活性化は、例えば、現在の入力画像フレームにおいて中心レールの近傍に関心領域(ROI)を定義するステップと、指定された数の画素だけエッジから画像フレームを切り抜くステップと、切る抜かれた画像フレームをニューラルネットワーク入力サイズにサイズ変更するステップと、ニューラルネットワークを1つの画像フレームにさらすステップと、そして、最後に、ニューラルネットワークを起動して現在の画像フレームのセグメント化マスク予測を決定するステップとを含むことができる。
ステージ726において、現在の画像フレームのセグメント化マスク予測は、少なくとも1つの注釈付きマスク(例えば、図7Aに関して上述した注釈付きマスク710)と比較され得る。
ステージ728において、現在の画像フレームのセグメント化マスク予測と注釈付きマスクとの間の比較に基づいて、ニューラルネットワークのフィードバックを実行することができる。
ステージ730において、これまでのニューラルネットワークの最良の構成が、そのフィードバックに基づいて選択され得る。
ステージ732において、プロセス700cは、ステージ720に戻り、所定の繰り返し回数に達していない場合、撮像センサから受信した新しい現在の画像フレームを用いてステージ720〜730を繰り返すことができ、そうでない場合、プロセス700cを停止することができる。
ここで、図8を参照すると、本発明のいくつかの実施形態に従って、レール・障害物検出(RSSD NN)ニューラルネットワークの前方推論プロセスのフローチャート800である。
まず、撮像センサによって取得された現在の入力画像フレーム802を、現在の画像フレーム802に先行する画像フレーム(例えば、履歴要素)について決定されたセグメント化マスク予測804と組み合わせて801、入力データ構造806を生成することができる。例えば、撮像センサは、図1Aに関して上述した撮像センサ110のようなものであってもよい。
入力データ構造806は、入力データ構造806に基づいて、現在の入力画像フレーム802のセグメント化マスク予測804を決定し得るRSSD NN810に供給され得る。例えば、RSSD NN810は、図1Aに関して上述したRSSD NN122、図5A、図5B、図5C、および図5Dに関して上述したRSSD NN500、および/または図7A、図7B、および図7Cに関して上述したRSSD NN704と同様であってもよい。
現在の入力画像フレーム802のセグメント化マスク予測804は、列車の運転士に表示すること814ができる。現在の入力画像フレーム802のセグメント化マスク予測804は、RSSD NN810に供給されるべき新たな入力データ要素806を準備するために、新たな履歴要素として新たな現在の入力画像フレーム802とさらに組み合わせること801がある。
ここで、図9を参照すると、本発明のいくつかの実施形態に従って、レールおよび物体検出用システム900の第一の特定の実装の概略ブロック図である。
いくつかの実施形態によれば、システム900は、図1Aに関して上述したレールおよび物体検出用システム100と同様であってもよい。システム900は、視覚帯域撮像(VIS)センサ901および熱赤外線(TIR)センサ902を含むことができる。VISセンサ901およびTIRセンサ902は、図1Aに関して上述した撮像センサ110と同様であってもよい。VISセンサ901およびTIRセンサ902は、センサが列車の進行方向を向くように、前方監視構成で列車に取り付けることができる。システム900は、TIRセンサ902からの画像フレームに適用され得るダイナミックレンジ圧縮モジュール(DRC)を含んでもよい。
VISセンサ901からの画像フレームは、レール・スイッチ状態検出ニューラルネットワーク905(例えば、図9においてRSSD−VIS NN905として示される)に供給されてもよい。RSSD−VIS NN905は、図1A、図5A〜図5D、図7A〜図7C、および図8に関してそれぞれ上述したように、RSSD NN122、RSSD NN500、RSSD NN704、またはRSSD NN810と同様であってもよい。RSSD−VIS NN905は、(例えば、図1Aに関して上述したように)VISセンサ902によって得られた画像フレームの少なくともいくつかに基づいて、列車のセグメント化マスク予測および現鉄道経路を決定するように構成されてもよい。VISセンサ901は、日中の時間と光が弱い夜間の時間との両方において敏感であり得る。こうして、典型的には夜間に点灯し、継続的に操作されるシステム900の操車場での操作も、幹線での操作も可能になる。
システム900は、物体・障害物検出・追跡(OODT)モジュール910を含むことができる。OODTモジュール910は、図1Aに関して上述したOODTモジュール130と同様であってもよい。OODTモジュール910は、VISセンサ901およびTIRセンサ902から受信した画像フレームの少なくともいくつかに基づいて、物体および障害物を検出し、追跡するように構成することができる。
OODTモジュール910は、VISセンサ901によって取得された画像フレームのためのOODTニューラルネットワーク912(例えば、図9においてOODT−VIS NN912として示される)、TIRセンサ902によって取得された画像フレームのためのOODTニューラルネットワーク914(例えば、図9AにおいてOODT−TIR NN914として示される)、TIRセンサ901に基づく物体検出のBBをVISセンサ901座標上に投影する境界ボックス(BB)座標投影モジュール916(例えば、図9AにおいてBB投影916として示される)のうちの少なくとも1つを含むことができる。その結果、これらのBBは、物体検出非最大サスペンション検出モジュール918(例えば、図9AにおいてOD−NMS918として示される)によってVIS画像フレーム座標において関連付けられ、その後、時空間トラッカモジュール919に供給される。
OODTモジュール910は、RSSD−VIS NN905からセグメント化マスク予測を受信することができる(例えば、OODTCモジュール910によって進行中の各現在の入力画像フレームについて、現在の入力画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測を供給することができる)トラッカモジュール919を含むことができ、その結果、トラッカパラメータおよびスコアリングを、RSSD−VIS NN905によって決定され、検出された現鉄道経路または分岐に対する物体座標の関数として実行することができる。
システム900は、決定された現鉄道経路および分岐に関連して追跡された物体のアラートレベルを決定するためのアラートマネージャモジュール920と、それぞれの境界ボックスに対するレールベースの計算された範囲を含むことができ、それによって、必要とされる減速および予測される衝撃時間などの計算も含め、列車の停止または減速戦略の応答時間を決定する。システム900は、関心領域(ROI)マネージャモジュール922を含むことができ、そのようなROIを、RDSS−VIS NN905と、ODNN−VIS NN912と、ODNN−TIR NN914のために制御する。
ここで、図10を参照すると、本発明のいくつかの実施形態に従って、レールおよび物体を検出するためのシステム1000の第二の特定の実装の概略ブロック図である。
いくつかの実施形態によれば、システム1000は、図1Aに関して上述したレールおよび物体を検出するためのシステム100と同様であってもよい。システム1000は、視覚帯域撮像(VIS)センサ1001および熱赤外線(TIR)センサ1002を含むことができる。VISセンサ1001およびTIRセンサ1002は、図1Aに関して上述した撮像センサ110と同様であってもよい。VISセンサ1001およびTIRセンサ1002は、センサが列車の進行方向を向くように、前方監視構成で列車に取り付けることができる。システム1000は、TIRセンサ1002からの画像フレームに適用され得るダイナミックレンジ圧縮モジュール(DRC)1003を含んでもよい。
システム1000は、画像フレーム融合モジュール1004を含むことができ、その中に、VISセンサ1001からの画像フレームおよびTIRセンサ1002からの画像フレームが供給され得る。画像フレーム融合モジュール1004は、VISセンサ1001からの画像フレームと、TIRセンサ1002からの画像フレームとを融合して融合画像フレームを生成し、その後、融合画像フレームをレール・スイッチ状態検出ニューラルネットワーク(RSSD融合NN)1005に供給することができる。RSSD融合NN1005は、図1A、図5A〜図5D、図7A〜図7C、図8、および図9に関してそれぞれ上述したように、RSSD NN122、RSSD NN500、RSSD NN704、RSSD NN810、またはRSSD−VIS NN905と同様であってもよい。RSSD融合NN1005は、(例えば、図1Aに関して上述されたように)融合画像フレームの少なくともいくつかに基づいて、セグメント化マスク予測および列車の現鉄道経路を決定するように構成されてもよい。
システム1000は、物体・障害物検出・追跡(OODT)モジュール1010を含むことができる。OODTモジュール1010は、図1Aに関して上述したOODTモジュール130と同様であってもよい。OODTモジュール1010は、VISセンサ1001およびTIRセンサ1002から受信した画像フレームの少なくともいくつかに基づいて、物体および障害物を検出し、追跡するように構成することができる。
OODTモジュール1001は、VISセンサ1001によって取得された画像フレームのためのOODTニューラルネットワーク1011(例えば、図10においてOODT−VIS NN1011として示される)、TIRセンサ1002)によって取得された画像フレームのためのOODTニューラルネットワーク1012(例えば、図10においてOODT−TIR NN1012として示される)、VISセンサ1001に基づく物体検出のBBをTIRセンサ1002座標上に投影する境界ボックス(BB)座標投影モジュール1013(例えば、図10においてBB投影1013として示される)のうちの少なくとも1つを含むことができる。その結果、これらのBBは、物体検出非最大サスペンション検出モジュール1014(例えば、図9AにおいてOD−NMS918として示される)によってTIR画像フレーム座標において関連付けられ、その後、時空間トラッカモジュール919に供給される。
OODTモジュール1010は、RSSD融合NN1005からセグメント化マスク予測を受信することができる(例えば、OODTCモジュール1010によって進行中の各現在の入力画像フレームについて、現在の入力画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測を供給することができる)トラッカモジュール1015を含むことができ、その結果、トラッカパラメータおよびスコアリングを、RSSD融合NN1005によって決定され、検出された現鉄道経路または分岐に対する物体座標の関数として実行することができる。
システム1000は、決定された現鉄道経路および分岐に関連して追跡された物体のアラートレベルを決定するためのアラートマネージャモジュール1020と、それぞれの境界ボックスに対するレールベースの計算された範囲を含むことができ、それによって、必要とされる減速および予測される衝撃時間などの計算も含め、列車の停止または減速戦略の応答時間を決定する。システム1000は、関心領域(ROI)マネージャモジュール1030を含むことができ、RDSS融合NN1005と、ODNN−VIS NN1011と、ODNN−TIR NN1012のために、そのようなROIを制御する。
ここで、図11を参照すると、本発明のいくつかの実施形態に従って、VIS撮像センサからの画像フレームに適用される物体・障害物検出・追跡ニューラルネットワーク(OODT NN)の2つの実装の例が示されている。
イラスト1110は、OODT NN(例えば、図9および図10に関して上述したOODT−VISまたはOODT−TIR)による(例えば、拡張された能力および複雑さを有する)大きな単一関心領域(ROI)の結果を示す。OODT NNは、ROIをOODT NNサイズにサイズ変更するので、より大きな物体(例えば、機関車)を検出することができるが、より長い距離でより小さな物体(例えば、人間)を検出することができない。
代替として、イラスト1120は、(さほど複雑でない)2つの別個のROIを有するOODT NNの結果を示している。より大きなROIは、より短い範囲(例えば、より大きな物体)の検出を支援するので、サイズ変更制限に対する感度が低くなり、より小さなROIは、その寸法によりサイズ変更が不要であるため、より広い範囲が支援される。こうして、より小さなもの(例えば、人間である物体)が検出される。この実装では、RSSD NN(例えば、それぞれ図9および図10に関して上述したRSSD−VIS NNまたはRSSD融合NNなど)によって決定される現鉄道経路(湾曲したレールにおいてさえ)を中心に置いたままにするために、より小さなROI座標を追加で制御する必要がある。その理由は、安全ゾーンの近傍またはその内部にある物体および潜在的障害物に特に関心があるからである。拡張された範囲でも小さな物体の検出が改善されることに加えて、そのようなさほど複雑でない複数のOODT NNを並列に実装することができるので、例えば、マルチスレッド化することで、処理が著しく加速する。
ここで、図12を参照すると、本発明のいくつかの実施形態に従って、画像フレームの関心領域(ROI)内に適用される物体・障害物検出・追跡ニューラルネットワーク(OODT NN)のためのプロセス1200のフローチャートである。
いくつかの実施形態によれば、OODT NN1204は、入力画像フレームのROI1202内で適用され、境界ボックス1206を生成し、低信頼度閾値1208を適用し、次いで、Seq−NMSアルゴリズム1210を適用することができる。このアルゴリズムは、いくつかの画像フレームのスタッキング1212を、最適経路の決定および再スコアリング1216、高閾値の適用1216、NMS操作1218、更新された境界ボックスの生成1219を含むことができる。
ここで、図13(1)および図13(2)を参照すると、本発明のいくつかの実施形態に従って、可視帯域(VIS)センサおよび熱赤外線(TIR)センサから、物体・障害物検出・追跡ニューラルネットワーク(OODT NN)の境界ボックスを融合するプロセス1300のフローチャートである。
いくつかの実施形態によれば、TIRボックス1302は、VIS画像フレーム(例えば、VISセンサからの画像フレーム)座標に投影すること1303ができ、IOU計算1304は、VISボックス1301およびVIS画像フレーム座標に投影されたTIRボックス1303上に適用することができ、ハンガリアンアルゴリズム1305は、その後、IOU計算1304上に適用することができる。いくつかの実施形態では、マッチングしたボックス1310は、結合されたものとして、1312で示され得る。いくつかの実施形態では、マッチングしないボックス1320は、VISのみ、またはTIRのみとして、1322と指定され得る。
いくつかの実施形態によれば、統合境界ボックス1312は、既存の物体追跡1320を用いてIOUを介してチェックしてもよく、ハンガリアンアルゴリズム1322を適用して、次いで、以前の追跡に新たな検出のマッチングを適用してもよい。いくつかの実施形態では、結果は、マッチングした追跡1324であってもよい。いくつかの実施形態では、結果は、予測1332とマッチングしない追跡1330であってもよい。いくつかの実施形態では、結果は、マッチングしない追跡1340であっても、あるいは新たな追跡1342であってもよい。
ここで、図14を参照すると、物体・障害物検出ニューラルネットワーク(OODT NN)のプロセス1400のフローチャートであり、これには、本発明のいくつかの実施形態に従って、第一の短距離検出用と、第二の長距離検出用との2つの関心領域(ROI)インスタンスが含まれている。
いくつかの実施形態によれば、OODT NNは、2つの関心領域(ROI)インスタンス(例えば、図11のイラスト1120に関して説明されるようなインスタンス)、すなわち、短距離検出用の第一のインスタンスと、それらの間の重複を伴う長距離検出用の第二のインスタンスとを含むことができる。短距離ROIは、典型的には、推論前にOODT NNによってデシメートされるので、典型的には、より大きな寸法であってもよい。また、短距離であるために、物体は、典型的には、大きな寸法であり、その結果、デシメート後も、依然として検出可能である。長距離ROIは、より小さな寸法であり、その結果、OODT NNの入口でデシメートされず、拡張された範囲の小さな物体は検出可能なままである。
ここで、図15を参照すると、本発明のいくつかの実施形態に従って、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)の出力の一例が示されている。
説明1501は、2つの物体、例えば、検出された車両ユニット1512と、検出された立っている人間1514とによって部分的に遮られている場合のレール描写1510を示す。レール描写1510がわずかに歪むようになったことで、画像フレーム化されたレールの投影から予想され得るような予想連続性基準から、どの程度逸脱するかは注目に値する。
イラスト1520は、例えば、スプラインまたは他の幾何学的当て嵌めによるアプローチを使用する、検出されたレールの補間されたバージョンを示す。イラスト1530(図15(cont.1))に示すように、実際のレール描写および平滑化(補間)されたバージョンを重ね合わせると、様々なエラー(または距離)関数が計算され、そのようなレールの異常が自動的に検出される。これは、レールの近傍またはその上の物体の検出を改善するために使用することができ、また、例えば、予防保守のアプリケーションにおいて、レールの誤動作およびレールの故障を判定するためにも使用することができる。
ここで、図16Aおよび図16Bを参照すると、本発明のいくつかの実施形態に従って、典型的な駅シナリオと、対応するレールおよび障害物を検出するための解決策がそれぞれ示されている。
特定の鉄道安全上の考慮事項は、駅の近くの列車に関連することがあり、通勤者は、列車の到着を待っている駅のプラットフォームに沿って位置する。駅のプラットフォームには、典型的には、越えてはならないプラットフォームの縁部および安全ゾーンを指定する塗装(または盲人のために隆起)ラインが描かれている。駅が混雑した状況にあると、人が縁部の上および危険ゾーン内に押し込まれることがあり、入ってくる列車は、好ましくは、そのような状況を検出し、それぞれの迅速なアラーム、例えば、迅速なオーディオ警笛の起動、点滅ライトを提供し、バーストまたは他の音声アラーム信号を駅のスピーカシステムなどに送信することができる。典型的な液のシナリオを図16Aに示す。上記の安全要件に対処する際に、レールおよび障害物を検出するための解決策(RODS)のいくつかの実施形態は、図16Bに示すように、以下の論理に従うことができる。
第一に、RODS機能は、(例えば、イラスト1602に示されるような)鉄道シーンの画像フレームを受信し、(例えば、イラスト1604に示されるような)レールセグメント化予測マスク1604aおよび安全ゾーン領域1604bを検出し、レールセグメント化予測マスク1604に基づいて、(例えば、イラスト1606に示されるような)実際のレール1606aを抽出し得る。
第二に、RODS機能は、プラットフォームおよび安全ゾーン1604bの端部(例えば、イラスト1608のライン1608a)の1つまたは複数の境界ラインを検出してもよい。ライン1608aの検出は、ライン1608aが平行である所定の安全ゾーン1604bによって容易になり得る。地上レベルと比較したプラットフォームの高さ変動に関する追加の事前知識は、様々な理由(例えば、照明、人間による妨害、および混雑した状態など)のために、それらがカメラから見えない場合でさえも、ラインの位置を推定する際に使用され得る。例えば、GPSなどのRODSの車載センサ、および鉄道駅の位置に関するGISデータへのアクセスによって、RODSにそのようなプラットフォームの安全ラインを適用する場所とタイミングに関する情報が提供されることがある。
ここで、図17を参照すると、本発明のいくつかの実施形態に従って、運転士支援、予防保守・ビッグデータ支援をするためのシステムの概略ブロック図である。
いくつかの実施形態によれば、システム17は、予防保守機能1720および鉄道ビッグデータ支援機能1730を防止する運転士支援機能1710を含むことができる。
いくつかの実施形態によれば、運転士支援機能1710は、シーン視覚化サブ機能1712、衝突回避サブ機能1714、および状況認識サブ機能1716を含むことができる。運転士支援機能1710は、列車に取り付けられてもよく、列車を操作するために運転士をリアルタイムで(または実質的にリアルタイムで)支援するように構成されてもよい。
シーン視覚化サブ機能1712は、全ての天候および極端な環境条件下で、昼夜において、運転士および/または遠隔の第三者(例えば、監督者、制御室など)に鉄道シーン視覚化を提供するように構成されてもよい。シーン視覚化サブ機能1712は、例えば、1つまたは複数の撮像センサ(例えば、図1Aに関して上述した撮像センサ110および図2に関して上述した撮像センサ202など)を含むことができる。
衝突回避サブ機能1714は、RSSDモジュール(例えば、図1Aに関して上述したRSSDモジュール120、または図2に関して上述したRSSDモジュール210)と、OODTモジュール(例えば、図1Aに関して上述したOODTモジュール130、または図2に関して上述したOODTモジュール212)とを組み合わせることができる。衝突回避サブ機能1714は、それに沿って列車が移動する経路を検出するように、または移動するように、および/または検出された経路に沿って、およびその近傍にある物体および障害物を検出して、分類するように構成され得る。検出される物体は、レール間、レール上、およびその近傍に位置し得る静止物体であり得る。検出される物体は、移動している物体であってもよく、その物体は、移動している列車との衝突が差し迫ったものとなり得る経路を有することもある。また、衝突回避サブ機能1714は、LOS機能およびGIS機能と通信することもでき、これらの機能は、LOSの妨害および鉄道の終了などが生じるシーンの理解を支援する。
状況認識サブ機能1716は、図2に関して上述した制御および認識モジュール228と同様であってもよい。状況認識サブ機能1716は、決定支援、警告管理、およびBIT支援を提供するように構成されてもよく、その結果、リアルタイム運転士支援機能1710は、撮像センサによってフレーム化された鉄道シーン画像と、信号、標識などの追加情報に基づいて、操作状況を継続的に監視することができる。
いくつかの実施形態によれば、予防保守機能1720は、レール完全性サブ機能1722、インフラ完全性サブ機能1724、および報告サブ機能1726を含むことができる。予防保守機能1720は、オフライン機能であってもよく、および/または列車の外部に配置されてもよい。
レール完全性サブ機能1722は、低速から高速までの移動する列車から、高精度なレール完全性およびレールインフラ解析を提供するように構成されてもよい。
インフラ完全性サブ機能1724は、カテナリケーブル完全性などの電気インフラ、およびスイッチヒータ、電気信号などの他のレール関連電気機能の解析を提供するように構成されてもよい。
報告サブ機能1726は、故障解析および優先順位付けを実行するように構成され得る。
いくつかの実施形態によれば、鉄道ビッグデータ支援機能1730は、鉄道環境サブ機能1732、鉄道地理的情報システム(GIS)1734、および鉄道ビデオ・画像フレームデータベース1736を含むことができる。鉄道ビッグデータ支援機能1730は、オフライン機能であってもよく、および/または列車の外部に配置されてもよい。
鉄道環境サブ機能1732は、例えば、特定の状況において運転士が減速することを必要とし得る可視性の問題に起因して、全体的な鉄道性能(例えば、定時性)に影響を与えるように構成され得る。環境的影響と視認性の統計量をコンパイルすることにより、鉄道事業者が、そのルートをより良く計画し、パフォーマンスとタイムラインを予測するのを支援することができる。
鉄道地理的情報システム(GIS)および対話型更新サブ機能1734は、LOS解析に関する重要な情報、例えば、高架橋、トンネル、電柱、植生および樹木の並びなどに起因する視覚妨害に関する情報を提供するように構成され得る。
鉄道ビデオ・画像フレームデータベース1736は、鉄道軌道全体に沿った広範囲のシナリオを示すことができる。このようなビデオは、訓練システムにも、鉄道事業者のパフォーマンス解析と運転士の過失解析にも、例えば、シナリオの複雑さの関数としての運転士のパフォーマンスの解析に基づく視覚ベースの解析にも使用できる。
様々な実施形態によれば、開示されたシステムおよび方法は、異なる鉄道関連のアプリケーションにおいても利用され得る。
一例では、開示されたシステムおよび方法は、運転士が操作するアプリケーションのために、列車に取り付けられた前方監視電気光学感知・視覚システムにおいて利用することができる。この例では、列車は、路面電車、都市電車、高速列車、貨物列車などであってもよく、開示されるシステムおよび方法の実装は、以下の原理に基づくことができる。(a)TIR撮像センサおよびVIS撮像センサのような様々な撮像装置および分割スクリーンユーザディスプレイを利用する昼夜連続前方監視撮像および視覚処理と、(b)本発明のいくつかの実施形態に基づいて、物体および障害物を検出し、追跡し、分類するために、自動化ビデオ/視覚処理を利用する運転士の作業負荷軽減。
別の例では、開示されたシステムおよび方法は、自律列車操作のアプリケーションのために、列車に取り付けられた前方監視電気光学感知・視覚システムにおいて利用することができる。この例では、列車は、路面電車、都市列車、高速列車、貨物列車などであってもよく、開示されるシステムおよび方法の実装は、以下の原理に基づくことができる。(a)TIR撮像センサおよびVIS撮像センサのような様々な撮像装置を利用する昼夜連続前方監視撮像および視覚処理と、(b)本発明のいくつかの実施形態に基づいて、物体および障害物を検出し、追跡し、分類するために、自動化ビデオ/視覚処理を利用する列車制動システムへのインタフェース、制御室との緊密な通信リンク。
別の例では、開示されたシステムおよび方法は、踏切、鉄道スイッチ、鉄道駅およびレール妨害のアプリケーションのために、沿線電気光学感知・視覚システムにおいて利用することができる。この例では、開示されるシステムおよび方法の実装は、以下の原理に基くことができる。(a)TIR撮像センサおよびVIS撮像センサまたは任意の他のセンサ(すなわち、LADAR、レーダベースなど)などの様々な撮像装置を利用する昼夜連続静止撮像および視覚処理と、(b)本発明のいくつかの実施形態に基づいて、物体および障害物を検出し、追跡し、分類するために、自動化ビデオ/視覚処理を利用する列車制動システムへのインタフェース、制御室との緊密な通信リンク。
別の例では、開示されたシステムおよび方法は、レールインフラ予防保守のアプリケーションのために、列車に取り付けられた上方/下方/前方監視電気光学感知・視覚システムにおいて利用することができる。この例では、列車は、路面電車、都市電車、高速列車、貨物列車などであってもよく、開示されるシステムおよび方法の実装は、以下の原理に基づくことができる。(a)TIR撮像センサおよびVIS撮像センサのような様々な撮像装置を利用する昼夜連続前方監視撮像および視覚処理と、(b)軌道、カテナリ、電気機器などに関する本発明のいくつかの実施形態に基づいて、物体および障害物を検出し、追跡し、分類するために、自動化ビデオ/視覚処理を利用する予防保守の改善。
別の例では、開示されたシステムおよび方法は、レール緊急事態(例えば、「ブラックボックス」)のアプリケーションのために、列車に取り付けられた電気光学感知・視覚システムにおいて利用することができる。この例では、列車は、路面電車、都市列車、高速列車、貨物列車などであってもよく、開示されるシステムおよび方法の実装は、以下の原理に基づくことができる。(a)TIRセンサおよびVISセンサのような様々な撮像装置を利用する昼夜連続前方監視撮像および視覚処理と、本発明のいくつかの実施形態に基づいて、物体および障害物を検出し、追跡し、分類するために、自動化ビデオ/視覚処理を利用する事故、衝突、脱線、および損傷の評価を含む記録およびアラームの規定の改善と、(c)真のアラームおよび偽のアラームをロギングし、列車の位置に従って、それらをアップロードし、FIFO機構を介して関連しない場合に、廃棄するために選択的に使用されるスマート記憶装置。
本発明の態様は、本発明の実施形態による方法、装置(システム)、およびコンピュータプログラム製品のフローチャート図および/または部分図を参照して上述されている。フローチャート図および/または部分図の各部分も、フローチャート図および/または部分図における部分の組合せも、コンピュータプログラム命令によって実装され得ることが理解されるであろう。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、または他のプログラマブルデータ処理装置のプロセッサに提供されて、機械を生成することができ、その結果、コンピュータまたは他のプログラマブルデータ処理装置のプロセッサを介して実行される命令が、フローチャートおよび/または部分図、またはその複数の部分で指定された機能/動作を実装するための手段を作成する。
これらのコンピュータプログラム命令は、コンピュータ、他のプログラマブルデータ処理装置、または他のデバイスに特定の方法で機能するように指示することができるコンピュータ可読媒体に格納することもでき、その結果、コンピュータ可読媒体に格納された命令は、フローチャートおよび/または部分図の一つまたは複数の部分で指定された機能/動作を実装する命令を含む製造品を生成する。コンピュータプログラム命令は、コンピュータ、他のプログラマブルデータ処理装置、または他のデバイスにロードして、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の操作ステップを実行させて、コンピュータに実装されるプロセスを生成させることができ、その結果、コンピュータまたは他のプログラマブル装置上で実行される命令が、フローチャートおよび/または部分図の一つまたは複数の部分で指定された機能/動作を実装するためのプロセスを提供する。
前述のフローチャートおよび図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータプログラム製品の可能な実装のアーキテクチャ、機能、および操作を示す。この点に関して、フローチャートまたは部分図の各部分は、モジュール、セグメント、またはコードの一部分を表すことができ、これらの部分は、指定された論理機能を実装するための1つまたは複数の実行可能な命令を含む。また、いくつかの代替的な実装において、この部分に注記された機能は、図に注記された順序とは異なる可能性があることにも留意されたい。例えば、連続して示される2つの部分は、実際には、実質的に同時に実行されることがあり、あるいは、それらの部分は、関与する機能に応じて、時には逆の順序で実行されることもある。また、部分図および/またはフローチャート図の各部分も、部分図および/またはフローチャート図の各部分の組合せも、指定された機能または動作を実行する専用ハードウェアベースのシステム、または専用ハードウェアとコンピュータ命令の組合せによって実装できることに留意されたい。
上記の説明では、実施形態は、本発明の一つの例または実装である。「一実施形態」、「一つの実施形態」、「特定の実施形態」または「いくつかの実施形態」の様々な外観は、必ずしも全てが同じ実施形態を指すわけではない。本発明の様々な特徴は、単一の実施形態の文脈で説明することができるが、特徴は、別々に、または任意の適切な組合せで提供することもできる。逆に、本発明は、明確にするために、本明細書では別個の実施形態の文脈で説明することができるが、本発明は、単一の実施形態で実施することもできる。本発明の特定の実施形態は、上記で開示された異なる実施形態からの特徴を含むことができ、特定の実施形態は、上記で開示された他の実施形態からの要素を組み込むことができる。特定の実施形態の文脈における本発明の要素の開示は、特定の実施形態のみにおけるそれらの使用を限定するものとして解釈されるべきではない。さらに、本発明は、様々な方法で実施または実行することができ、本発明は、上記の説明で概説したもの以外の特定の実施形態で実装することができることを理解されたい。
本発明は、これらの図または対応する説明に限定されることはない。例えば、フローは、図示された各ボックスまたは各状態を介して、または図示され説明されたのと全く同じ順序で進める必要はない。本明細書で使用される技術用語および科学用語の意味は、別段の定義がない限り、本発明が属する技術分野の当業者によって一般に理解されるものとする。本発明を限られた数の実施形態に関して説明してきたが、これらは、本発明の範囲に対する限定として解釈されるべきではなく、むしろ、好ましい実施形態のいくつかの例示として解釈されるべきである。他の可能な変形、修正、および用途もまた、本発明の範囲内である。したがって、本発明の範囲は、これまでに説明されたものによって限定されるべきではなく、添付の特許請求の範囲およびそれらの法的均等物によって限定されるべきである。

Claims (10)

  1. レールおよび障害物を検出する方法であって、
    列車の機関車に設置された少なくとも1つの撮像センサから複数の画像フレームを受信するステップであって、前記少なくとも1つの撮像センサは前記列車の進行方向に向いている、ステップと、
    前記複数の画像フレームのサブセットの各画像フレームについて、それぞれの前記画像フレームと履歴要素とを含む入力データ構造を決定するステップであって、前記履歴要素は、それぞれの前記画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測を含む、ステップと、
    前記サブセットの前記画像フレームのそれぞれの前記入力データ構造に基づいて、レール・スイッチ状態検出ニューラルネットワーク(RSSD NN)を使用して、それぞれの前記画像フレームのセグメント化マスク予測を決定するステップであって、前記セグメント化マスク予測は、前記列車が沿って移動する現鉄道経路を少なくとも含む、ステップと、
    を含む、レールおよび障害物を検出する方法。
  2. 前記セグメント化マスク予測は、前記現鉄道経路に沿った対応する少なくとも1つのスイッチの状態を表す前記現鉄道経路に沿った少なくとも1つの分岐をさらに含む、請求項1に記載のレールおよび障害物を検出する方法。
  3. 前記RSSD NNを、その推論する前に訓練するステップをさらに含み、前記訓練は、訓練画像フレームの訓練サブセットに基づき、所定数の訓練サイクルを含み、前記訓練サイクルのそれぞれは、
    前記訓練サブセットの各訓練画像フレームについて、それぞれの前記訓練画像フレームおよび訓練履歴要素を含む訓練入力データ構造を決定するステップであって、前記訓練履歴要素は、それぞれの前記訓練画像フレームに先行する訓練画像フレームについて決定された訓練セグメント化マスク予測を含む、ステップと、
    前記訓練サブセットの前記訓練画像フレームのそれぞれの前記訓練入力データ構造に基づいて、前記RSSD NNを使用して、それぞれの前記訓練画像フレームの訓練セグメント化マスク予測を決定するステップと、
    前記訓練サブセットの前記訓練画像フレームのそれぞれについて決定した前記訓練セグメント化マスク予測を、前記訓練画像フレームの少なくとも1つの所定の注釈付きマスクと比較するステップと、
    前記訓練サブセットの前記訓練画像フレームのそれぞれについて、前記比較に基づいて、決定した前記訓練セグメント化マスク予測を更新するステップと、
    を含む、請求項1または2に記載のレールおよび障害物を検出する方法。
  4. 前記所定数のサイクルの少なくとも1つの訓練サイクル中に決定された前記訓練セグメント化マスク予測を増強するステップをさらに含み、前記訓練セグメント化マスク予測を増強するステップは、
    前記訓練セグメント化マスク予測の全体をゼロにするステップ、
    前記訓練セグメント化マスク予測の所定の部分をゼロにするステップ、および
    前記訓練セグメント化マスク予測の前記所定の部分を、現鉄道経路の形状および位置を保持し、前記現鉄道経路と、前記現鉄道経路に沿った少なくとも1つの分岐との区別を無視する指定ラベルに置き換えるステップ
    のうちの少なくとも1つを含む、請求項3に記載のレールおよび障害物を検出する方法。
  5. 前記サブセットの少なくとも1つの画像フレームにおいて、それぞれの前記画像フレームについて決定された前記セグメント化マスク予測に基づいて、物体・障害物検出・追跡ニューラルネットワーク(OODT NN)を使用して、前記現鉄道経路上またはその近傍の少なくとも1つの物体/障害物を決定するステップをさらに含む、請求項1〜4のいずれか一項に記載のレールおよび障害物を検出する方法。
  6. レールおよび障害物を検出するためのシステムであって、
    複数の画像フレームを取得するために、列車の機関車に設置され、前記列車の進行方向に向いた少なくとも1つの撮像センサと、
    レール・スイッチ状態検出(RSSD)ニューラルネットワーク(RSSD NN)を備えるRSSDモジュールと、
    を備え、前記RSSDモジュールは、
    前記複数の画像フレームのサブセットの各画像フレームについて、それぞれの前記画像フレームと履歴要素とを含む入力データ構造を決定することであって、前記履歴要素は、それぞれの前記画像フレームに先行する画像フレームについて決定されたセグメント化マスク予測を含む、ことと、
    前記サブセットの前記画像フレームのそれぞれの前記入力データ構造に基づいて、前記RSSD NNを使用して、それぞれの前記画像フレームのセグメント化マスク予測を決定することであって、前記セグメント化マスク予測は、前記列車が沿って移動する現鉄道経路を少なくとも含む、ことと、
    を行うように構成される、レールおよび障害物を検出するためのシステム。
  7. 前記セグメント化マスク予測は、前記現鉄道経路に沿った対応する少なくとも1つのスイッチの状態を表す前記現鉄道経路に沿った少なくとも1つの分岐をさらに含む、請求項6に記載のレールおよび障害物を検出するためのシステム。
  8. OODTニューラルネットワーク(OODT)を備える物体・障害物検出・追跡モジュールをさらに備え、前記OODTモジュールは、前記サブセットの少なくとも1つの画像フレームにおいて、それぞれの前記画像フレームについて決定された前記セグメント化マスク予測に基づいて、前記OODT NNを使用して、前記現鉄道経路上またはその近傍の少なくとも1つの物体/障害物を決定するように構成される、請求項6または7に記載のレールおよび障害物を検出するためのシステム。
  9. 前記少なくとも1つのセンサは、視覚帯域撮像センサおよび熱赤外線センサのうちの少なくとも1つである、請求項6〜8のいずれか一項に記載のレールおよび障害物を検出するためのシステム。
  10. 前記少なくとも1つのセンサは、狭視野撮像センサおよび広視野撮像センサのうちの少なくとも1つである、請求項6〜9のいずれか一項に記載のレールおよび障害物を検出するためのシステム。
JP2020570136A 2018-07-10 2019-07-10 レールセグメント化に基づいて、鉄道障害物を検出するための方法およびシステム Active JP7343531B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862695901P 2018-07-10 2018-07-10
US62/695,901 2018-07-10
PCT/IL2019/050770 WO2020012475A1 (en) 2018-07-10 2019-07-10 Method and system for railway obstacle detection based on rail segmentation

Publications (2)

Publication Number Publication Date
JP2021530388A true JP2021530388A (ja) 2021-11-11
JP7343531B2 JP7343531B2 (ja) 2023-09-12

Family

ID=69142120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020570136A Active JP7343531B2 (ja) 2018-07-10 2019-07-10 レールセグメント化に基づいて、鉄道障害物を検出するための方法およびシステム

Country Status (5)

Country Link
US (1) US20210279488A1 (ja)
EP (1) EP3820760A4 (ja)
JP (1) JP7343531B2 (ja)
CN (1) CN112351928B (ja)
WO (1) WO2020012475A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462103A (zh) * 2020-04-08 2020-07-28 中铁第一勘察设计院集团有限公司 铁路线路参数测量方法
DE102020206717A1 (de) 2020-05-28 2021-12-02 Siemens Mobility GmbH Optische Schienenwegerkennung
CN111860137B (zh) * 2020-06-09 2022-12-23 北京航空航天大学 一种基于视觉的轨道道岔识别方法
CN112033335B (zh) * 2020-11-05 2021-01-26 成都中轨轨道设备有限公司 一种铁路轨距尺智能化监测预警系统及方法
CN112193280B (zh) * 2020-12-04 2021-03-16 华东交通大学 一种重载列车强化学习控制方法及系统
DE102020215754A1 (de) * 2020-12-11 2022-06-15 Siemens Mobility GmbH Optische Schienenwegerkennung
CN112488056A (zh) * 2020-12-17 2021-03-12 上海媒智科技有限公司 一种基于计算机视觉的直线轨道异物入侵检测方法及装置
RU2752155C1 (ru) * 2020-12-25 2021-07-23 Акционерное общество "Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте" Инфраструктурная система технического зрения обеспечения безопасности движения поездов в области ограниченной видимости
DE102021200767A1 (de) 2021-01-28 2022-07-28 Siemens Mobility GmbH Selbstlernendes Warnsystem für Schienenfahrzeuge
GB2604882A (en) * 2021-03-17 2022-09-21 Siemens Mobility Ltd Real-time computer vision-based track monitoring
CN113076893B (zh) * 2021-04-09 2022-08-02 太原理工大学 一种基于深度学习的高速公路疏水管堵塞态势感知方法
EP4079598A1 (en) * 2021-04-20 2022-10-26 KNORR-BREMSE Systeme für Schienenfahrzeuge GmbH Pathway detection of a light rail vehicle ahead a turnout without detecting the turnout position
CN113268244A (zh) * 2021-05-13 2021-08-17 际络科技(上海)有限公司 一种自动驾驶场景库的脚本生成方法、装置及电子设备
CA3219358A1 (en) * 2021-05-19 2022-11-24 Xiang Liu Systems and methods for machine learning enhanced railway condition monitoring, assessment and prediction
DE102021206083A1 (de) 2021-06-15 2022-12-15 Siemens Mobility GmbH Selbstjustierende Umfelderfassungseinrichtung für Schienenfahrzeuge
CN113393442B (zh) * 2021-06-17 2023-05-16 东云睿连(武汉)计算技术有限公司 列车零部件异常检测方法、系统、电子设备及存储介质
CN113486783A (zh) * 2021-07-02 2021-10-08 浙江省交通投资集团有限公司智慧交通研究分公司 轨道交通车辆的障碍物检测方法及系统
CN113406642B (zh) * 2021-08-18 2021-11-02 长沙莫之比智能科技有限公司 一种基于毫米波雷达的轨道障碍物识别方法
CN114132360B (zh) * 2021-11-08 2023-09-08 卡斯柯信号有限公司 基于图像判别道岔状态的防挤岔方法、设备及存储介质
CN114170564A (zh) * 2021-11-09 2022-03-11 广州大学 一种基于计算机视觉的缺失路障检测方法、装置和存储介质
TWI833130B (zh) * 2021-11-12 2024-02-21 為升電裝工業股份有限公司 軌道入侵偵測系統
CN114898204B (zh) * 2022-03-03 2023-09-05 中国铁路设计集团有限公司 一种基于深度学习的轨道交通周边危险源检测方法
CN114572278B (zh) * 2022-03-25 2024-03-19 佳讯飞鸿(北京)智能科技研究院有限公司 一种铁路道岔工作状态的监测方法、装置及可读存储介质
CN114925486B (zh) * 2022-05-12 2023-03-10 中南大学 一种二维水平定向钻进轨迹计算方法、装置及介质
CN114882452B (zh) * 2022-05-17 2022-12-30 张弛 轨道线路安全监测方法、列车运行控制方法及控制系统
CN114742975B (zh) * 2022-06-10 2022-09-02 西南交通大学 一种车载图像铁轨曲线建模方法
GB2620560A (en) * 2022-07-06 2024-01-17 Seechange Tech Limited Obstruction detection in image processing
CN115598656B (zh) * 2022-12-14 2023-06-09 成都运达科技股份有限公司 基于悬挂轨道的障碍物检测方法、装置及系统
CN116109638B (zh) * 2023-04-13 2023-07-04 中铁四局集团有限公司 一种钢轨折断检测方法及系统
CN116206265B (zh) * 2023-05-05 2023-07-18 昆明轨道交通四号线土建项目建设管理有限公司 用于轨道交通运营维护的防护报警装置及方法
CN116485799B (zh) * 2023-06-25 2023-09-15 成都考拉悠然科技有限公司 铁路轨道异物覆盖的检测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015219690A1 (de) * 2015-10-12 2017-04-13 Siemens Aktiengesellschaft Verfahren zur Fahrwegerkennung für ein Schienenfahrzeug
CN107301400A (zh) * 2017-06-23 2017-10-27 深圳市唯特视科技有限公司 一种语义导向的半监督视频对象分割方法
WO2018073778A1 (en) * 2016-10-20 2018-04-26 Rail Vision Ltd System and method for object and obstacle detection and classification in collision avoidance of railway applications

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL117279A (en) * 1996-02-27 2000-01-31 Israel Aircraft Ind Ltd System for detecting obstacles on a railway track
US20150269722A1 (en) * 2014-03-18 2015-09-24 General Electric Company Optical route examination system and method
US11208129B2 (en) * 2002-06-04 2021-12-28 Transportation Ip Holdings, Llc Vehicle control system and method
US7999848B2 (en) * 2004-06-11 2011-08-16 Stratech Systems Limited Method and system for rail track scanning and foreign object detection
CN103116743B (zh) * 2013-02-01 2016-08-10 浙江捷尚视觉科技股份有限公司 一种基于在线学习的铁路障碍物检测方法
HUE056985T2 (hu) * 2013-07-31 2022-04-28 Rail Vision Ltd Rendszer és eljárás akadályok azonosítására és elkerülésére
US10336326B2 (en) * 2016-06-24 2019-07-02 Ford Global Technologies, Llc Lane detection systems and methods
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
CN108197610A (zh) * 2018-02-02 2018-06-22 北京华纵科技有限公司 一种基于深度学习的轨道异物检测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015219690A1 (de) * 2015-10-12 2017-04-13 Siemens Aktiengesellschaft Verfahren zur Fahrwegerkennung für ein Schienenfahrzeug
WO2018073778A1 (en) * 2016-10-20 2018-04-26 Rail Vision Ltd System and method for object and obstacle detection and classification in collision avoidance of railway applications
CN107301400A (zh) * 2017-06-23 2017-10-27 深圳市唯特视科技有限公司 一种语义导向的半监督视频对象分割方法

Also Published As

Publication number Publication date
WO2020012475A1 (en) 2020-01-16
EP3820760A4 (en) 2022-03-30
EP3820760A1 (en) 2021-05-19
CN112351928A (zh) 2021-02-09
US20210279488A1 (en) 2021-09-09
CN112351928B (zh) 2023-11-10
JP7343531B2 (ja) 2023-09-12

Similar Documents

Publication Publication Date Title
JP7343531B2 (ja) レールセグメント化に基づいて、鉄道障害物を検出するための方法およびシステム
US11554785B2 (en) Driving scenario machine learning network and driving environment simulation
US11982540B2 (en) Infrastructure mapping and layered output
US20220073077A1 (en) Low Resolution Traffic Light Candidate Identification Followed by High Resolution Candidate Analysis
US20220383744A1 (en) Traffic light relevancy
JP3619628B2 (ja) 走行環境認識装置
JP2022523613A (ja) レーンマッピング及びナビゲーション
JP2022553491A (ja) 車両ナビゲーション用のシステムおよび方法
WO2021053390A1 (en) Systems and methods for predicting blind spot incursions
US10553117B1 (en) System and method for determining lane occupancy of surrounding vehicles
US11280630B2 (en) Updating map data
GB2614379A (en) Systems and methods for vehicle navigation
JP3857698B2 (ja) 走行環境認識装置
US20220371583A1 (en) Systems and Methods for Selectively Decelerating a Vehicle
Wang et al. Planning autonomous driving with compact road profiles
EP4105605A1 (en) Implementing synthetic scenes for autonomous vehicles
JP7294476B2 (ja) カメラ制御システム、カメラ制御方法、及び非一時的コンピュータ可読媒体
US20230280183A1 (en) Machine learning-based traffic light relevancy mapping
KR20230020933A (ko) 다중 세분성들의 라벨들이 있는 데이터 세트를 사용하는 뉴럴 네트워크 트레이닝

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230831

R150 Certificate of patent or registration of utility model

Ref document number: 7343531

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150