WO2022208666A1

WO2022208666A1 - 画像処理装置、画像処理方法、プログラム

Info

Publication number: WO2022208666A1
Application number: PCT/JP2021/013595
Authority: WO
Inventors: 吉弘三島; 直子浅野; 絵里奈北原
Original assignee: 日本電気株式会社
Priority date: 2021-03-30
Filing date: 2021-03-30
Publication date: 2022-10-06
Also published as: EP4258243A1; US20240062505A1; EP4258243A4; JPWO2022208666A1

Abstract

取得した撮影画像の各画素が、当該撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識する。複数の異なる領域クラスのうちの所定の領域クラスを示す撮影画像中の領域において複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する。着目候補領域が所定の所望領域であるかを判定する。

Description

画像処理装置、画像処理方法、プログラム

　本発明は、画像処理装置、画像処理方法、プログラムに関する。

　画像に写る所定の対象物を認識するために、当該対象物の形状や色などの情報を機械学習することによって生成された認識モデルを用いてその対象物を認識することが行われている。しかしながら、機械学習による認識モデルの生成には、対象物が写る多くの正解データとなる画像を用意してその画像を機械学習させる必要があり、手間と労力を有する。特許文献１、特許文献２には、関連する技術として、障害物を検知する技術が開示されている。

特開２０１６－２２４７９７号公報特開２００８－５２９１８３号公報

　上述のような画像処理の技術において、画像に含まれる所望の物体を容易に認識するための技術が求められている。

　そこでこの発明は、上述の課題を解決する画像処理装置、画像処理方法、プログラムを提供することを目的としている。

　本発明の第１の態様によれば、画像処理装置は、取得した撮影画像に基づいて生成された深度マップ画像の各画素が、取得した前記撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識する領域認識手段と、前記複数の異なる領域クラスのうちの所定の領域クラスを示す前記撮影画像中の領域において前記複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する着目候補領域特定手段と、前記着目候補領域が所定の所望領域であるかを判定する所望領域判定手段と、を備える。

　本発明の第２の態様によれば、画像処理方法は、取得した撮影画像に基づいて生成された深度マップ画像の各画素が、取得した前記撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識し、前記複数の異なる領域クラスのうちの所定の領域クラスを示す前記撮影画像中の領域において前記複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定し、前記着目候補領域が所定の所望領域であるかを判定する。

　本発明の第３の態様によれば、プログラムは、画像処理装置のコンピュータを、取得した撮影画像に基づいて生成された深度マップ画像の各画素が、取得した前記撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識する領域認識手段、前記複数の異なる領域クラスのうちの所定の領域クラスを示す前記撮影画像中の領域において前記複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する着目候補領域特定手段、前記着目候補領域が所定の所望領域であるかを判定する所望領域判定手段、として機能させる。

　本発明によれば、画像に含まれる所望の物体を容易に認識するための技術を提供することができる。

本実施形態による画像処理システムの概要を示す図である。本実施形態による画像処理装置のハードウェア構成図である。本実施形態による画像処理装置の機能ブロック図である。本実施形態による画像処理装置の処理概要を示す図である。本実施形態による画像処理装置の処理フローを示す図である。本実施形態による画像処理装置の最小構成を示す図である。本実施形態による最小構成の画像処理装置の処理フローを示す図である。

　以下、本発明の一実施形態による画像処理装置を図面を参照して説明する。
　図１は本実施形態による画像処理装置を含む画像処理システムの概要を示す図である。
　図１で示すように画像処理システム１００は、車両２０に搭載された画像処理装置１とカメラ２とが、無線通信ネットワークや有線通信ネットワークを介して接続されることにより構成される。画像処理システム１００にはサーバ装置３が含まれてよい。サーバ装置３は、画像処理装置１やカメラ２と通信接続してよい。カメラ２は本実施形態においては、道路と当該道路を走行する車両を含む画像を撮影する。カメラ２は画像を画像処理装置１へ出力する。画像処理装置１はカメラ２から取得した画像を用いて、所定の物体が含まれる可能性のある着目候補領域を特定し、その着目候補領域から所定の物体などを示すと思われる着目領域を特定する。本実施形態において画像処理装置１は、道路に落ちている障害物の写る画像内領域を着目領域と特定する。画像から障害物を着目領域と特定することにより、自動運転などにおける障害物を避けるための処理などに利用することができる。

　図２は画像処理装置のハードウェア構成図である。
　この図が示すように画像処理装置１は、ＣＰＵ（Central Processing Unit）１０１、ＲＯＭ（Read Only Memory）１０２、ＲＡＭ（Random Access Memory）１０３、ＨＤＤ（Hard Disk Drive）１０４、通信モジュール１０５、データベース１０６等の各ハードウェアを備えたコンピュータである。なおサーバ装置３も同様の構成を備える。

　図３は画像処理装置の機能ブロック図である。
　画像処理装置１は車両２０の始動に基づいて電源が投入されると起動し、予め記憶する画像処理プログラムを実行する。これにより画像処理装置１には、画像取得部１１、深度マップ生成部１２、領域認識部１３、境界検出部１４、着目候補領域抽出部１５、着目領域判定部１６、出力部１７、形状把握部１８の各機能を発揮する。

　画像取得部１１は、カメラ２から画像を取得する。
　深度マップ生成部１２は、カメラ２から取得した画像を用いて深度マップ情報を生成する。
　領域認識部１３は、取得した撮影画像の各画素が、当該撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識する。
　境界検出部１４は、撮影において認識した各領域の境界を検出する。
　着目候補領域抽出部１５は、複数の異なる領域クラスのうちの所定の領域クラスを示す撮影画像中の領域において複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する。
　着目領域判定部１６は、着目候補領域が所望の着目領域であるかを判定する。
　出力部１７は着目領域を出力する。
　形状把握部１８はＣＡＮ情報などから得られたステアリング角度などに基づいて道路の形状を検出する。

　具体的には、着目領域判定部１６は、着目候補領域の各画素が示す深度情報に基づいて当該着目候補領域が立体物を示すかを判定し、当該着目候補領域が立体物を示す時に、当該着目候補領域を着目領域と判定する。

　着目領域判定部１６は、着目候補領域の各画素が示す深度情報の変化に基づいて当該着目候補領域が静止物を示すかを判定し、当該着目候補領域が静止物を示す時に、当該着目候補領域を着目領域と判定してよい。

　領域認識部１３は、道路と当該道路を走行する車両２０などの移動体を含む撮影画像の各画素が、撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識してよい。この時、着目候補領域抽出部１５は、複数の領域クラスのうち道路の領域を示す道路クラスに属する撮影画像中の領域に少なくとも一部が隣接するクラス未認識領域を着目候補領域と特定してよい。

　着目領域判定部１６は、複数の領域クラスのうち移動体に属する撮影画像中の領域を除く領域における着目候補領域の中から着目領域を判定してよい。

　図４は画像処理装置の処理概要を示す図である。
　図４には、撮影画像（４０）と、その撮影画像を用いた領域認識部１３の処理結果（４１）と、境界検出部１４と着目候補領域抽出部１５の処理結果（４２）と、着目領域判定部１６の処理結果（４３）を示す。境界検出部１４と着目候補領域抽出部１５の処理結果（４２）には、境界を示す情報Ｂと着目候補領域Ａ1を示す画素の情報が含まれる。さらに、着目領域判定部１６の処理結果（４３）には着目領域Ａ２を示す画素の情報が含まれる。

　図５は画像処理装置の処理フローを示す図である。
　以下、画像処理装置１の処理フローについて順を追って説明する。
　車両２０が走行中、カメラ２は撮影により生成した撮影画像を画像処理装置１へ出力する。画像処理装置１の画像取得部１１は撮影画像を取得して深度マップ生成部１２へ出力する。深度マップ生成部１２は、取得した撮影画像に基づいて深度マップ情報を生成する（ステップＳ１０１）。なお画像取得部１１は、予めカメラ２が生成した深度マップ情報を取得してよい。この場合、画像処理装置１に深度マップ生成部１２は設けなくてもよい。深度マップ情報は、各撮影画像の各画素に含まれる被写体までの距離の配列情報である。深度マップ情報の生成は公知の技術により行われてよい。深度マップ生成部１２は深度マップ情報を、境界検出部１４、着目領域判定部１６へ出力する。

　領域認識部１３は撮影画像（４０）を取得する。領域認識部１３は、撮影画像に写る被写体を、空、壁、道路、移動体（交通参加者）、人、などの領域クラスごとに認識する（ステップＳ１０２）。領域認識部１３が撮影画像の各画素を複数の異なる対象を示す領域クラスごとに認識する技術は、公知の技術を用いてよい。この処理において、領域認識部１３は撮影画像の各画素の各領域クラスに属する確率を算出する。領域認識部１３は、各画素について、各領域のクラスに属する確率の情報を保持した領域認識情報を生成する。領域認識情報は、撮影画像の各画素について、領域クラス毎の確率の情報の配列情報である。領域認識部１３は、処理結果（４１）である領域認識情報を境界検出部１４へ出力する。なお領域認識部１３は、撮影画像を入力として、予め定められた複数の領域クラスに属することの確率を出力する、領域クラス算出モデルを用いて、撮影画像の各画素の領域クラス毎の確率を算出してよい。領域クラス算出モデルは、例えば、多数の画像を入力として、それら画像の各画素の領域クラスを示す情報を正解データとして、その関係を機械学習したモデルであってよい。領域認識部１３は、形状把握部１８から取得したＣＡＮ情報からステアリング角度を取得し、その情報に基づいてステアリング角度に応じた道路の曲がりを推定し、その推定結果などから道路の形状を認識してよい。例えばステアリング角度が左に１５度の確度である場合には、道路は左に曲がっている。領域認識部１３は、深度マップ情報において左奥が左方向に曲がっていると認識し、当該画像中の色や輝度と共に、左方向に曲がることを示す情報を用いて、道路クラスの画素の確率を、画像中の中央左側がより高くなるよう補正係数を乗じて、道路クラスの画素の確率を上げるようにしてもよい。

　境界検出部１４は領域認識情報を取得する。境界検出部１４は、領域認識情報に含まれる撮影画像の各画素に対応する領域クラスの確率に基づいて、隣接する画素と領域クラスが異なる画素を特定し、その画素についての境界フラグを保持した境界情報を生成する（ステップＳ１０３）。境界情報は各画素の領域クラスが他の領域クラスとの境界であるか否かを示す情報の配列情報である。境界検出部１４は、着目候補領域抽出部１５へ深度マップ情報、領域認識情報、境界情報を出力する。

　着目候補領域抽出部１５は、撮影画像、深度マップ情報、領域認識情報、境界情報を取得する。着目候補領域抽出部１５は、領域認識情報を用いて、複数の異なる領域クラスのうちの指定された所定の領域クラスを示す撮影画像中の領域において、それら複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する（ステップＳ１０４）。例えば、着目候補領域抽出部１５は、複数の領域クラスが、空、壁、道路、移動体（交通参加者）、人、などの領域クラスである場合であって、指定された所定の領域クラスが道路クラスである場合、複数の領域クラスの確率全てが所定の確率値未満である画素の領域を道路クラスの領域から特定し、その領域をクラス未認識領域と特定する。着目候補領域抽出部１５は、クラス未認識領域を着目候補領域と特定する。

　着目候補領域抽出部１５は、指定された複数の領域クラスのうち道路の領域を示す道路クラスに属する撮影画像中の領域に少なくとも一部が隣接するクラス未認識領域を着目候補領域とし、その着目候補領域を着目候補と特定するようにしてもよい。つまり指定された複数の領域クラスのうち道路の領域を示す道路クラスに属する撮影画像中の領域に少なくとも一部が隣接するクラス未認識領域は、道路クラスと他のクラスとの境界を跨ぐ領域となり、着目候補領域抽出部１５は、そのような領域をクラス未認識領域と判定してもよい。着目候補領域抽出部１５は、クラス未認識領域を着目候補領域と特定した後、着目候補領域を示す画素の配列情報を示す着目候補領域情報を生成する。着目候補領域抽出部１５は、撮影画像、深度マップ情報、領域認識情報、境界情報、着目候補領域情報を着目領域判定部１６へ出力する。

　着目領域判定部１６は、撮影画像、深度マップ情報、領域認識情報、境界情報、着目候補領域情報を取得する。着目領域判定部１６は着目候補領域情報が示す着目候補領域の中から着目領域を特定する（ステップＳ１０５）。具体的には、着目領域判定部１６は、着目候補領域の各画素が示す深度情報を、深度マップ情報から取得して、その深度情報に基づいて当該着目候補領域が立体物を示すかを判定する。着目領域判定部１６は、着目候補領域が立体物を示すと判定した時に、当該着目候補領域を着目領域と判定する。一例として着目領域判定部１６は、着目候補領域を示す画素の深度情報が垂直方向や水平方向に一様である場合には、それらの領域が面を構成しているため、立体物であると判定し、その着目候補領域を着目領域と判定する。深度情報が垂直方向や水平方向に一様であるとは、例えば、ある画素を基準とした隣接する他の各画素の深度情報の誤差が、基準とした画素の深度情報と比較して所定の値未満である場合である。着目領域判定部１６は、ある画素を基準として当該基準画素とその基準画素に隣接する隣接画素の深度情報が一様の面を示さない場合でも、基準画素とその隣接画素の深度情報に基づいて、それら画素を含む領域が水平面でなく立体物を示す領域であると判定した場合には、その領域を着目領域と判定してよい。例えば、着目領域判定部１６は、ある基準画素と隣接画素の深度情報の差が、連続的な面を示す差が連続するような場合には、立体物があるとして着目領域と判定してよい。

　着目領域判定部１６は、着目候補領域の各画素が示す深度情報の変化に基づいて当該着目候補領域が静止物を示すかを判定し、当該着目候補領域が静止物を示す時に、当該着目候補領域を着目領域と判定してよい。例えば、着目領域判定部１６は、着目候補領域の所定期間における距離の変化をその領域の深度情報の変化から算出する。また着目領域判定部１６は、移動体と判定した領域の画素の同一期間における距離の変化をその領域の深度情報の変化から算出する。着目領域判定部１６は、着目候補領域の所定期間における距離の変化の絶対値の変化と、移動体と判定した領域の同一期間における画素の距離の変化の絶対値の変化の差が、所定の変化閾値以上である場合には、着目候補領域は静止物であると判定する。移動体のカメラ２を基準とした場合、カメラ２を備える移動体と同じような速度で走っている他の移動体の距離は大きく変わらず、静止物の距離は大きく変わるため、このような処理により着目候補領域を静止物であると判定することができる。着目領域判定部１６は、着目候補領域が立体物であると判定し、かつ静止物であると判定した場合に、その着目候補領域を着目領域と判定してよい。着目領域判定部１６は、着目候補領域を立体物と判定していない場合でも、静止物であると判定した場合に、その着目候補領域を着目領域と判定してもよい。

　着目領域判定部１６は、移動体を含むクラスに属する撮影画像中の領域を除く領域における着目候補領域を着目領域と判定してもよい。移動体を含むクラスに属する領域は、撮影画像の各画素に対応する領域認識情報内の値に含まれる当該クラスの確率が所定の確率以上の領域である。着目領域判定部１６は、このような移動体を含むクラスの領域と認識されている領域を除いた着目候補領域の中から着目領域を判定すればよい。

　着目領域判定部１６は、形状把握部１８から取得したＣＡＮ情報からステアリング角度を取得し、その情報に基づいてステアリング角度に応じた道路の曲がりを推定し、その推定結果などから道路の形状を認識して領域認識部１３の認識結果を修正してよい。例えばステアリング角度が左に１５度の確度である場合には、道路は左に曲がっている。領域認識部１３は、深度マップ情報において左奥が左方向に曲がっていると認識し、当該画像中の色や輝度と共に、左方向に曲がることを示す情報を用いて、道路クラスの画素の確率を、画像中の中央左側がより高くなるよう補正係数を乗じて、道路クラスの画素の確率を上げるようにしてもよい。着目領域判定部１６は領域認識部１３の認識結果を修正した領域認識情報を用いて、着目候補領域の中から着目領域を判定してよい。

　着目領域判定部１６は、着目候補領域の中から着目領域を判定しても、ただちにその領域を着目領域として出力しなくてもよい。例えば、着目領域判定部１６は、複数の撮影画像を用いて、それら撮影画像間で位置のずれが閾値以下などのずれの少ない着目領域を同じ着目領域と判定して、全ての撮影画像に同じ着目領域が含まれている場合には、その領域を着目領域と判定してよい。例えば所定の数の連続する撮影画像において、同一の着目領域が含まれる場合には、その着目領域を出力すると決定してよい。着目領域判定部１６は、着目候補領域の大きさが所定の大きさ以上である場合に、着目領域と判定してもよい。着目領域判定部１６は着目領域を特定した後、着目領域を示す画素の配列情報を示す着目領域情報を生成する。着目領域判定部１６は着目領域情報を出力部１７へ出力する。

　出力部１７は、撮影画像と着目領域情報とを所定の装置へ出力する（ステップＳ１０６）。例えば、着目領域は、予め指定された複数の領域クラスの何れにも属さない場合には、障害物である可能性が高い。従って、例えば出力先が自動運転処理装置であれば、障害物を認識して車両２０の停止動作の制御をすることができる。

　以上の処理によれば、カメラ２の生成した画像に写る障害物などの着目すべき物体を示す着目領域を、その着目すべき物体を学習することなく判定することができる。これにより、画像に含まれる所望の物体を容易に認識するための技術を提供することができる。

　なお上述の処理によれば、画像処理装置１が着目領域を判定している。しかしながら、画像処理装置１がカメラ２から取得した画像をサーバ装置３へ送信し、サーバ装置３が上述の処理と同様に、取得した画像から着目領域を判定してもよい。または上述の処理の一部のみをサーバ装置３が行い、その結果をサーバ装置３が画像処理装置１へ送信し、画像処理装置１がその後の処理を上述の処理と同様におこなって、着目領域を判定してもよい。

　上述の処理においては、車両２０に備わるカメラ２が走行する車両２０の前方を撮影した撮影画像において障害物など画像領域を判定するための処理を具体的に説明した。しかしながら画像処理装置１は、航空機などの空を飛ぶ移動体に備わるカメラ２が移動する移動体の前方を撮影した撮影画像において障害物など画像領域を判定するものであってよい。また画像処理装置１は、所望の画像において同様に、所望の着目領域を判定するものであってよい。

　図６は画像処理装置の最小構成を示す図である。
　図７は最小構成の画像処理装置の処理フローを示す図である。
　画像処理装置１は、少なくとも着目候補領域特定手段６１、着目領域判定手段６２と、を備える。
　着目候補領域特定手段６１は、複数の異なる領域クラスのうちの所定の領域クラスを示す撮影画像中の領域において複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する（ステップＳ７０１）。
　着目領域判定手段６２は、着目候補領域が所望の着目領域であるかを判定する（ステップＳ７０２）。

　上述の各装置は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。

　また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であっても良い。

１・・・画像処理装置
２・・・カメラ
３・・・サーバ装置
１１・・・画像取得部
１２・・・深度マップ生成部
１３・・・領域認識部
１４・・・境界検出部
１５・・・着目候補領域抽出部（着目候補領域特定手段）
１６・・・着目領域判定部（着目領域判定手段）
１７・・・出力部
１８・・・形状把握部

Claims

　取得した撮影画像の各画素が、当該撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識する領域認識手段と、
　前記複数の異なる領域クラスのうちの所定の領域クラスを示す前記撮影画像中の領域において前記複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する着目候補領域特定手段と、
　前記着目候補領域が所定の所望領域であるかを判定する着目領域判定手段と、
　を備える画像処理装置。
　前記着目領域判定手段は、前記着目候補領域の各画素が示す深度情報に基づいて当該着目候補領域が立体物を示すかを判定し、当該着目候補領域が立体物を示す時に、当該着目候補領域を前記着目領域と判定する
　請求項１に記載の画像処理装置。
　前記着目領域判定手段は、前記着目候補領域の各画素が示す深度情報の変化に基づいて当該着目候補領域が静止物を示すかを判定し、当該着目候補領域が静止物を示す時に、当該着目候補領域を前記着目領域と判定する
　請求項１または請求項２に記載の画像処理装置。
　前記領域認識手段は、道路と当該道路を走行する移動体を含む前記撮影画像の各画素が、前記撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識し、
　前記着目候補領域特定手段は、前記複数の領域クラスのうち道路の領域を示す道路クラスに属する前記撮影画像中の領域に少なくとも一部が隣接する前記クラス未認識領域を前記着目候補領域と特定する
　請求項１から請求項３の何れか一項に記載の画像処理装置。
　前記着目領域判定手段は、前記複数の領域クラスのうち移動体に属する前記撮影画像中の領域を除く領域における前記着目候補領域の中から前記着目領域を判定する
　請求項１から請求項４の何れか一項に記載の画像処理装置。
　取得した撮影画像の各画素が、当該撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識し、
　前記複数の異なる領域クラスのうちの所定の領域クラスを示す前記撮影画像中の領域において前記複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定し、
　前記着目候補領域が所定の所望領域であるかを判定する
　画像処理方法。
　画像処理装置のコンピュータを、
　取得した撮影画像の各画素が、当該撮影画像に写る対象物に関する指定された複数の異なる領域クラスの何れに属するかを認識する領域認識手段、
　前記複数の異なる領域クラスのうちの所定の領域クラスを示す前記撮影画像中の領域において前記複数の領域クラスの何れにも属さないクラス未認識領域を着目候補領域と特定する着目候補領域特定手段、
　前記着目候補領域が所定の所望領域であるかを判定する着目領域判定手段、
　として機能させるプログラム。