JP7414456B2 - 情報処理装置、同一性判定方法、および同一性判定プログラム - Google Patents

情報処理装置、同一性判定方法、および同一性判定プログラム Download PDF

Info

Publication number
JP7414456B2
JP7414456B2 JP2019188124A JP2019188124A JP7414456B2 JP 7414456 B2 JP7414456 B2 JP 7414456B2 JP 2019188124 A JP2019188124 A JP 2019188124A JP 2019188124 A JP2019188124 A JP 2019188124A JP 7414456 B2 JP7414456 B2 JP 7414456B2
Authority
JP
Japan
Prior art keywords
detected
image
images
identity determination
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019188124A
Other languages
English (en)
Other versions
JP2021064138A (ja
Inventor
裕介 三木
寿英 三宅
雅弘 藤丸
恒男 牧
雅史 桑野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Zosen Corp
Tokyo Eco Service Co Ltd
Original Assignee
Hitachi Zosen Corp
Tokyo Eco Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Zosen Corp, Tokyo Eco Service Co Ltd filed Critical Hitachi Zosen Corp
Priority to JP2019188124A priority Critical patent/JP7414456B2/ja
Priority to CN202011051489.7A priority patent/CN112652014A/zh
Publication of JP2021064138A publication Critical patent/JP2021064138A/ja
Application granted granted Critical
Publication of JP7414456B2 publication Critical patent/JP7414456B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像から物体を検出する情報処理装置等に関する。
近年、深層学習などの機械学習の発展により、画像上での物体の認識・検出精度が向上し、画像認識を用いた用途が広がりつつある。しかし、現状の検出精度は100%ではないため、用途をさらに広げるためにさらなる工夫が必要となる。深層学習(または他のニューラルネットワーク系の検出技術等)を用いて画像上の物体を検出する場合、まず教師データを準備する。教師データは、画像と画像に写る物体の詳細情報(例えば物体識別子、物体の位置や大きさ、形状、角度等)とを対応付けて作成される。そして教師データを用いて機械学習を行い、学習結果として一つまたは複数の重み(学習済みモデル)が出力される。そして、この学習済みモデルを使って物体検出を行う。
また、動画像から物体検出を行う場合、動画像のあるフレームで検出された物体と、そのフレームの前後のフレームで検出された物体とが同一の物体であるかが判定される。例えば、下記の特許文献1では、現在と過去のフレーム画像に対して、物体や人物の位置の差異や移動方向の差異を用いて、移動する物体や人物の検出(追跡)を行っている。
特開2010-257441号公報(2010年11月11日公開)
機械学習アルゴリズムを用いた物体検出においては、物体の検出を行うことができると共に、検出した物体の大きさや回転角度も検出することが可能である。そして、大きさや回転角度は、異なるフレームで検出された物体の同一性判定に利用することができる。
しかしながら、検出対象とする物体が同一であっても、学習設定情報(教師データ、パラメータ設定等)が異なる学習済みモデルを用いた場合、回転角度を算出する基準となる軸の向きが変わることがある。そして、これにより検出される回転角度や物体の縦幅・横幅にも差異が生じることがある。
これについて、図16に基づいて説明する。図16は、物体検出に使用する学習済みモデルが相違することにより、同じ物体の回転角度が異なって検出される例を示す図である。図16の例では、物体1010を撮影した動画像から抽出した2枚の画像1000と1100のそれぞれから物体検出を行っている。画像1000に写る物体1010と画像1100に写る物体1010は同一の物体であるが、時間の経過に伴って回転している(画像1000の方が、撮影タイミングが早い)。
物体検出は、学習済みモデルaとbとを用いて行っている。学習済みモデルaとbは、何れも物体1010を検出するためのモデルであるが、異なる学習設定情報(教師データ、パラメータ設定等)での機械学習によって構築されたものである。そして、図16では、学習済みモデルaによる画像1000、1100からの物体検出結果を、ボックス1020a、1120aとして示している。このようなボックスは、学習済みモデルaが出力する、検出物体の位置を示す情報(例えば中心位置の座標)等の情報を用いて描画することができる。
ボックス1020aは、縦幅が32、横幅が10、角度が-9°である。また、ボックス1120aは、縦幅と横幅はボックス1020aと同じであり、角度は7°である。なお、縦横の幅の単位は任意である。また、物体の分類についても学習させた学習済みモデルを用いた場合、分類結果も出力される。
これらの学習済みモデルaによる物体検出結果に基づいて、画像1000と1100から検出された各物体が同一のものであるか判定した場合には、同一物体であると正しく判定される。ボックス1020aと1120aは、縦横の幅が等しく、角度の差の絶対値は16°(7°+9°)と十分に小さい値であるからである。なお、角度の差が小さいか否かは、画像1000と1100の抽出元である動画像のフレームレート(例えば10fps:Frames Per Second)に基づいて設定した閾値を基準として判定することができる。
また、学習済みモデルbによる画像1000、1100からの物体検出結果を、ボックス1020b、1120bとして示している。ボックス1020bは、ボックス1020aと同じく、縦幅が32、横幅が10、角度が-9°である。一方、ボックス1120bは、ボックス1120aとは異なり、縦幅が10、横幅が32、角度は97°である。
ボックス1120aと1120bは、外観は同じであるが、縦と横が逆になっており、これに伴って角度も90°ずれている。このため、学習済みモデルbによる物体検出結果に基づいて、画像1000と1100から検出された各物体が同一のものであるか判定すると、同一物体ではないと誤判定される。ボックス1020bと1120bは、縦横の幅が異なり、角度の差の絶対値は106°(97°+9°)と大きく、閾値を超えるからである。なお、このような問題は、深層学習に限られず、他の学習済みモデルを用いた物体検出においても同様に生じる可能性がある問題である。
本発明の一態様は、時系列の複数の画像でそれぞれ検出された物体の同一性の判定精度を高めることができる情報処理装置等を実現することを目的とする。
上記の課題を解決するために、本発明の一態様に係る情報処理装置は、時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部と、上記複数の画像のうち第1の画像から検出された第1の物体と、上記複数の画像のうち第2の画像から検出された第2の物体とが同一の物体であるか否かを判定する同一性判定部と、上記第1の物体または上記第2の物体の縦幅と横幅の値を入れ替える入替部と、を備え、上記入替部が上記の入れ替えを行った場合、上記同一性判定部は、入れ替え後の縦幅と横幅の値に基づいて上記判定を行う。
上記の課題を解決するために、本発明の一態様に係る同一性判定方法は、一または複数の情報処理装置により実行される同一性判定方法であって、時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出ステップと、上記複数の画像のうち第1の画像から検出された第1の物体、または上記複数の画像のうち第2の画像から検出された第2の物体の縦幅と横幅の値を入れ替える入替ステップと、入れ替え後の縦幅と横幅の値に基づいて、上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する同一性判定ステップと、を含む。
本発明の一態様によれば、時系列の複数の画像でそれぞれ検出された物体の同一性の判定精度を高めることができる。
本発明の一実施形態に係る情報処理装置の制御部の機能ブロック図の一例である。 上記情報処理装置を含む不適物検出システムの構成例を示すブロック図である。 ごみ焼却施設において、ごみ収集車がごみをごみピット内に投下している様子を示す図である。 ごみピット内を示す図である。 ごみ撮影装置によって撮影される画像を説明する図である。 ごみ画像から不適物を検出する処理の一例を示すフローチャートである。 静止画像からの物体検出処理の一例を示すフローチャートである。 静止画像からの物体検出結果を保存する際のデータ構造の例を示す図である。 根付きグラフの例を示す図である。 根付きグラフに関する情報を保存する際のデータ構造の一例を示す図である。 節点作成処理の一例を示すフローチャートである。 節点接続処理の一例を示すフローチャートである。 動画像からの物体検出処理の一例を示すフローチャートである。 目視確認のための処理を説明する図である。 不適物の画像を表示させる処理を説明する図である。 物体検出に使用する学習済みモデルが相違することにより、同じ物体の回転角度が異なって検出される例を示す図である。
近年、ごみ焼却施設への焼却不適物(以下、単に不適物と呼ぶ)の投入が問題となっている。不適物が焼却炉に投入されることで、焼却炉における燃焼の悪化、焼却炉の灰出し設備での閉塞などが発生したり、場合によっては、焼却炉を緊急停止させたりすることもある。従来は、ごみ焼却施設の従業員が、収集したごみをランダムに選択し、選択したごみに不適物が含まれていないかを手作業で確認しており、作業員の負担が大きかった。
また、ごみ焼却施設へ運搬される不適物を減らすために、ごみを収集する担当者に注意喚起しようとした場合、運搬されたごみの中から不適物を検出して、検出された不適物を収集の担当者に提示するシステムが必要となる。この場合、実際には不適物ではないものを、不適物であるとして提示することは好ましくない。また、撮影した画像をそのまま担当者に見せる場合、不適物がどのタイミングでどの位置に写っているかを把握しにくいため好ましくない。
本発明の一実施形態に係る情報処理装置1は、上記のような問題点を解決できるものである。情報処理装置1は、ごみ焼却施設に搬入されたごみから不適物を検出する機能を備えている。具体的には、情報処理装置1は、ごみピットに投入される途中のごみを撮影した画像を用いて、不適物を検出する。なお、ごみピットについては図4に基づいて後述する。また、不適物はごみの投下後に検出してもよい。また、不適物とは、ごみ焼却施設に設けられた焼却炉で焼却すべきでない物体である。不適物の具体例については後述する。
〔システム構成〕
本実施形態に係る不適物検出システムの構成を図2に基づいて説明する。図2は、不適物検出システム100の構成例を示すブロック図である。不適物検出システム100は、情報処理装置1、ごみ撮影装置2、車両情報収集装置3、選択表示装置4、および不適物表示装置5を含む。
また、図2には、情報処理装置1のハードウェア構成の例についても示している。図示のように、情報処理装置1は、制御部10、高速記憶部11、大容量記憶部12、画像IF(インタフェース)部13、車両情報IF部14、選択表示IF部15、不適物表示IF部16を備えている。情報処理装置1は、一例として、パーソナルコンピュータ、サーバー、またはワークステーションであってもよい。
制御部10は、情報処理装置1の各部を統括して制御するものである。図1に基づいて後述する制御部10の各部の機能は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現することもできるし、ソフトウェアによって実現することもできる。このソフトウェアには、コンピュータを後述する物体検出部、入替部、および同一性判定部として機能させる同一性判定プログラムが含まれていてもよい。ソフトウェアによって実現する場合、制御部10は、例えばCPU(Central Processing Unit)で構成してもよいし、GPU(Graphics Processing Unit)で構成してもよく、これらの組み合わせで構成してもよい。また、この場合、上記ソフトウェアは、大容量記憶部12に保存しておく。そして、制御部10は、上記ソフトウェアを高速記憶部11に読み込んで実行する。
高速記憶部11と大容量記憶部12は、何れも情報処理装置1が使用する各種データを記憶する記憶装置である。高速記憶部11は大容量記憶部12と比べて高速でデータの書き込みおよび読出しが可能な記憶装置である。大容量記憶部12は高速記憶部11と比べてデータの記憶容量が大きい。高速記憶部11としては、例えばSDRAM(Synchronous Dynamic Random-Access Memory)等の高速アクセスメモリを適用することもできる。また、大容量記憶部12としては、例えばHDD(Hard Disk Drive)、SSD(Solid-State Drive)、SD(Secure Digital)カード、あるいはeMMC(embedded Multi-Media Controller)等を適用することもできる。
画像IF部13は、ごみ撮影装置2と情報処理装置1とを通信接続するためのインタフェースである。また、車両情報IF部14は、車両情報収集装置3と情報処理装置1とを通信接続するためのインタフェースである。これらのIF部は、有線通信用のものであってもよいし、無線通信用のものであってもよい。例えば、これらのIF部として、USB(Universal Serial Bus)、LAN(Local-Area Network)や無線LAN等を適用することもできる。
選択表示IF部15は、選択表示装置4と情報処理装置1とを通信接続するためのインタフェースである。また、不適物表示IF部16は、不適物表示装置5と情報処理装置1とを通信接続するためのインタフェースである。これらのIF部も、有線通信用のものであってもよいし、無線通信用のものであってもよい。例えば、これらのIF部として、HDMI(High-Definition Multimedia Interface、登録商標)、DisplayPort、DVI(Digital Visual Interface)、VGA(Video Graphics Array)端子、S端子、あるいはRCA端子等を適用することもできる。
ごみ撮影装置2は、ごみピットに投下される途中のごみを撮影し、撮影画像を情報処理装置1へ送信する。以降、この撮影画像をごみ画像と呼ぶ。一例として、ごみ撮影装置2は、動画を撮影するハイスピードシャッターカメラであってもよい。なお、ごみ画像は、動画像であってもよいし、連続して撮影された時系列の静止画像であってもよい。ごみ画像は、画像IF部13を介して情報処理装置1に入力される。そして、入力されたごみ画像は、そのまま制御部10で処理することもできるし、高速記憶部11あるいは大容量記憶部12に保存した後で、制御部10で処理することもできる。
車両情報収集装置3は、ごみを搬入し、該ごみをごみピット内に投下する車両(いわゆるごみ収集車)の識別情報を収集して情報処理装置1へ送信する。なお、ごみ収集車によるごみピットへのごみの投下については図4に基づいて後述する。この識別情報は、搬入車両特定部107が、ごみの搬入主体を特定するために使用される。上記識別情報は、例えば、ナンバープレートのナンバー等を示す情報であってもよい。この場合、車両情報収集装置3は、ナンバープレートを撮影し、撮影した画像を識別情報として情報処理装置1へ送信するものであってもよい。また、車両情報収集装置3は、ごみ収集車200の識別情報の入力を受け付けて情報処理装置1へ送信するものであってもよい。
選択表示装置4は、情報処理装置1が検出した不適物の画像を表示する。不適物検出システム100では、情報処理装置1が、不適物ではないものを不適物と誤判定する可能性を考慮して、情報処理装置1が検出した不適物の画像を選択表示装置4に表示させて、その画像に写っているものが不適物であるか否かを目視確認させる。そして、目視確認の担当者は、選択表示装置4に表示された画像の中から、不適物が写っている画像を選定する。
不適物表示装置5は、情報処理装置1が検出した不適物の画像のうち、選択表示装置4を介して選定された不適物の画像、すなわち不適物が写っていることが目視確認された画像を表示する。不適物表示装置5は、上記不適物を搬入した担当者や事業者等への注意喚起のために上記画像を表示する。
〔ごみ画像の撮影〕
図3は、ごみ焼却施設において、ごみ収集車200がごみをごみピット内に投下している様子を示す図である。図4は、ごみピット内を示す図である。ごみピットは、ごみ焼却施設に収集されたごみを一時的に格納する場所であり、ごみピット内のごみは順次焼却炉に送り込まれて焼却される。図3に示すように、ごみ焼却施設には扉300A、300Bといった複数の扉(以降、区別する必要が無い場合、扉300と総称する)が設けられている。また、図4に示すように、扉300の先にはごみピットが設けられている。つまり、扉300が開放されることで、ごみピットへごみを投下するための投下口が現れる。図3に示すように、ごみ収集車200は、投下口からごみをごみピット内に投下する。
ごみ撮影装置2は、図4のスロープ600を流れるごみを撮影可能な位置に取り付ける。例えば、図3および図4に示す取付箇所400にごみ撮影装置2を取り付けてもよい。取付箇所400は、各扉300の表面に位置しているから、取付箇所400にごみ撮影装置2を取り付けた場合、扉300が開いたときにごみ撮影装置2がスロープ600の上方に位置することになり、この位置がごみの撮影に好適である。無論、ごみ撮影装置2の取り付け箇所は、スロープ600を流れるごみを撮影可能な任意の位置とすることができる。
また、車両情報収集装置3が撮影装置である場合、車両情報収集装置3も取付箇所400に取り付けてもよい。ごみ収集車200が扉300に接近する段階では、扉300が閉まっているため、取付箇所400に取り付けた車両情報収集装置3からごみ収集車200のナンバープレート等を撮影することができる。無論、車両情報収集装置3の取り付け箇所は、ごみ収集車200を撮影可能な任意の位置とすることができ、ごみ撮影装置2とは異なる箇所に取り付けてもよい。また、車両情報収集装置3は、例えば情報の入力装置であってもよく、この場合、車両情報収集装置3をオペレータルームに取り付けて、オペレータによるごみ収集車200の識別情報の入力を受け付ける構成としてもよい。
図5は、ごみ撮影装置2によって撮影される画像を説明する図である。同図の画像610は、不適物である板620がスロープ600を滑り落ちる様子を撮影した動画像から抽出したフレーム画像610a~610hを合成した画像である。各フレーム画像610a~610hに写った板620を、図5ではそれぞれ620a~620hとしている。なお、同図における上下方向をY軸方向、上向き方向をY軸の正の向きとし、左右方向をX軸方向、右向きをX軸の正の向きとする。
また、図5の左下にはフレーム画像610aを示し、右下にはフレーム画像610fを示している。フレーム画像610aに写る板620aと、フレーム画像610fに写る板620fは、何れも同一の板620が撮影されたものであるが、その写る位置、回転角度、および大きさが異なっている。大きさが異なっている理由は、スロープ600が傾斜しており、スロープ600の下流側ほどごみ撮影装置2から離れた位置となるためである。詳細は後述するが、情報処理装置1によれば、このような位置、回転角度、および大きさの変化を考慮して、フレーム画像610a~610hから検出した板620a~620hの同一性を判定することが可能である。
また、画像610における板620dは白飛びしている。フレーム画像610dの撮影時に、板620とその周囲に強い光が当たったときなどには、その部分が白飛びした画像となり、そのような画像からは板620が検出できないことがある。板620が一時的に他のごみ等に隠れた状態となる場合も同様に、一部のフレーム画像から板620が検出できないことがある。詳細は後述するが、情報処理装置1によれば、一部のフレーム画像から物体検出できなかった場合であっても、その前後のフレーム画像から物体検出できていれば、その物体を正しく検出することができる。
〔装置構成〕
情報処理装置1の構成を図1に基づいて説明する。図1は、情報処理装置1の制御部10の機能ブロック図の一例である。図1に示す制御部10には、物体検出部101、グラフ生成部102、入替部103、同一性判定部104、動画物体検出部105、選択表示制御部106、搬入車両特定部107、および不適物表示制御部108が含まれている。
物体検出部101は、時系列で撮影された複数の画像のそれぞれから物体を検出する。また、物体検出部101は、検出物の物体情報も検出する。この物体情報には、検出物の縦幅および横幅を示す情報が含まれている。この他にも、物体情報には、検出物の回転角度を示す情報、検出物の位置情報、および検出物の分類を示す分類情報等が含まれていてもよい。
物体検出部101は、例えばニューラルネットワーク等の機械学習済みモデルにより、物体を検出するものであってもよい。この場合、各不適物の画像を教師データとした機械学習により算出された重み値等を大容量記憶部12等に記憶しておき、物体検出部101が物体検出時にその重み値等を読み出す構成とすればよい。なお、不適物に加えて、外観が不適物に類似した類似物も検出対象として学習させてもよい。これにより、不適物の検出精度を向上させることができる。また、機械学習の際に、検出物の分類等についても学習させることができる。
上記のような学習済みモデルを用いる場合、物体検出部101は、学習済みモデルにごみ画像を入力して得た出力値に基づき、該画像から検出された物体の物体情報を生成し、出力する。また、物体検出部101は、検出結果の確度を示す確率値を出力する。
グラフ生成部102は、物体検出部101の検出結果に基づいて根付きグラフを生成する。詳細は後述するが、根付きグラフは、動画像から抽出された各フレーム画像からの物体検出部101による物体検出結果に基づいて生成される。
入替部103は、同一性判定部104による同一性判定の対象となる2つの物体についての物体検出部101の検出結果のうち、何れか一方の物体の縦幅と横幅の値を入れ替える。入替部103がこの入れ替えを行った場合、同一性判定部104は、入れ替え後の縦幅と横幅の値に基づいて同一性の判定を行う。
同一性判定部104は、時系列の複数の画像の1つから物体検出部101が検出した物体と、上記時系列の複数の画像の他の1つから検出された物体とが同一の物体であるか否かを判定する。
動画物体検出部105は、グラフ生成部102が生成する根付きグラフを用いて、動画像から物体を検出する。物体検出部101が単体の画像から物体を検出するのに対し、動画物体検出部105は、複数の画像からの物体検出結果に基づいて、動画像に写る物体を検出する点でこれらの検出部は相違している。動画像からの物体検出の詳細は後述する。
選択表示制御部106は、動画物体検出部105が検出した物体の画像を選択表示装置4に表示させる。目視確認の担当者は、表示された画像に不適物が写っているかを確認し、不適物が写っている画像を選定する。そして、選択表示制御部106は、目視確認の担当者による画像の選定を受け付ける。
搬入車両特定部107は、車両情報収集装置3から受信する識別情報を用いてごみの搬入車両(例えば図3のごみ収集車200)を特定する。そして、不適物表示制御部108は搬入車両特定部107が特定した搬入車両が過去に搬入したごみから情報処理装置1が不適物を検出していた場合、上記不適物の画像を不適物表示装置5に表示させる。これにより、当該搬入車両でごみを搬入した担当者に対して不適物の画像を提示して注意喚起することができる。
以上のように、情報処理装置1は、時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部101と、上記複数の画像の1つから検出された物体と、上記複数の画像のうち他の1つから検出された物体とが同一の物体であるか否かを判定する同一性判定部104と、上記の2つの物体の縦幅と横幅の値を入れ替える入替部103と、を備えている。そして、入替部103が上記の入れ替えを行った場合、同一性判定部104は、入れ替え後の縦幅と横幅の値に基づいて同一性の判定を行う。これにより、物体の縦と横を判定する基準となる軸が90°ずれたときにも、物体の同一性を正しく判定することができるので、時系列の複数の画像でそれぞれ検出された物体の同一性の判定精度を高めることができる。
〔全体の処理の流れ〕
図6は、ごみ画像から不適物を検出する処理の一例を示すフローチャートである。この処理を行う前提として、ごみ撮影装置2で撮影されたごみ画像のファイルが大容量記憶部12に保存されているとする。また、上記ファイルは動画ファイルであるとする。なお、動画ファイルの代わりに、時系列の複数の静止画ファイルを用いてもよい。この場合、使用する静止画ファイルは、例えば大容量記憶部12に保存されたファイルリストで管理されていてもよい。また、使用する静止画ファイルを大容量記憶部12の所定のディレクトリにまとめて格納しておいてもよい。以下の説明では、動画ファイルおよび静止画ファイルを単に動画像および静止画像と表記する場合がある。
S200では、情報処理装置1は、静止画像からの物体検出処理を行う。詳細は図7に基づいて後述するが、物体検出処理では、上記動画像から抽出された全ての静止画像、すなわち全フレーム画像から物体の検出が行われる。
情報処理装置1は、S300において節点作成処理を行い、S600において節点接続処理を行う。これらの処理により、図9に示すような根付きグラフが作成される。物体検出処理の詳細は図10に基づいて後述し、節点接続処理の詳細は図11に基づいて後述する。
S800では、情報処理装置1は、動画像からの物体検出処理を行う。詳細は図13に基づいて後述するが、S800の判定には上記根付きグラフが用いられる。S800の処理が終了することにより、図6の全処理は終了する。
なお、図6の処理では、S200、S300、S600、S800を順番(直列)に処理する。すなわち、動画ファイル全体をS200で確認し、次に根付きグラフをS300とS600で作成して、最後にS800で根付きグラフを用いて物体を検出している。撮影が終了した動画像からではなく、撮影中の画像から物体検出を行う場合、S200、S300、S600、およびS800の内部処理を並列に行えばよい。並列処理の詳細は省略する。
〔静止画像からの物体検出処理の流れ〕
図6のS200における物体検出処理の詳細を図7に基づいて説明する。図7は、静止画像からの物体検出処理の一例を示すフローチャートである。物体検出処理は、同一性判定方法の前段部分である。
S220では、物体検出部101は、初期化処理を行う。初期化処理の具体例は図8に基づいて後述する。続いてS230では、物体検出部101は、動画ファイルから物体検出の対象とする次の静止画像を取得する。なお、初期化処理の直後であれば、物体検出部101は、動画像における最初の静止画像を取得する。
S240(物体検出ステップ)では、物体検出部101は、S230で取得した静止画像から物体検出を行い、その検出結果を保存する。保存先は例えば高速記憶部11である。そして、S250では、物体検出部101は、物体検出処理を終了するか否かを判定する。具体的には、物体検出部101は、動画像から抽出した静止画像の全てについて物体検出を行っていれば物体検出処理を終了する(S250でYES)と判定し、物体検出を行っていない静止画像があれば終了しない(S250でNO)と判定する。S250でYESと判定された場合にはS200における処理は終了し、S250でNOと判定された場合にはS230の処理に戻る。S200における処理が終了すると、S300の処理である節点作成処理が行われる。
〔静止画像からの物体検出結果を保存する際のデータ構造例〕
S240では、例えば図8に示すデータ構造で物体検出結果を保存してもよい。図8は、静止画像からの物体検出結果を保存する際のデータ構造の例を示す図である。図8のデータ構造は、検出配列110および検出数111の配列を含む。また、このデータ構造には、動画中の画像数を示す情報112と、分類数を示す情報113も含まれる。
検出配列110は、三次元(画像番号、検出した物体の識別情報、検出番号)のデータ構造の配列である。検出数111は、二次元のデータ構造であり、検出配列110の識別情報内の検出数を示す。
上記画像番号は、動画像から抽出した各静止画像の識別番号であり、例えば図7のS230で取得された順に画像番号を設定してもよい。図8の例では、検出した物体の識別情報として、0~4の5通りの数値が記載されている。これらの数値は、検出した物体の分類を示している。例えば、識別情報0~4は、検出された物体の分類が、段ボール、板、木、ござ、および長尺物であることを示すものであってもよい。この場合、物体検出部101は、これらの各分類に該当する物体を検出できるように機械学習した学習済みモデルを用いる。なお、これらの分類のうち、段ボールは不適物ではないが、段ボールと板を区別するために(段ボールに似ている板の誤検出を防ぐために)分類に含めている。
検出配列110には、検出物の回転、検出物の中心位置座標、検出物の大きさ(横幅と縦幅)、および検出物の確率を示す情報が含まれる。これらの情報のうち、回転、中心位置、および大きさは、学習時に与えた情報を元に計算される。検出物の回転は、例えば基準軸に対する検出物の回転角度で表してもよい。角度の単位は°(度)であってもよいし、ラジアンであってもよい。また、確率は、検出物結果の確からしさを示す数値である。この確率は、検出物の画像を元に検出物がどの程度の確率で分類された物体を表現できているのかを示す0~1の数値であってもよい。
中心位置は、画像上のピクセルで表してもよい。また、例えば(画像上のピクセル)/(画像のピクセル幅)の値で表してもよい。この場合、中心位置座標の値は、0~1の範囲となる。この他にも、例えば射影変換等を用いてピクセル値を例えばmm等の実寸法に変換した数値で中心位置を表してもよい。なお、同じ物体が複数回検出(例えば別の分類の物体)されることもあるとする。
図8のデータ構造を適用する場合、図7のS220における初期化処理では、物体検出部101は、例えば、検出配列110と検出数111を空に設定し、画像数を示す情報112の値を0に設定し、分類数を示す情報113の値を設定する。例えば、検出物の識別情報が0~4の5通りであれば情報113の値は5となる。なお、利用する分類情報は例えば大容量記憶部12に保存されているファイルから取得してもよい。また、動画像から取得する静止画像の数が事前に確認できる場合、S220で全ての静止画像に対応する領域を確保してもよい。
また、S240では、物体検出部101は、物体検出により検出された情報を元に検出配列110および検出数111を更新する。具体的には、物体検出部101は、検出配列110および検出数111に、直前のS230の処理で取得した静止画像のための領域を増やす。検出配列110では、一次元目には画像数112目の領域を追加し、二次元目には分類数113を追加し、三次元目には分類毎の検出数のデータ構造を追加する。なお、画像数と分類数は、図8の112および113の情報を参照して特定する。そして、物体検出部101は、検出された物体毎の情報を検出配列110に追加した領域に更新する。
検出数111については、物体検出部101は、一次元目には画像数112目の領域を追加し、二次元目には分類数113を追加する。そして、物体検出部101は、検出された分類毎の物体数を更新する。最後に、物体検出部101は、画像数を示す情報112に1を加算する。
〔根付きグラフの例〕
図9は、S300とS600の処理により作成される根付きグラフの例を示す図である。根付きグラフは、節点を枝で結んだ構成のグラフであり、検出物の分類毎に作成される。図9では、物体Aのグラフ0とグラフ2が例示されていると共に、物体Bのグラフ1が例示されている。
根付きグラフは、節点を作成するS300の処理と、作成した接点のうち同一の物体に対応する節点を枝で接続するS600の処理という2段階の処理で作成される。複数のフレーム画像のそれぞれで検出された物体が節点とされる。図9の例では、動画像から抽出した静止画像であるフレーム画像を、その画像番号の昇順で上から下に並べている。また、節点には、上から順に0~24の番号を付している。図5に示したような、ごみがスロープ600を滑り落ちていく様子を撮影した動画像から抽出した静止画像を使用する場合、1つのグラフを構成する節点は、上側の節点ほどスロープ600の上流側での検出を示す。なお、画像を図9とは逆の順序、すなわち画像番号の降順で配列してもよく、この場合グラフの下側がスロープ600の上流側に対応することになる。
1つのグラフを構成する節点のうち、最も上流側の節点を根と呼ぶ。また、ある節点と接続されている節点のうち、上記ある節点の上流側に位置する節点を親節点と呼び、下流側に位置する節点を子節点と呼ぶ。
図9の例では、画像番号が2つ違いの画像における同一物体に対応する節点を枝で接続していると共に、画像番号が1つ違いの画像における同一物体に対応する節点を枝で接続している。つまり、同一性判定部104が同一であると判定した物体に対応する節点を結ぶ線分が枝である。例えば、物体Aの節点0については、画像1における節点1および2とそれぞれ枝で接続していると共に、画像2における節点4と枝で接続している。
動画物体検出部105は、上記のようにして生成した根付きグラフを用いて、所定数以上連続するフレーム画像から物体検出する。この場合、動画物体検出部105は、物体が検出されなかったフレーム画像があっても、その前後の所定範囲内のフレーム画像から物体が検出されているときにはその物体を検出する。
したがって、一部のフレーム画像で物体が検出されなかった場合であっても、その物体が動画像に写っていると正しく検出することができる。例えば、図5の画像610に示される板620dは検出が困難であるが、その前後のフレーム画像における板620cおよび板620eは検出可能である。よって、物体検出部101が板620dを検出できなかった場合であっても、これらのフレーム画像からなる動画像に板620が写っていると正しく検出することができる。なお、上記所定範囲は、検出対象物の移動速度、動画像のフレームレート、およびフレーム画像の時間間隔等に応じて設定すればよい。
根付きグラフの生成において、1つの親節点に対して、1つのフレーム画像から複数の子節点が検出されることがある。例えば、図9の例では、親節点0に対し、画像1から子節点1と子節点2が検出されている。このような場合、子節点1と子節点2の何れかが誤検出である。
動画物体検出部105は、グラフ生成部102が生成した上記のような根付きグラフにおいて、枝で結ばれた節点が検出されたフレーム画像が所定数以上連続している場合に、当該節点に対応する物体を、動画像に写る物体として検出してもよい。誤検出が複数フレーム以上続く確率は低いため、この構成によれば、動画像からの物体の誤検出の可能性を低減することができる。
図9の例では、上記所定数を5としている。この場合、動画物体検出部105は、下記の関係式が成立する根付きグラフの物体を検出する。
(一番下の節点の画像番号)―(根の節点の画像番号)≧4
上記関係式の右辺の数値は、検出対象物の移動速度、動画像のフレームレート、およびフレーム画像の時間間隔等に応じて設定すればよい。上記の関係式を用いて物体検出する場合、動画物体検出部105が物体を検出するのは、図9の根付きグラフのうちグラフ0のみとなる。
〔根付きグラフに関する情報を保存する際のデータ構造例〕
図10は、根付きグラフに関する情報を保存する際のデータ構造の一例を示す図である。図10に示す各種データは、例えば高速記憶部11に保存される。図10のデータ構造には、節点配列115と節点数を示す情報116が含まれている。また、節点配列115は、各節点に付与した節点番号により各節点を識別して管理する構成となっている。そして、各節点について、親節点番号と、当該節点の検出配列の特定情報、子節点の検出配列の特定情報の配列、および子節点番号の配列を示す情報が対応付けられている。
このようなデータ構造により、作成された各節点と、その親節点および子節点を表すことができる。つまり、図10のデータ構造によれば、図9のような根付きグラフの構成を表すことができる。無論、根付きグラフを表すデータ構造は任意であり、図10の例に限られない。
〔節点作成処理の流れ〕
図11に基づいて節点作成処理の流れを説明する。図11は、節点作成処理(同一性判定方法)の一例を示すフローチャートである。なお、図10のデータ構造を採用する場合の処理を説明する。
S320では、グラフ生成部102は、初期化処理を行う。例えば、グラフ生成部102は、初期化処理として、図10のデータ構造における節点配列115を空に設定し、節点数を示す情報116の値を0に設定し、処理の対象とする画像番号である現画像番号を1に設定する処理を行ってもよい。
S330では、グラフ生成部102は、古画像の画像番号である古画像番号を決定する。詳細は以下説明するが、現画像番号の画像から検出された物体と、古画像番号の画像から検出された物体との同一性が判定され、同一であると判定された物体に対応する節点が、1つの根付きグラフの構成要素として特定される。
図11の例では、現画像番号から2を減算して古画像番号としている。この場合、動画像から抽出されたフレーム画像のうち、画像番号が2つ違いのフレーム画像までが同一性の判定の対象となる。図9に基づいて説明したように、同一性の判定の範囲をどの程度に設定するかは任意であり、S330で現画像番号から減じる値も任意である。なお、現画像番号から所定の値を減じたときに負の値となった場合には、古画像番号を0に設定する。
S340では、グラフ生成部102は、処理対象とする分類の識別番号(以下、分類識別番号と呼ぶ)を0に設定する。続いて、S350では、グラフ生成部102は、現画像と古画像の検出結果を取得して、現検出番号を0に設定する。より詳細には、グラフ生成部102は、図6のS200における物体検出処理の検出結果のうち、現画像と古画像からの、分類識別番号が0の物体の検出結果を取得する。なお、これらの検出結果は、例えば図8に示すような検出配列110から取得すればよい。
S360では、グラフ生成部102は、未処理の現検出結果がまだあるか否かを判定する。具体的には、グラフ生成部102は、現検出番号がS350で取得した全現検出結果数未満であるか否かを判定する。この判定結果が真の場合には未処理の現検出結果がある(つまりS360の判定結果がYESである)ためS370の処理に遷移する。一方、偽の場合にはS360の判定結果はNOとなり、S440の処理に遷移する。
S370では、グラフ生成部102は、現検出番号を用いて現検出結果を取得して、古検出番号を0に設定する。そして、S380では、グラフ生成部102は、未処理の古検出結果がまだあるか否かを判定する。具体的には、グラフ生成部102は、古検出番号がS350で取得した古現検出結果数未満であるか否かを判定する。この判定結果が真の場合には未処理の古検出結果がある(つまりS380の判定結果がYESである)ためS390の処理に遷移する。一方、偽の場合にはS380の判定結果はNOとなり、S430の処理に遷移する。
S390では、同一性判定部104が、現検出番号の検出結果が示す検出物と、古検出番号の検出結果が示す検出物とが、同物体であるか否かを判定するための条件を確認する。この条件は、例えば検出物の大きさ、回転角度、および位置に関するものであってもよい。例えば、同一性判定部104は、S390では、下記の値を算出してもよい。
角度差= 古検出の回転角度 - 現検出の回転角度
X差 = 古検出のx座標値 - 現検出のx座標値
Y差 = 古検出のy座標値 - 現検出のy座標値
横幅比= 古検出の横幅 / 現検出の横幅
縦幅比= 古検出の縦幅 / 現検出の縦幅
そして、同一性判定部104は、上記の値が下記の条件を充足するか否かにより同一性を判定してもよい。なお、下記の各条件における不等号は、等号付き不等号に置き換えてもよい。
角度条件: 角度差の絶対値 < 角度閾値
X条件 : X閾値の下限値 < X差 < X閾値の上限値
Y条件 : Y差の絶対値 < Y閾値
横幅条件: 横幅比の下限値 < 横幅比 < 横幅比の上限値
縦幅条件: 縦幅比の下限値 < 縦幅比 < 縦幅比の上限値
図5に示したように、スロープ600の下流側(画像におけるX軸の負の方向)に進むほど、物体は小さく写る。このため、上記の横幅および縦幅の上限値および下限値を、画像番号の大きい画像程、小さい値としてもよい。これにより、誤検出が発生する可能性を低減することができる。
なお、X条件に絶対値がないのは、本例では図5のようにスロープ600上の物体を検出対象としており、図5の画像610上では物体は右(X値がより大きい)から左に移動するためである。一方、スロープ600上の物体は、Y軸方向においては正の向き(上向き)にも負の向き(下向き)にも移動し得るため、Y条件には絶対値がある。このように、画像において物体の移動方向に制約がある場合には、その制約に応じた条件を設定することにより、誤検出が発生する可能性を低減することができる。
以上のように、物体検出部101が、同一性の判定対象とする2つの物体の位置情報(上記の例ではX値とY値)を検出する場合、同一性判定部104は、それらの位置情報が所定の関係にあることを条件として、当該2つの物体が同一の物体であると判定する。これにより、上述のとおり誤検出が発生する可能性を低減することができる。
なお、上記の各閾値は、例えば動画ファイルのフレームレート(fps)やスロープ600上での物体の移動の速さ等により調整してもよい。例えば、上記の閾値を画像番号の差(現画像番号から古画像番号を減算した値)に比例する値としてもよい。例えば、10°に画像番号の差を乗じた値を角度閾値としてもよい。また、X閾値(下限、上限)、Y閾値、横幅閾値(下限、上限)、および縦幅閾値(下限、上限)は、さらに用いた単位(例えばピクセル、または変換したmm等)に依存する。
なお、物体検出部101は、検出物の回転角度を検出してもよいし、回転角度の正弦すなわちsine(角度)の値を検出してもよい。この場合、回転角度の検出値から角度を算出して上述の角度条件の判定を行ってもよいし、回転角度の正弦の値を用いて判定できるように上述の角度条件の方を変更してもよい。同様に、回転角度の余弦(cosine)または正接(tan)を用いてもよいし、それらの組み合わせを用いてもよい。例えば、物体検出部101が回転角度をsine(角度)とcosine(角度)の組み合わせとして検出した場合、角度条件を充足するか否かは、arcsine(検出情報)とarccosine(検出情報)の両方または平均で確認をしてもよい。
S392では、入替部103が、縦幅と横幅の入れ替えを行うか否かを判定する。例えば、入替部103は、上記の角度差の絶対値が、所定の閾値(以下、入替閾値と呼ぶ)以上であるか否かによって上記判定を行ってもよい。この場合、入替部103は、角度差の絶対値が入替閾値以上であれば入れ替えを行う(S392でYES)と判定し、角度差の絶対値が入替閾値未満であれば入れ替えは行わない(S392でNO)と判定する。入れ替えは、図16に基づいて説明した回転角度の検出値が90°ずれる場合に行うことが望ましい。このため、入替閾値は、例えば60°に設定してもよい。S392において、入れ替えを行うと判定された場合にはS394の処理に遷移し、入れ替えを行わないと判定された場合にはS400の処理に遷移する。
このように、入替部103は、同一性の判定対象とする2つの物体の回転角度の差が所定の閾値(入替閾値)以上である場合に、当該物体の一方の縦幅と横幅とを入れ替える。これにより、回転角度の差からみて、当該回転角度を算出する基準となる軸の向きが90°異なっている可能性の高い状態において入れ替えを行うという効率的な処理が実現できる。なお、効率性を求めなければ、同一性判定部104は、同一性の判定において、入替部103による入れ替えを行う前と後とで2回の判定を行い、何れかの判定結果が同一であれば同一と判定する構成としてもよい。
S394(入替ステップ)では、入替部103は、縦幅と横幅の入れ替えを行う。また、同一性判定部104は、上記の角度差の絶対値の調整を行う。具体的には、入替部103は、現検出番号の検出結果が示す検出物と、古検出番号の検出結果が示す検出物の何れかについて、縦幅と横幅の入れ替えを行う。そして、入替部103は、入れ替え後の縦幅値と横幅値を用いて、横幅条件と縦幅条件が充足されるか否かの判定を同一性判定部104に行わせる。また、同一性判定部104は、上記の角度差の絶対値から90°減算した値を用いて角度条件が充足されるか否かを判定する。
このように、物体検出部101が、物体の回転角度を検出する場合、同一性判定部104は、物体の回転角度の差を90°補正した値と、入替部103が入れ替えた縦幅および横幅の値と、に基づいて同一の物体であるか否かを判定する。これにより、同一性の判定対象である2つの物体の回転角度を検出する際の基準軸が90°ずれている場合にも、実際の回転角度の差異を適切に考慮して物体の同一性を正しく判定することができる。
例えば、図16に示した学習済みモデルbによる検出結果に基づいて同一性を判定する場合、入替部103は、ボックス1120bの縦幅と横幅を入れ替えてもよい。この場合、同一性判定部104は、ボックス1020bの縦幅(32)および横幅(10)と、上記入れ替え後におけるボックス1120bの縦幅(32)および横幅(10)に基づいて上述の条件が充足されているか判定する。また、同一性判定部104は、ボックス1020bの角度(-9°)とボックス1120bの角度(97°)との差の絶対値から90°減算した値である16°に基づいて上述の条件が充足されているか判定する。これにより、ボックス1020bの物体と、ボックス1120bの物体とが同一の物体であると正しく判定することができる。
なお、物体検出部101が検出物の回転角度を示す情報として、sine(角度)とcosine(角度)を出力する場合、入替部103は、出力されたsine(角度)とcosine(角度)を入れ替えればよい。また、物体の回転角度の差を90°補正する代わりに、同一性の判定対象とする2つの物体の一方の回転角度を90°補正した後、両物体の回転角度の差を算出してもよい。なお、回転角度を考慮せずに物体の同一性を判定することも可能である。
S400(同一性判定ステップ)では、同一性判定部104は、現検出番号の検出結果に示される物体と、古検出番号の検出結果に示される物体と、が同一の物体であるか否かを判定する。例えば、同一性判定部104は、S390の全ての条件(角度、X、Y、横幅、および縦幅の各条件)が真の場合に同一の物体である(S400でYES)と判定し、真ではない条件が存在する場合には同一の物体ではない(S400でNO)と判定してもよい。なお、S394で調整が行われていた場合には、同一性判定部104は、調整後の値を用いてS390の条件を充足するか否かを判定する。S400でYESと判定された場合にはS410に遷移し、S400でNOと判定された場合にはS420に遷移する。
なお、同一性判定部104は、S390の一部の条件のみを確認してもよい。例えば、同一性判定部104は、回転しない物体の同一性を判定する場合、角度条件を考慮する必要はない。また、X方向に移動しない物体の同一性を判定する場合、X条件の確認は不要であり、Y方向に移動しない物体の同一性を判定する場合、Y条件の確認は不要である。
S410では、グラフ生成部102は、根付きグラフの節点を更新する。例えば、グラフ生成部102は、(1)S400の判定結果に基づいて情報を追加する節点である情報追加節点を検出または追加し、(2)その情報追加節点に対して情報を追加するという2段階の手順で根付きグラフの節点を更新してもよい。
この場合、グラフ生成部102は、節点配列115中の全ての節点に対して古検出が存在するか否かを確認する。なお、節点の総数は、節点数を示す情報116に示されている。すなわち、グラフ生成部102は、各節点について下記の何れかの条件が充足された場合に、古検出が存在すると判定する。
節点配列115に示される画像番号が古画像番号と一致する。
節点配列115に示される検出物の分類識別が分類識別番号に一致する。
節点配列115に示される識別情報内の検出番号が古検出番号に一致する。
そして、グラフ生成部102は、古検出が存在する、すなわち上記3つの条件の何れかが充足されると判定した節点を情報追加節点とする。なお、1回のS410の処理では、1つの情報追加節点に対して後述の各情報を追加するので、節点配列115中の何れかの節点を情報追加節点とした後は、残りの節点について確認する必要はない。
グラフ生成部102は、節点配列115中の全ての節点について上記の確認を行っても、古検出が存在する節点が検出されなかった場合、グラフ生成部102は、節点配列115に新たな節点を追加し、追加した節点を情報追加節点とする。また、グラフ生成部102は、節点数を示す情報116の値に1を加算する。そして、グラフ生成部102は、節点配列115に追加した情報追加節点に対し、下記の情報を追加する。
動画中の画像番号=古画像番号
検出物の分類識別=分類識別番号
識別情報内の検出番号=古検出番号
なお、親節点番号と子節点番号の配列の全項目は未設定にする。すなわち、これらの配列の全項目が未設定項になる。なお、未設定であることは例えば「-1」等の値で表してもよい。
そして、グラフ生成部102は、上述のようにして検出又は追加した情報追加節点について、節点配列115における子節点の検出配列の特定情報のうち、未設定の項目に対して下記の情報を追加する。
画像番号=現画像番号
検出物の分類識別=分類識別番号
識別情報内の検出番号=現検出番号
S420では、グラフ生成部102は、古検出番号に1を加算し、この後、S380の処理に戻る。また、S430では、グラフ生成部102は、現検出番号に1を加算し、この後、S360の処理に戻る。また、S440では、グラフ生成部102は、分類識別番号に1を加算し、その後処理はS450に遷移する。
S450では、グラフ生成部102は、全分類について判定が終了したか否かを判定する。具体的には、グラフ生成部102は、分類識別番号と分類数(図8において情報113で示される分類数)とを比較し、等しくない場合(S450でNO)にはS350の処理に戻り、等しい場合(S450でYES)にはS460の処理に進む。
S460では、グラフ生成部102は、古画像番号に1を加算し、その後処理はS470に遷移する。S470では、グラフ生成部102は、全ての古画像についての判定が終了したか否かを判定する。具体的には、グラフ生成部102は、古画像番号と現画像番号とを比較し、等しくない場合(S470でNO)にはS340の処理に戻り、等しい場合(S470でYES)にはS480の処理に進む。
S480では、グラフ生成部102は、現画像番号に1を加算し、その後処理はS490に遷移する。S490では、グラフ生成部102は、全ての画像を現画像とした判定が終了したか否かを判定する。具体的には、グラフ生成部102は、現画像番号と画像数(図8において情報112で示される画像数)とを比較し、等しくない場合(S490でNO)にはS330の処理に戻り、等しい場合(S490でYES)には図11の処理を終了する。図11の処理の終了後は、図6のS600の節点接続処理が行われる。
〔節点接続処理の流れ〕
図12に基づいて節点接続処理の流れを説明する。図12は、節点接続処理の一例を示すフローチャートである。節点接続処理では、上述の節点作成処理では未設定であった、節点配列115における親節点番号と子節点番号の配列を更新する。この更新が、節点を枝で接続することに相当する。
図12の例では、現節点番号、古節点番号、および子節点配列番号という3つの追加変数を用いる。これらの追加変数は、例えば高速記憶部11に保存される。
S620では、グラフ生成部102は、初期化処理を行う。例えば、初期化処理において、グラフ生成部102は、節点数から1を減算した値を現節点番号とする。なお、節点数は、図10に示したように、節点数を示す情報116から特定できる。また、S630では、グラフ生成部102は、現節点番号から1を減算した値を古節点番号とする。そして、S640では、グラフ生成部102は、子節点配列番号を0とする。
S650では、グラフ生成部102は、親子節点の確認、すなわち古節点の子節点が現節点と一致するか否かの確認を行う。具体的には、グラフ生成部102は、節点配列115の古節点番号目における子節点の検出配列の特定情報が、節点配列115の現節点番号目における子節点の検出配列の特定情報と一致するか否かを判定する。なお、子節点の検出配列の特定情報には、画像番号、検出物の分類識別、および識別情報内の検出番号が含まれる。これらの全てが一致した場合にはS650の判定結果はYESとなりS660に遷移する。一方、一致しないものがある場合には、S650の判定結果はNOとなりS670に遷移する。
S660では、グラフ生成部102は、親子節点の更新、すなわち親接点番号および子接点番号の配列の更新を行う。具体的には、グラフ生成部102は、節点配列115の古節点番号目の子節点番号の配列中、最初の未設定項を現節点番号に設定する。また、グラフ生成部102は、節点配列115の現節点番号目の親節点番号を古節点番号に設定する。
S670では、グラフ生成部102は、子節点配列番号に1を加算する。そして、S680では、グラフ生成部102は、子節点についての処理が終了したか否かを判定する。具体的には、グラフ生成部102は、子節点配列番号が、節点配列115における子節点の検出配列の特定情報の配列の項目数より小さいか否かを判定する。そして、グラフ生成部102は、小さいと判定した場合(S680でNO)にはS650の処理に戻り、そうではない場合(S680でYES)にはS690の処理に進む。
S690では、グラフ生成部102は、古節点番号から1を減算する。そして、S700では、グラフ生成部102は、古節点についての処理が終了したか否かを判定する。具体的には、グラフ生成部102は、古節点番号が正の値であるか否かを判定する。そして、グラフ生成部102は、正の値であると判定した場合(S690でNO)にはS640の処理に戻り、そうではない場合(S690でYES)にはS710の処理に進む。
S710では、グラフ生成部102は、現節点番号から1を減算する。そして、S720では、グラフ生成部102は、現節点についての処理が終了したか否かを判定する。具体的には、グラフ生成部102は、現節点番号が正の値であるか否かを判定する。そして、グラフ生成部102は、正の値であると判定した場合(S720でNO)にはS630の処理に戻り、そうではない場合(S720でYES)には図12の処理を終了する。図12の処理の終了後は、図6のS800における動画像からの物体検出処理が行われる。なお、図12では、現節点番号および古節点番号を大きい数字から小さくして(1ずつ減算しながら)処理を行ったが、逆の処理(現節点番号および古節点番号の初期値を0として1ずつ加算する)としてもよい。
〔動画像からの物体検出処理の流れ〕
図13に基づいて動画像からの物体検出処理の流れを説明する。図13は、動画像からの物体検出処理の一例を示すフローチャートである。動画像からの物体検出処理では、上述のようにして作成した根付きグラフ、具体的には完成した節点配列115を用いて物体を検出する。この処理では、根付きグラフの長さ、すなわち根付きグラフの根から最新の節点までの画像数に基づいて物体が検出される。
S820では、動画物体検出部105は、初期化処理を行う。例えば、初期化処理において、動画物体検出部105は、古節点番号を0に設定する。続いてS830では、動画物体検出部105は、古節点番号の節点が根であるか否かを判定する。具体的には、動画物体検出部105は、節点配列115における古節点番号目の節点の親節点番号が未設定である場合にはS830でYESと判定してS840の処理に進み、設定されている場合にはS830でNOと判定してS880の処理に進む。
S840では、動画物体検出部105は、根付きグラフにおける最新の節点、すなわち枝で結ばれた一連の節点のうち、最も画像番号が大きいフレーム画像の節点を探索する。具体的には、動画物体検出部105は、古節点番号目から始まる根付きグラフの全節点を再帰的(詳細省略)に辿って一番新しい節点を探索する。そして、動画物体検出部105は、検出した最新の節点の節点番号を現節点番号とする。
S850では、動画物体検出部105は、節点配列115における現節点番号目の節点の検出配列の特定情報に設定されている画像番号と、節点配列115における古節点番号目の節点の検出配列の特定情報に設定されている画像番号との差分を算出する。そして、S860では、動画物体検出部105は、S850で算出した差分が4以上であるか否かを判定する。この判定の結果が4以上である場合(S860でYES)には物体が検出されたとしてS870に遷移し、4未満である場合(S860でNO)にはS880に遷移する。なお、判定の基準とした数値「4」は、図9に基づいて説明した通り、状況に応じて調整可能である。
S870では、動画物体検出部105は、検出された物体に関する情報を保存する。例えば、動画物体検出部105は、当該物体の検出に用いた根付きグラフの各節点に対応するフレーム画像と、当該物体の物体情報とを対応付けて保存してもよい。物体情報としては、図8に示した検出配列110に記述されている情報を保存してもよい。
S880では、動画物体検出部105は、古節点番号に1を加算する。そして、S890では、動画物体検出部105は、全ての古節点についての処理が終了したか否かを判定する。具体的には、動画物体検出部105は、古節点番号が節点数(節点数を示す情報116から特定した節点数)より小さいか否かを判定する。そして、動画物体検出部105は、小さいと判定した場合(S890でYES)にはS830の処理に戻り、そうではない場合(S890でNO)には図13の処理を終了する。なお、上記では複数の配列を用いた例を説明したが、配列の代わりに連結リストを用いてもよい。
なお、本例では分類毎に物体検出を行ったが、例えば板と木のように人間でも区別が難しい物体があり、これらの教師データ作成の際、人間の判断誤差も生じ得る。このため、物体検出の際、板と木の境界線が曖昧になり、同じ物体が画像により、板と判定されたり、木と判定されたりすることがある。この問題を改善するため、分類のグループ化を行って同物体検出を行ってもよい。これは、例えば板と木を一つのグループにして処理を行う、または不適物全てを一つのグループにまとめて処理を行うことである。
例えば、グラフ生成部102は、同一のグループに属する検出物の全てを節点として根付きグラフを作成してもよい。1つのグループには、例えば板と段ボール等のように誤検出される可能性のある物体を含めておけばよい。このようにして作成された根付きグラフを用いて物体を検出する場合、動画物体検出部105は、所定数以上連続するフレーム画像の中に、ある物体が検出されなかったフレーム画像が含まれている場合であっても、その物体が検出されなかったフレーム画像からその物体と同じグループに属する物体が検出されているときには、上記ある物体を動画像に写る物体として検出することができる。これにより、連続するフレーム画像の一部で物体の誤検出が生じた場合であっても、その物体を正しく検出することが可能になる。
〔目視確認のための処理〕
情報処理装置1が検出した画像に不適物が写っているか否かを、選択表示装置4を用いて目視確認させる処理について、図14に基づいて説明する。図14は、目視確認のための処理を説明する図である。図14には、目視確認させる処理の一例を示すフローチャートと、該フローチャートの処理によって選択表示装置4に表示される画面例とを示している。
S1010では、選択表示制御部106は、初期化処理を行う。初期化処理において、選択表示制御部106は、図6の処理によって不適物の検出が行われた動画ファイルのリストを取得し、処理対象とする動画ファイルの番号をゼロに設定する。なお、図6の処理が行われた全ての動画ファイルのリストを取得する必要はない。例えば、選択表示制御部106は、期間やファイル名でリストに含める動画ファイルを絞り込んでもよいし、直近に行われた図14の処理の終了時点以降に蓄積された動画ファイルのリストを取得してもよい。
S1020では、選択表示制御部106は、動画リストに含まれる動画ファイルの中に、S1030以降の処理が行われていないものがまだあるか否かを判定する。具体的には、選択表示制御部106は、「処理対象の動画ファイル番号 < 動画ファイルリストに含まれる全ファイル数」の真偽を判定する。そして、選択表示制御部106は、判定結果が真の場合(S1020でYES)にはS1030の処理に進み、偽の場合(S1020でNO)にはS1050の処理に進む。
S1030では、選択表示制御部106は、処理対象とする動画ファイルから選択表示装置4に表示させる画像を選定する。選定方法は特に限定されない。例えば、選択表示制御部106は、処理対象とする動画ファイルから図6の処理によって作成された根付きグラフ中の全ての画像を選定してもよいし、一部の画像を選定してもよい。一部の画像を選定する場合、動画ファイル1つ当りに設定された上限数までの画像を選定してもよいし、根付きグラフ1つ当りに設定された上限数までの画像を選定してもよい。そして、S1040では、選択表示制御部106は、処理対象とする動画ファイルの番号に1を加算する。この後、処理はS1020に戻る。
なお、一部の画像を選定する場合には、その選定はランダムに行ってもよいし、物体検出部101が出力した確率値の大きいものを優先して選定するようにしてもよい。物体検出部101が、検出結果の確からしさを示す指標値である上記確率値を出力する場合、選択表示制御部106は、所定数以上連続するフレーム画像のうち、確率値に基づいて選択したフレーム画像を表示装置に表示させてもよい。例えば、選択表示制御部106は、1つの根付きグラフから2つの画像を選定する場合、その根付きグラフの各節点について、物体検出部101が出力した確率を特定し、その確率が最も高い節点に対応する画像と、次に確率が高い節点に対応する画像を選定してもよい。フレーム画像上で物体が明瞭に写っている程、上記の確率値は高い値となる傾向があるから、上記構成によれば、目視検査の担当者が適否を確認しやすいフレーム画像を表示させることができる。
また、選択表示制御部106が選定する画像が複数の場合、選定画像間の時間条件も入れてもよい。例えば、選択表示制御部106は、5秒以上の時間差がある画像を選定してもよい。または、選択表示制御部106は、時間差が大きい順に画像(例えば最大N個)を選定してもよい。この場合、選択表示制御部106は、根付きグラフを構成する全ての画像の中から選定を行うのではなく、一部の画像(例えば根付きグラフ内からランダムまたは確率値等を基準に選んだ画像)の中から選定を行ってもよい。あるいは、選択表示制御部106は、根付きグラフを構成する全ての画像の中から時間差が大きい順にN個の画像を選定した上で、さらにそのN個の画像の中から確率値等を基準に画像を選定してもよい。
また、動画物体検出部105が、動画像の複数箇所において物体を検出した場合、選択表示制御部106は、当該複数箇所のうち所定時間以上離れた箇所のフレーム画像を選択表示装置4に表示させてもよい。これにより、同一の物体が写ったフレーム画像を表示させる可能性を低減して、効率よく目視確認を行わせることができる。なお、動画像の複数箇所において物体を検出した場合とは、動画物体検出部105が、動画像ファイルから作成された根付きグラフのうち複数から物体を検出した場合を指す。このような場合に、2つの根付きグラフ間の距離が近い場合、より正確には上流側の根付きグラフの最新の節点から、下流側の根付きグラフの根までの間隔が短い場合には、それらの根付きグラフは同一の物体に対応している可能性がある。よって、上述の構成を採用することにより、同一の物体が写ったフレーム画像を表示させる可能性を低減することができる。なお、根付きグラフ間の間隔は、画像数または時間で表すことができる。
また、本実施形態の物体検出部101は、複数の分類に属する物体をそれぞれ検出する。動画物体検出部105が動画像の複数箇所でそれぞれ異なる分類の物体を検出した場合には、選択表示制御部106は、各箇所のフレーム画像を選択表示装置4に表示させてもよい。一方、動画物体検出部105が動画像の複数箇所で同じ分類の物体を検出した場合には、選択表示制御部106は、何れか一箇所のフレーム画像を選択表示装置4に表示させてもよい。これにより、分類が異なる物体については、それぞれを目視確認させることができると共に、分類が同じ物体については目視確認を1回で済ませることができるので、目視確認を効率的に行わせることができる。
S1050では、選択表示制御部106は、S1030で選定した画像を、選択表示IF部15を介して選択表示装置4に送信し、表示させる。なお、選択表示制御部106は、画像を表示させる際に、以下の(1)~(7)の何れかまたは複数の処理を行ってもよい。(1)画像を動画ファイル毎に整列して表示させる。(2)動画ファイルの日付や時刻も表示させる。(3)画像の選定を受け付けるための情報(例えばチェックボックス)を画像に対応付けて表示させる。(4)検出された不適物を強調表示(例えば不適物を四角い線で囲んで表示させる等)。(5)不適物に関連する情報(例えば物体検出部101が出力した確率や、搬入車両特定部107が特定した搬入車両等)も表示させる。(6)画像から検出された不適物の部分を切り出して表示させる。(7)拡大して表示させる。
図14の例では、選択表示装置4には、2019/xx/xxに撮影された動画ファイルXXから不適物として検出された物体(具体的には板と長尺物)の画像が表示されている。また、この選択表示装置4には、2019/yy/yyに撮影された動画ファイルYYから不適物として検出された物体(具体的にはごみ袋と段ボール)の画像が表示されている。また、各物体の画像においては、検出された物体を囲む枠線が表示されていると共に、チェックボックスが表示されている。
S1060では、選択表示制御部106は、目視確認の担当者による画像の選定を受け付ける。図14の例のように、チェックボックスを表示している場合、選択表示制御部106は、チェックが入れられたチェックボックスに対応する画像が選定された画像、すなわち不適物の画像であると判定すればよい。なお、選択表示制御部106は、例えば上述の画像と共に終了ボタンを表示させ、その終了ボタンが選択されたときに、画像の選定が終了したと判定してもよい。そして、S1070では、選択表示制御部106は、選定された画像を高速記憶部11または大容量記憶部12に保存し、これにより図14の処理は終了する。
〔不適物の画像を表示させる処理〕
不適物の画像を不適物表示装置5に表示させる処理について、図15に基づいて説明する。図15は、不適物の画像を表示させる処理を説明する図である。図15には、不適物の画像を表示させる処理の一例を示すフローチャートと、該フローチャートの処理によって不適物表示装置5に表示される画面例とを示している。なお、この処理の前提として、ごみ焼却施設にごみを搬入しに来たごみ収集車200の識別情報を車両情報収集装置3が取得して情報処理装置1に送信しているとする。
S1110では、搬入車両特定部107が、車両情報収集装置3から受信した識別情報に基づいてごみの搬入車両を特定する。例えば、受信した識別情報がごみの搬入車両を撮影した画像である場合、搬入車両特定部107はその画像を解析することにより、その搬入車両を特定してもよい。
S1120では、不適物表示制御部108が、S1110で特定された搬入車両に関連する不適物の画像があるか否かを判定する。S1120でYESと判定された場合にはS1130の処理に遷移し、S1120でNOと判定された場合には図15の処理は終了する。
なお、S1120の判定を行う前提として、情報処理装置1が検出した各不適物について、その不適物を搬入した搬入車両を示す情報を大容量記憶部12等に記憶しているとする。このような不適物と搬入車両との紐付けは、例えば、図6の処理の前後に行ってもよい。この紐付けの際の搬入車両の特定も搬入車両特定部107が行えばよい。そして、不適物表示制御部108は、S1110で特定された搬入車両が、過去に不適物を搬入した搬入車両であれば、関連する不適物の画像があると判定してもよい。なお、S1110で特定された搬入車両について、過去に図15の処理が行われていた場合には、前回の処理後に蓄積された画像を対象としてS1120の判定を行ってもよい。
S1130では、不適物表示制御部108は、S1110で特定された搬入車両に関連する不適物の画像を不適物表示装置5に表示させる。これにより、図15の処理は終了する。なお、不適物表示装置5に表示させた画像は、S1110で特定された搬入車両が搬入したごみを撮影したごみ画像について図14の処理が開始されたタイミングや、S1130の表示開始から所定時間が経過したタイミング等に表示を終了させてもよい。
S1130で画像を表示させる際に、不適物表示制御部108は、以下の(1)~(6)の何れかまたは複数の処理を行ってもよい。(1)不適物が検出された動画ファイルが複数ある場合、画像を動画ファイル毎に整列して表示させる。(2)動画ファイルの日付や時刻も表示させる。(3)検出された不適物を強調表示(例えば不適物を四角い線で囲んで表示させる等)。(4)不適物に関連する情報(例えば物体検出部101が出力した確率等)も表示させる。(5)画像から検出された不適物の部分を切り出して表示させる。(6)拡大して表示させる。
図15の例では、不適物表示装置5には、2019/xx/xxに撮影された動画ファイルXXから不適物として検出された物体(具体的には板と長尺物)の画像が表示されている。また、この不適物表示装置5には、検出された物体を囲む枠線が表示されていると共に、不適物を搬入しないように注意喚起するメッセージが表示されている。
〔変形例〕
上述の各実施形態における物体検出や物体の分類等には、機械学習済みのニューラルネットワーク(深層学習したものを含む)以外の人工知能・機械学習アルゴリズムを用いることもできる。
上記各実施形態で説明した各処理の実行主体は、適宜変更することが可能である。例えば、図1に示す各ブロックの少なくとも何れかを省略し、省略した処理部を他の一または複数の装置に設けてもよい。この場合、上述した各実施形態の処理は、一または複数の情報処理装置により実行される。
また、上記各実施形態ではごみ画像から不適物等を検出する例を説明したが、検出対象物は任意であり、不適物等に限られない。情報処理装置1は、任意の対象が時系列で撮影された複数の画像のそれぞれから上記対象を検出することが可能であり、検出した対象の同一性を精度よく判定することができる。例えば、情報処理装置1を物体や人物等の追跡(トラッキング)に利用することもできる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
1 情報処理装置
101 物体検出部
103 入替部
104 同一性判定部
105 動画物体検出部
106 選択表示制御部(表示制御部)
4 選択表示装置(表示装置)

Claims (14)

  1. 時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部と、
    上記複数の画像のうち第1の画像から検出された第1の物体と、上記複数の画像のうち第2の画像から検出された第2の物体とが同一の物体であるか否かを判定する同一性判定部と、
    上記第1の物体または上記第2の物体の縦幅と横幅の値を入れ替える入替部と、を備え、
    上記入替部が上記の入れ替えを行った場合、上記同一性判定部は、入れ替え後の縦幅と横幅の値に基づいて上記判定を行い、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定部が同一であると判定した物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出部を備え、
    上記動画物体検出部は、所定数以上連続する上記フレーム画像の中に、上記物体が検出されなかったフレーム画像が含まれている場合であっても、上記物体が検出されなかったフレーム画像から所定の物体が検出されているときには、当該物体を上記動画像に写る物体として検出し、
    上記物体は、上記所定の物体であると誤検出される可能性のある物体である、ことを特徴とする情報処理装置。
  2. 時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部と、
    上記複数の画像のうち第1の画像から検出された第1の物体と、上記複数の画像のうち第2の画像から検出された第2の物体とが同一の物体であるか否かを判定する同一性判定部と、
    上記第1の物体または上記第2の物体の縦幅と横幅の値を入れ替える入替部と、を備え、
    上記入替部が上記の入れ替えを行った場合、上記同一性判定部は、入れ替え後の縦幅と横幅の値に基づいて上記判定を行い、
    上記画像は、ごみピットに投入される途中のごみを撮影した画像であり、
    上記物体検出部は、上記第1の物体と上記第2の物体の回転角度をさらに検出し、
    上記同一性判定部は、上記第1の物体と上記第2の物体の回転角度の差を90°補正した値、または90°補正した上記第1の物体の回転角度と上記第2の物体の回転角度との差と、上記入替部が入れ替えた縦幅および横幅の値と、に基づいて上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する、ことを特徴とする情報処理装置。
  3. 上記第1の物体と上記第2の物体の回転角度の差が所定の閾値以上である場合に、
    上記入替部は、上記第1の物体の縦幅と横幅とを入れ替え、
    上記同一性判定部は、上記第1の物体と上記第2の物体の回転角度の差を90°補正した値と、上記入替部が入れ替えた縦幅および横幅の値と、に基づいて上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する、ことを特徴とする請求項2に記載の情報処理装置。
  4. 上記物体検出部は、上記第1の物体と上記第2の物体の位置情報をさらに検出し、
    上記同一性判定部は、上記第1の物体の位置情報と上記第2の物体の位置情報とが所定の関係にあることを条件として、上記第1の物体と上記第2の物体とが同一の物体であると判定する、ことを特徴とする請求項1から3の何れか一項に記載の情報処理装置。
  5. 上記動画物体検出部は、所定数以上連続する上記フレーム画像の中に、上記物体が検出されなかったフレーム画像が含まれている場合であっても、上記物体が検出されなかったフレーム画像の前後の所定範囲内のフレーム画像から上記物体が検出されているときには、当該物体を上記動画像に写る物体として検出する、ことを特徴とする請求項に記載の情報処理装置。
  6. 時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部と、
    上記複数の画像のうち第1の画像から検出された第1の物体と、上記複数の画像のうち第2の画像から検出された第2の物体とが同一の物体であるか否かを判定する同一性判定部と、
    上記第1の物体または上記第2の物体の縦幅と横幅の値を入れ替える入替部と、を備え、
    上記入替部が上記の入れ替えを行った場合、上記同一性判定部は、入れ替え後の縦幅と横幅の値に基づいて上記判定を行い、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定部が同一であると判定した物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出部を備え、
    上記動画物体検出部が、上記動画像の複数箇所において物体を検出した場合、当該複数箇所のうち所定時間以上離れた箇所の上記フレーム画像を表示装置に表示させる表示制御部を備えている、ことを特徴とする情報処理装置。
  7. 時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部と、
    上記複数の画像のうち第1の画像から検出された第1の物体と、上記複数の画像のうち第2の画像から検出された第2の物体とが同一の物体であるか否かを判定する同一性判定部と、
    上記第1の物体または上記第2の物体の縦幅と横幅の値を入れ替える入替部と、を備え、
    上記入替部が上記の入れ替えを行った場合、上記同一性判定部は、入れ替え後の縦幅と横幅の値に基づいて上記判定を行い、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定部が同一であると判定した物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出部を備え、
    上記物体検出部は、複数の分類に属する物体をそれぞれ検出し、
    上記動画物体検出部が上記動画像の複数箇所でそれぞれ異なる分類の物体を検出した場合には、各箇所の上記フレーム画像を表示装置に表示させ、上記動画物体検出部が上記動画像の複数箇所で同じ分類の物体を検出した場合には、何れか一箇所の上記フレーム画像を表示装置に表示させる表示制御部を備えている、ことを特徴とする情報処理装置。
  8. 時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出部と、
    上記複数の画像のうち第1の画像から検出された第1の物体と、上記複数の画像のうち第2の画像から検出された第2の物体とが同一の物体であるか否かを判定する同一性判定部と、
    上記第1の物体または上記第2の物体の縦幅と横幅の値を入れ替える入替部と、を備え、
    上記入替部が上記の入れ替えを行った場合、上記同一性判定部は、入れ替え後の縦幅と横幅の値に基づいて上記判定を行い、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定部が同一であると判定した物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出部を備え、
    上記物体検出部は、検出結果の確からしさを示す指標値を出力し、
    所定数以上連続する上記フレーム画像のうち、上記指標値に基づいて選択した上記フレーム画像を表示装置に表示させる表示制御部を備えていることを特徴とする情報処理装置。
  9. 一または複数の情報処理装置により実行される同一性判定方法であって、
    時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出ステップと、
    上記複数の画像のうち第1の画像から検出された第1の物体、または上記複数の画像のうち第2の画像から検出された第2の物体の縦幅と横幅の値を入れ替える入替ステップと、
    入れ替え後の縦幅と横幅の値に基づいて、上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する同一性判定ステップと、を含み、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定ステップにて同一であると判定された物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出ステップを含み、
    上記動画物体検出ステップでは、所定数以上連続する上記フレーム画像の中に、上記物体が検出されなかったフレーム画像が含まれている場合であっても、上記物体が検出されなかったフレーム画像から所定の物体が検出されているときには、当該物体を上記動画像に写る物体として検出し、
    上記物体は、上記所定の物体であると誤検出される可能性のある物体である、ことを特徴とする同一性判定方法。
  10. 一または複数の情報処理装置により実行される同一性判定方法であって、
    時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出ステップと、
    上記複数の画像のうち第1の画像から検出された第1の物体、または上記複数の画像のうち第2の画像から検出された第2の物体の縦幅と横幅の値を入れ替える入替ステップと、
    入れ替え後の縦幅と横幅の値に基づいて、上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する同一性判定ステップと、を含み、
    上記画像は、ごみピットに投入される途中のごみを撮影した画像であり、
    上記物体検出ステップでは、上記第1の物体と上記第2の物体の回転角度をさらに検出し、
    上記同一性判定ステップでは、上記第1の物体と上記第2の物体の回転角度の差を90°補正した値、または90°補正した上記第1の物体の回転角度と上記第2の物体の回転角度との差と、上記入替ステップにて入れ替えた縦幅および横幅の値と、に基づいて上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する、ことを特徴とする同一性判定方法。
  11. 一または複数の情報処理装置により実行される同一性判定方法であって、
    時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出ステップと、
    上記複数の画像のうち第1の画像から検出された第1の物体、または上記複数の画像のうち第2の画像から検出された第2の物体の縦幅と横幅の値を入れ替える入替ステップと、
    入れ替え後の縦幅と横幅の値に基づいて、上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する同一性判定ステップと、を含み、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定ステップにて同一であると判定された物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出ステップを含み、
    上記動画物体検出ステップにて、上記動画像の複数箇所において物体を検出した場合、当該複数箇所のうち所定時間以上離れた箇所の上記フレーム画像を表示装置に表示させる、ことを特徴とする同一性判定方法。
  12. 一または複数の情報処理装置により実行される同一性判定方法であって、
    時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出ステップと、
    上記複数の画像のうち第1の画像から検出された第1の物体、または上記複数の画像のうち第2の画像から検出された第2の物体の縦幅と横幅の値を入れ替える入替ステップと、
    入れ替え後の縦幅と横幅の値に基づいて、上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する同一性判定ステップと、を含み、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定ステップにて同一であると判定された物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出ステップを含み、
    上記物体検出ステップでは、複数の分類に属する物体をそれぞれ検出し、
    上記動画物体検出ステップにて上記動画像の複数箇所でそれぞれ異なる分類の物体を検出した場合には、各箇所の上記フレーム画像を表示装置に表示させ、上記動画物体検出ステップにて上記動画像の複数箇所で同じ分類の物体を検出した場合には、何れか一箇所の上記フレーム画像を表示装置に表示させる、ことを特徴とする同一性判定方法。
  13. 一または複数の情報処理装置により実行される同一性判定方法であって、
    時系列で撮影された複数の画像のそれぞれから物体を検出し、検出した物体の縦幅および横幅を検出する物体検出ステップと、
    上記複数の画像のうち第1の画像から検出された第1の物体、または上記複数の画像のうち第2の画像から検出された第2の物体の縦幅と横幅の値を入れ替える入替ステップと、
    入れ替え後の縦幅と横幅の値に基づいて、上記第1の物体と上記第2の物体とが同一の物体であるか否かを判定する同一性判定ステップと、を含み、
    上記複数の画像は、動画像から抽出されたフレーム画像であり、
    複数の上記フレーム画像のそれぞれで検出された物体を節点とし、上記同一性判定ステップにて同一であると判定された物体に対応する上記節点を結ぶ線分を枝としたときに、
    上記枝で結ばれた上記節点が検出された上記フレーム画像が所定数以上連続している場合に、上記枝で結ばれた上記節点に対応する上記物体を、上記動画像に写る物体として検出する動画物体検出ステップを含み、
    上記物体検出ステップでは、検出結果の確からしさを示す指標値を出力し、
    所定数以上連続する上記フレーム画像のうち、上記指標値に基づいて選択した上記フレーム画像を表示装置に表示させるステップを含む、ことを特徴とする同一性判定方法。
  14. 請求項1に記載の情報処理装置としてコンピュータを機能させるための同一性判定プログラムであって、上記物体検出部、上記同一性判定部上記入替部、および上記動画物体検出部としてコンピュータを機能させるための同一性判定プログラム。
JP2019188124A 2019-10-11 2019-10-11 情報処理装置、同一性判定方法、および同一性判定プログラム Active JP7414456B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019188124A JP7414456B2 (ja) 2019-10-11 2019-10-11 情報処理装置、同一性判定方法、および同一性判定プログラム
CN202011051489.7A CN112652014A (zh) 2019-10-11 2020-09-29 信息处理装置、同一性判定方法、以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019188124A JP7414456B2 (ja) 2019-10-11 2019-10-11 情報処理装置、同一性判定方法、および同一性判定プログラム

Publications (2)

Publication Number Publication Date
JP2021064138A JP2021064138A (ja) 2021-04-22
JP7414456B2 true JP7414456B2 (ja) 2024-01-16

Family

ID=75346647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019188124A Active JP7414456B2 (ja) 2019-10-11 2019-10-11 情報処理装置、同一性判定方法、および同一性判定プログラム

Country Status (2)

Country Link
JP (1) JP7414456B2 (ja)
CN (1) CN112652014A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000105835A (ja) 1998-07-28 2000-04-11 Hitachi Denshi Ltd 物体認識方法及び物体追跡監視装置
JP2014002454A (ja) 2012-06-15 2014-01-09 Panasonic Corp 人物検出装置及び人物検出方法
JP2014182627A (ja) 2013-03-19 2014-09-29 Nec Corp 情報処理システム、情報処理方法及びプログラム
JP2017175463A (ja) 2016-03-24 2017-09-28 キヤノン電子株式会社 画像処理装置、画像処理方法、画像読取装置
JP2019095974A (ja) 2017-11-21 2019-06-20 三菱電機インフォメーションシステムズ株式会社 追跡装置及び追跡プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000105835A (ja) 1998-07-28 2000-04-11 Hitachi Denshi Ltd 物体認識方法及び物体追跡監視装置
JP2014002454A (ja) 2012-06-15 2014-01-09 Panasonic Corp 人物検出装置及び人物検出方法
JP2014182627A (ja) 2013-03-19 2014-09-29 Nec Corp 情報処理システム、情報処理方法及びプログラム
JP2017175463A (ja) 2016-03-24 2017-09-28 キヤノン電子株式会社 画像処理装置、画像処理方法、画像読取装置
JP2019095974A (ja) 2017-11-21 2019-06-20 三菱電機インフォメーションシステムズ株式会社 追跡装置及び追跡プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岡田 亜沙美 外,大域的最適な複数対象追跡における進行方向制約を用いた精度向上,電子情報通信学会技術研究報告 Vol.113 No.403,2014年01月16日

Also Published As

Publication number Publication date
JP2021064138A (ja) 2021-04-22
CN112652014A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
Nath et al. Deep convolutional networks for construction object detection under different visual conditions
KR102220174B1 (ko) 머신러닝 학습 데이터 증강장치 및 증강방법
Saxena et al. Make3d: Learning 3d scene structure from a single still image
Maung Real-time hand tracking and gesture recognition system using neural networks
CN109658412B (zh) 一种面向拆垛分拣的包装箱快速识别分割方法
CN111951212A (zh) 对铁路的接触网图像进行缺陷识别的方法
CN110909671B (zh) 一种融合概率和高度信息的栅格地图障碍物检测方法
CN106027931A (zh) 视频录制方法及服务器
CN108491856B (zh) 一种基于多尺度特征卷积神经网络的图像场景分类方法
CN108446692A (zh) 人脸比对方法、装置和系统
CN102479324A (zh) 图像处理设备及方法以及程序
CN114937179B (zh) 垃圾图像分类方法、装置、电子设备及存储介质
CN110378942A (zh) 基于双目相机的障碍物标识方法、系统、设备和存储介质
CN108198202A (zh) 一种基于光流和神经网络的视频内容检测方法
JPWO2015136709A1 (ja) 画像処理装置、画像センサ、画像処理方法
JP7414456B2 (ja) 情報処理装置、同一性判定方法、および同一性判定プログラム
JP6887033B1 (ja) 画像処理装置、工作機械および画像処理方法
WO2024016635A1 (zh) 物品拣选方法及装置、计算机可读存储介质
CN117351409A (zh) 混凝土坝面作业风险智能识别方法
Noor et al. Model generation for video-based object recognition
CN116109911A (zh) 一种三维场景审核方法、装置及计算机存储介质
CN114419356A (zh) 一种稠密排列电力设备检测方法、系统、设备及存储介质
CN114677638A (zh) 一种基于深度学习和聚类人群异常聚集的检测方法
CN114067360A (zh) 一种行人属性检测方法及装置
CN114255435A (zh) 传送装置异常检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230718

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231228

R150 Certificate of patent or registration of utility model

Ref document number: 7414456

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150