JP2019087200A - 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法 - Google Patents

作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法 Download PDF

Info

Publication number
JP2019087200A
JP2019087200A JP2017217287A JP2017217287A JP2019087200A JP 2019087200 A JP2019087200 A JP 2019087200A JP 2017217287 A JP2017217287 A JP 2017217287A JP 2017217287 A JP2017217287 A JP 2017217287A JP 2019087200 A JP2019087200 A JP 2019087200A
Authority
JP
Japan
Prior art keywords
work vehicle
classification
data
images
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017217287A
Other languages
English (en)
Other versions
JP7345236B2 (ja
Inventor
正憲 逢澤
Masanori Aizawa
正憲 逢澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Komatsu Ltd
Original Assignee
Komatsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Komatsu Ltd filed Critical Komatsu Ltd
Priority to JP2017217287A priority Critical patent/JP7345236B2/ja
Priority to US16/500,028 priority patent/US11556739B2/en
Priority to CN201880021484.4A priority patent/CN110462628B/zh
Priority to PCT/JP2018/039830 priority patent/WO2019093152A1/ja
Priority to DE112018001587.4T priority patent/DE112018001587T5/de
Priority to KR1020197028316A priority patent/KR20190120322A/ko
Publication of JP2019087200A publication Critical patent/JP2019087200A/ja
Application granted granted Critical
Publication of JP7345236B2 publication Critical patent/JP7345236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • G06V20/38Outdoor scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Abstract

【課題】人工知能を用いて作業車両の動作を容易、且つ、精度良く判定する。【解決手段】本発明に係る方法は、コンピュータによって実行される方法であって、以下の処理を含む。第1の処理は、動作データを取得することである。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成されたデータであり、作業車両の動作変化を示す。第2の処理は、学習済みの分類モデルを用いた画像分類を実行することにより、動作データから作業車両の動作の分類を決定することである。【選択図】図3

Description

本発明は、人工知能を用いて作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法に関する。
従来、作業車両が行っている動作をコンピュータによって推定する技術が知られている。例えば、油圧ショベルは、掘削、旋回、或いは排土などの動作を行う。特許文献1では、油圧ショベルのこれらの作業を、油圧ショベルに備えられたセンサからの検出値に基づいて、コントローラが判定している。例えば、油圧ショベルは、回転速度センサ、圧力センサ、及び複数の角度センサを備えている。回転速度センサは、エンジンの回転速度を検出する。圧力センサは、油圧ポンプの吐出圧を検出する。複数の角度センサは、ブーム角度、アーム角度、及びバケット角度を検出する。コントローラは、これらのセンサからの検出値に基づいて、油圧ショベルが実行している作業を判定する。
特開2016−103301号公報
しかし、上記の技術では、センサを備えていない作業車両の動作を判定することはできない。また、作業車両がセンサを備えていても、作業車両がコンピュータとの通信装置を備えていなければ、コンピュータは、センサが検出した情報を作業車両から取得することができない。従って、その場合も、コンピュータによって作業車両の動作を判定することはできない。
また、作業現場に配置された複数の作業車両を管理するために各作業車両の動作を判定する場合、全ての作業車両が、センサ、或いはコンピュータとの通信装置を備えているとは限らない。従って、作業現場に配置された複数の作業車両を管理するために各作業車両の動作を判定することは容易ではない。
一方、近年、人や物の動作を撮影した動画を人工知能によって解析することで、どのような動作が行われているかをコンピュータが判定する技術が研究されている。例えば、動画を扱う人工知能のモデルとして、再帰型ニューラルネットワーク(RNN)などが研究されている。このような人工知能技術を用いて、作業車両の動作を撮影した動画を解析することができれば、作業車両の動作をコンピュータによって容易に判定することができる。しかし、上記のような動画をそのまま扱う人工知能のモデルは、認識精度などの問題により、実用化は未だ困難である。
本発明の目的は、人工知能を用いて作業車両の動作を容易、且つ、精度良く判定することにある。
第1の態様は、コンピュータによって実行される方法であって、以下の処理を含む。第1の処理は、動作データを取得することである。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成された作業車両の動作変化を示すデータである。第2の処理は、学習済みの分類モデルを用いた画像分類を実行することにより、動作データから作業車両の動作の分類を決定することである。
第2の態様は、システムであって、学習済みの分類モデルと、プロセッサとを含む。プロセッサは、以下の処理を実行するようにプログラムされている。プロセッサは、動作データを取得する。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成された作業車両の動作変化を示すデータである。プロセッサは、分類モデルを用いた画像分類を実行することにより、動作データから作業車両の動作の分類を決定する。
第3の態様は、学習済みの分類モデルの製造方法であって、以下の処理を含む。第1の処理は、学習データを取得することである。学習データは、動作データと、動作データに割り当てられた作業車両の動作の分類とを含む。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成された作業車両の動作変化を示すデータである。第2の処理は、学習データにより分類モデルを学習させることである。
第4の態様は、分類モデルを学習させるための学習データであって、動作データと、動作データに割り当てられた作業車両の動作の分類とを含む。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成された作業車両の動作変化を示すデータである。
第5の態様は、分類モデルを学習させるための学習データの製造方法であって、以下の処理を含む。第1の処理は、動作中の作業車両を時系列的に示す複数の画像を取得することである。第2の処理は、複数の画像から作業車両の動作変化を示す動作データを生成することである。第3の処理は、動作データに割り当てられる作業車両の動作の分類を取得することである。
第6の態様は、学習済み分類モデルの製造方法であって、以下の処理を含む。第1の処理は、動作データを取得することである。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成された作業車両の動作変化を示すデータである。第2の処理は、学習済みの第1の分類モデルを用いた画像分類を実行することにより、動作データから作業車両の動作の分類を決定することである。第3の処理は、動作データと、決定された作業車両の動作の分類とを含む学習データにより、第2の分類モデルを学習させることである。
本発明では、複数の画像から生成された動作データから、作業車両の動作の分類を決定する。従って、静止画像の分類に適した人工知能の分類モデルを利用して、作業車両の動作を推定することができる。それにより、人工知能を用いて作業車両の動作を容易、且つ、精度良く判定することができる。
実施形態に係る分類システムを示す模式図である。 分類システムのコンピュータの構成を示す模式図である。 コンピュータに実装された分類システムの構成を示す模式図である。 ニューラルネットワークの構成を示す模式図である。 作業車両の動作を推定するための処理を示すフローチャートである。 動画データに含まれる複数の画像の一例を示す図である。 図6に示す動画データに含まれる第1〜第3の画像を重ね合わせた重ね合わせ画像の一例を示す図である。 図6に示す動画データに含まれる第2〜第4の画像を重ね合わせた重ね合わせ画像の一例を示す図である。 動画データに含まれる複数の画像の他の例を示す図である。 図9に示す動画データに含まれる第1〜第3の画像を重ね合わせた重ね合わせ画像の一例を示す図である。 図9に示す動画データに含まれる第2〜第4の画像を重ね合わせた重ね合わせ画像の一例を示す図である。 動画データに含まれる複数の画像の他の例を示す図である。 図12に示す動画データに含まれる第1〜第3の画像を重ね合わせた重ね合わせ画像の一例を示す図である。 図12に示す動画データに含まれる第2〜第4の画像を重ね合わせた重ね合わせ画像の一例を示す図である。 入力層に入力される画素値の演算方法の一例を示す図である。 学習システムの構成を示す模式図である。 学習システムが実装されたコンピュータの構成を示す模式図である。 学習データを生成するための処理を示すフローチャートである。 加工済み画像の例を示す図である。 学習データによって分類モデルを学習させるための処理を示すフローチャートである。 変形例に係る分類システムを示す図である。 蒸留モデルを生成するための処理を示すフローチャートである。 変形例に係る動作データの一例を示す図である。 変形例に係る動作データの演算方法の一例を示す図である。
以下、図面を参照して実施形態について説明する。図1は、実施形態に係る分類システム100を示す模式図である。分類システム100は、作業車両1が行っている動作を推定するためのシステムである。図1に示すように分類システム100は、カメラ101とコンピュータ102とを含む。
カメラ101は、作業車両1が配置された作業現場に配置されている。カメラ101は、作業車両1の外部から作業車両1を撮影し、作業車両1の動画を撮影する。コンピュータ102は、カメラ101と無線、或いは有線により通信を行う。カメラ101は、撮影した動画を示す動画データをコンピュータ102に送信する。コンピュータ102は、通信ネットワークを介して、カメラ101から動画データを受信してもよい。コンピュータ102は、記録媒体を介してカメラ101から動画データを受信してもよい。
コンピュータ102は、作業現場に配置されてもよい。或いは、コンピュータ102は、作業現場から離れた管理センターに配置されてもよい。コンピュータ102は、分類システム100用に専用に設計されたものであってもよく、或いは汎用のPC(Personal Computer)であってもよい。コンピュータ102は、カメラ101から動画データを受信する。コンピュータ102は、人工知能の分類モデルを用いることで、作業車両1の動作の分類を決定する。
分類システム100は、カメラ101を複数有してもよい。複数のカメラ101は、複数の作業車両1の動画を撮影してもよい。コンピュータ102は、複数のカメラ101のそれぞれから、動画データを受信してもよい。
図2は、コンピュータ102の構成を示す模式図である。図2に示すように、コンピュータ102は、プロセッサ103と、記憶装置104と、通信インタフェース105と、I/Oインタフェース106とを含む。プロセッサ103は、例えばCPU(Central Processing Unit)である。記憶装置104は、記録されたプログラム及びデータなどの情報をプロセッサ103が読み取り可能なように記録する媒体を含む。記憶装置104は、RAM(Random Access Memory)、或いはROM(Read Only Memory)などのシステムメモリと、補助記憶装置とを含む。補助記憶装置は、例えばハードディスク等の磁気的記録媒体、CD、DVD等の光学的記録媒体、或いは、フラッシュメモリ等の半導体メモリであってもよい。記憶装置104は、コンピュータ102に内蔵されてもよい。記憶装置104は、コンピュータ102に着脱可能に接続される外部記録媒体を含んでもよい。
通信インタフェース105は、例えば有線LAN(Local Area Network)モジュール、或いは無線LANモジュール等であり、通信ネットワークを介した通信を行うためのインタフェースである。I/Oインタフェース106は、例えばUSB(Universal Serial Bus)ポート等であり、外部装置と接続するためのインタフェースである。
コンピュータ102は、I/Oインタフェース106を介して、入力装置107、及び出力装置108と接続される。入力装置107は、ユーザーがコンピュータ102への入力を行うための装置である。入力装置107は、例えば、マウス、或いはトラックボール等のポインティングデバイスを含む。入力装置107は、キーボード等の文字入力のための装置を含んでもよい。出力装置108は、例えば、ディスプレイを含む。
図3は、分類システム100の構成の一部を示す図である。図3に示すように、分類システム100は、画像生成モジュール110と、学習済みの分類モデル111とを含む。画像生成モジュール110と学習済みの分類モデル111とは、コンピュータ102に実装されている。画像生成モジュール110と学習済みの分類モデル111とは、コンピュータの記憶装置104に保存されていてもよい。
本実施形態において、モジュール及びモデルは、ハードウェア、ハードウェア上で実行可能なソフトウェア、ファームウェア、或いはそれらの組合せに実装されていてもよい。モジュール及びモデルは、プロセッサによって実行されるプログラム、アルゴリズム、及びデータを含んでもよい。モジュール及びモデルの機能は、単一のモジュールによって実行されてもよく、或いは複数のモジュールに分散して実行されてもよい。モジュール及びモデルは、複数のコンピュータに分散して配置されてもよい。
画像生成モジュール110は、作業車両1の動画データD11から、後述する重ね合わせ画像を示す画像データD12を生成する。重ね合わせ画像は、動作中の作業車両1を時系列的に示す一連の複数の画像を重ね合わせた画像である。なお、ここでいう「画像」とは、静止画像を意味する。「一連の複数の画像」とは、動画中に含まれる完全に連続したフレームの複数の画像に限らず、所定数のフレームを飛ばした複数の画像を含む。
分類モデル111は、画像分類のための人工知能モデルである。分類モデル111は、入力された画像を解析して、画像に対応する分類を出力する。後述するように、コンピュータ102は、画像データD12が示す重ね合わせ画像に対して、人工知能の分類モデル111を用いた画像分類を実行することにより、作業車両1の動作の分類を決定する。分類モデル111は、決定した動作の分類を示す出力データD13を出力する。
分類モデル111は、図4に示すニューラルネットワーク120を含む。例えば、分類モデル111は、畳み込みニューラルネットワーク(CNN)などのディープニューラルネットワークを含む。
図4に示すように、ニューラルネットワーク120は、入力層121、中間層122(隠れ層)、及び出力層123を含む。各層121,122,123は、1又は複数のニューロンを備えている。例えば、入力層121のニューロンの数は、重ね合わせ画像の画素数に応じて設定することができる。中間層122のニューロンの数は、適宜設定することができる。出力層123は、作業車両1の動作の分類数に応じて設定することができる。
互いに隣接する層のニューロン同士は結合されており、各結合には重み(結合荷重)が設定されている。ニューロンの結合数は、適宜設定されてよい。各ニューロンには閾値が設定されており、各ニューロンへの入力値と重みとの積の和が閾値を超えているか否かによって各ニューロンの出力値が決定される。
入力層121には、作業車両1の動作を示す動作データが入力される。動作データは、動作中の作業車両を時系列的に示す複数の画像から生成されたデータであり、作業車両の動作変化を示す。動作データについては後述する。出力層123には、分類された各動作の確率を示す出力値が出力される。分類モデル111は、動作データが入力されると、分類された各動作の確率を示す出力値を出力するように学習済みである。学習によって得られた分類モデル111の学習済みパラメータは、記憶装置104に記憶されている。学習済みパラメータは、例えば、ニューラルネットワーク120の層数、各層におけるニューロンの個数、ニューロン同士の結合関係、各ニューロン間の結合の重み、及び各ニューロンの閾値を含む。
なお、各動作の分類は、作業車両1の種類に応じて決定されてもよい。例えば、作業車両1が油圧ショベルであるときには、動作の分類は、「掘削」、「旋回」、及び「排土」を含んでもよい。「旋回」は、「ホイスト旋回」と「ダウン旋回」とを含んでもよい。ただし、動作の分類の一部が変更、或いは省略されてもよい。或いは、動作の分類は、他の分類をさらに含んでもよい。
図5は、作業車両1の動作を推定するためにコンピュータ102(プロセッサ103)によって実行される処理を示すフローチャートである。図5に示すように、ステップS101では、コンピュータ102は、カメラ101が撮影した作業車両1の動画データD11を取得する。コンピュータ102は、カメラ101が撮影した動画データD11をリアルタイムに取得してもよい。或いは、コンピュータ102は、カメラ101が撮影した動画データD11を所定時刻に、或いは所定時間ごとに取得してもよい。コンピュータ102は、動画データD11を記憶装置104に保存する。
ステップS102では、コンピュータ102は、動画データD11から、作業車両1の動作を示す一連の複数の画像を抜き出す。図6は、動画データD11の一例(以下、「動画データMV1」と記す)に含まれる複数の画像を示す図である。図6では、動画データMV1に含まれる複数の画像の一部(画像F11−F14)のみが例示されている。コンピュータ102は、動画データMV1に含まれる複数の画像F11−F14のうち、所定フレーム数の画像を抜き出す。
ステップS103では、コンピュータ102は、抜き出した複数の画像を重ね合わせて、重ね合わせ画像を生成する。重ね合わせ画像は、上述した作業車両の動作変化を示す動作データの一例である。コンピュータ102は、複数の画像を透過させて互いに重ね合わせることで、重ね合わせ画像を生成する。重ね合わせ画像は、動画から抜き出した複数の画像を互いに重ね合わせることで合成した静止画像である。コンピュータ102は、重ね合わせ画像を示す画像データD12を記憶装置104に保存する。
図7は、図6に示す動画データMV1に含まれる第1〜第3の画像F11−F13を重ね合わせた重ね合わせ画像IM11の一例を示す図である。図8は、図6に示す動画データMV1に含まれる第2〜第4の画像F12−F14を重ね合わせた重ね合わせ画像IM12の一例を示す図である。図6に示す動画データMV1は、旋回中の作業車両1を撮影して得られたものである。図7及び図8に示すように、重ね合わせ画像IM11,IM12では、旋回中の作業車両1の異なる複数の姿勢が1枚の静止画中に示されている。
図9は、動画データD12の他の例(以下、「動画データMV2」と記す)に含まれる複数の画像の一部を示す図である。図9に示す動画データMV2は、排土中の作業車両1を撮影して得られたものである。図10は、図9に示す動画データMV2に含まれる第1〜第3の画像F21−F23を重ね合わせた重ね合わせ画像IM21の一例を示す図である。図11は、図9に示す動画データMV2に含まれる第2〜第4の画像F22−F24を重ね合わせた重ね合わせ画像IM22の一例を示す図である。図10及び図11に示すように、重ね合わせ画像IM21,IM22では、排土中の作業車両1の異なる複数の姿勢が、1枚の静止画中に示されている。
図12は、動画データD11のさらに他の例(以下、「動画データMV3」と記す)に含まれる複数の画像の一部を示す図である。図12に示す動画データMV3は、掘削中の作業車両1を撮影して得られたものである。図13は、図12に示す動画データMV3に含まれる第1〜第3の画像F31−F33を重ね合わせた重ね合わせ画像IM31の一例を示す図である。図14は、図12に示す動画データMV3に含まれる第2〜第4の画像F32−F34を重ね合わせた重ね合わせ画像IM32の一例を示す図である。図13及び図14に示すように、重ね合わせ画像IM31,IM32では、掘削中の作業車両1の異なる複数の姿勢が、1枚の静止画中に示されている。
ステップS104では、コンピュータ102は、学習済みの分類モデル111を用いた画像分類を実行する。コンピュータ102は、ステップS103で生成した重ね合わせ画像を、分類モデル111への入力データとして用いて、上述したニューラルネットワーク120に基づく画像分類を実行する。
例えば、コンピュータ102は、重ね合わせ画像に含まれる画素値をニューラルネットワーク120の入力層121に含まれる各ニューロンに入力する。図15は、入力層121に入力される画素値の演算方法の一例を示す図である。図15において、「image_1」は、第1の画像の画素値を示している。「image_2」は、第2の画像の画素値を示している。「image_3」は、第3の画像の画素値を示している。なお、図15に示されている数値は例示であり、これに限定されるものではない。
図15に示すように、コンピュータ102は、第1〜第3の画像の画素値を合成することで、入力層121に入力される動作データを生成する。詳細には、コンピュータ102は、第1〜第3の画像において互いに対応する画素の画素値の平均値を算出する。コンピュータ102は、算出した各画素の平均値(average_pixel[0][0]等)を入力層121に含まれる各ニューロンに入力する。なお、平均値は、重み付け平均であってもよい。各画素値と各ニューロンとの対応関係は、適宜設定されてもよい。それにより、コンピュータ102は、作業車両1の動作の各分類の確率を出力データD13として得る。
上述した油圧ショベルの例では、作業車両1の動作の分類は、「旋回」、「排土」、及び「掘削」を含む。コントローラは、「旋回」、「排土」、及び「掘削」の各分類の確率を示す出力値を得る。分類モデル111は、図7及び図8に示すような旋回を示す重ね合わせ画像に対しては「旋回」の分類の出力値が高くなるように、学習済みである。分類モデル111は、図10及び図11に示すような排土を示す重ね合わせ画像に対しては「排土」の分類の出力値が高くなるように、学習済みである。分類モデル111は、図13及び図14に示すような掘削を示す重ね合わせ画像に対しては「掘削」の分類の出力値が高くなるように、学習済みである。
ステップS105では、コンピュータ102は、作業車両1の動作の分類を決定する。コンピュータ102は、出力データD13が示す各分類の確率に基づいて、作業車両1の動作の分類を決定する。コンピュータ102は、最も高い確率を有する分類を、作業車両1の動作として決定する。これにより、コンピュータ102は、作業車両1が実行している動作を推定する。
ステップS106では、コンピュータ102は、ステップS105で決定された分類での作業車両1の動作時間を記録する。例えば、作業車両1が旋回を行っているときには、コンピュータ102は、動作の分類を「旋回」に決定すると共に、旋回の動作時間を記録する。コンピュータ102は、重ね合わせ画像に用いられたフレーム数から、分類の動作時間を算出してもよい。
ステップS107では、コンピュータ102は、動作の分類及び動作時間を含む管理データを生成する。コンピュータ102は、管理データを記憶装置104に記録する。
以上説明した本実施形態に係る分類システム100では、コンピュータ102は、重ね合わせ画像から作業車両1の動作の分類を決定する。従って、静止画像の分類に適した人工知能の分類モデル111を利用して、作業車両1の動作を推定することができる。それにより、人工知能を用いて作業車両1の動作をコンピュータ102によって容易、且つ、精度良く判定することができる。
分類システム100では、作業車両1の外部から作業車両1を撮影した動画から、作業車両1の動作を推定することができる。従って、特定のセンサ或いは通信装置など、分類システム100のための専用の装備を備えていない作業車両1に対しても、容易、且つ、精度良く動作を判定することができる。
分類システム100では、作業車両1の動画から、動作の分類を決定すると共に、当該分類の動作時間が管理データとして記録される。従って、作業車両1の動画を撮影することで、作業車両1による作業のタイムスタディをコンピュータ102によって容易且つ自動で行うことができる。また、作業現場における複数の作業車両1の動画をそれぞれ撮影して、分類システム100によって管理データを生成することで、作業現場における複数の作業車両1による作業のタイムスタディをコンピュータ102によって容易且つ自動で行うことができる。
次に、実施形態に係る分類モデル111の学習方法について説明する。図16は、分類モデル111の学習を行う学習システム200を示す図である。学習システム200は、学習データ生成モジュール211と学習モジュール212とを含む。
学習データ生成モジュール211は、作業車両の動画データD21から学習データD22を生成する。学習モジュール212は、学習データD22を用いて、分類モデル111の学習を行い、分類モデル111のパラメータを最適化する。学習システム200は、最適化されたパラメータを学習済みパラメータD23として取得する。
図17は、学習システム200を実現するコンピュータ202の構成を示す模式図である。図17に示すように、コンピュータ202は、プロセッサ203と、記憶装置204と、通信インタフェース205と、I/Oインタフェース206と、入力装置207と、出力装置208とを含む。コンピュータ202のプロセッサ203、記憶装置204、通信インタフェース205、I/Oインタフェース206、入力装置207、及び出力装置208は、上述したコンピュータ102のプロセッサ103、記憶装置104、通信インタフェース105、I/Oインタフェース106、入力装置107、及び出力装置108と概ね同様であるため、詳細な説明を省略する。
学習データ生成モジュール211と学習モジュール212とは、コンピュータ202に実装されている。学習データ生成モジュール211と学習モジュール212とは、記憶装置204に記憶されている。
図18は、学習データD22を生成するためにコンピュータ202(プロセッサ203)によって実行される処理を示すフローチャートである。図18に示すように、ステップS201では、コンピュータ202は、作業車両の動画データD21を取得する。コンピュータ202は、通信ネットワークを介して動画データD21を取得してもよい。或いは、コンピュータ202は、外部記録媒体を介して動画データD21を取得してもよい。
ステップS202では、コンピュータ202は、動画データD21から、作業車両の動作を時系列的に示す一連の複数の画像を抜き出す。ステップS203では、コンピュータ202は、抜き出した複数の画像を重ね合わせて、重ね合わせ画像を生成する。ステップS202及びステップS203の処理は、上述したステップS102及びステップS103と概ね同様であるため、詳細な説明を省略する。
ステップS204では、コンピュータ202は、作業車両1の動作の分類を、重ね合わせ画像に割り当てて、学習データを生成する。分類の割り当ては、人間が入力装置207を用いて手動で行ってもよい。その場合、コンピュータ202は、入力装置207を介して入力された分類を示す分類データに基づいて、重ね合わせ画像に、作業車両の動作の分類を割り当てて学習データを生成してもよい。
ステップS205では、コンピュータ202は、記憶装置204に学習データD22を保存する。学習データD22は、ステップS203で生成された重ね合わせ画像と、ステップS204において重ね合わせ画像に割り当てられた作業車両の動作の分類とを含む。
コンピュータ202は、ステップS201からステップS205の処理を繰り返すことで、1つの動画データD21から、複数の学習データD22を生成する。また、コンピュータ202は、ステップS201からステップS205の処理を繰り返すことで、複数の動画データD21から、複数の学習データD22を生成する。
図19に示すように、コンピュータ202は、1つの重ね合わせ画像を元の画像IM41として、元の画像IM41に対して、拡大、縮小、回転、平行移動、左右反転、及び色の変更のうちの1つ以上を施すことで、複数の加工済み画像IM42−IM45を生成してもよい。色の変更は、例えば、彩度、明度、或いはコントラストの変更であってもよい。コンピュータ202は、複数の加工済み画像IM42−IM45のそれぞれに対して作業車両1の動作の分類を割り当て、学習データD22として保存してもよい。それにより、大量、且つ、多様な学習データD22を用意することができ、分類モデル111の学習の効果を向上させることができる。
図20は、学習データD22によって分類モデル111を学習させるためにコンピュータ202(プロセッサ203)によって実行される処理を示すフローチャートである。図20に示すように、ステップS301では、コンピュータ202は、学習データD22を取得する。上述のように、コンピュータ202は、動画データD21から学習データD22を生成することで、学習データD22を取得する。
ただし、コンピュータ202は、他のコンピュータが生成した学習データD22を取得してもよい。その場合、コンピュータ202は、通信ネットワークを介して学習データD22を受信してもよい。或いは、コンピュータ202は、外部記録媒体を介して、学習データD22を受信してもよい。
ステップS302では、コンピュータ202は、学習データD22によって分類モデル111の学習を行う。コンピュータ202は、学習データD22に含まれる重ね合わせ画像を入力データとし、作業車両1の動作の分類を教師データとして、分類モデル111の学習を行う。
例えば、コンピュータ202は、各重ね合わせ画像の各画素値を入力層121の入力として用いて、ニューラルネットワーク120の順伝播方向の演算処理を行う。これにより、コンピュータ202は、ニューラルネットワーク120の出力層123から出力される出力値を得る。次に、コンピュータ202は、出力層123から出力される出力値と、教師データとして割り当てられた分類が示す正しい出力値との誤差を算出する。コンピュータ202は、算出した出力値の誤差から、バックプロパゲーションにより、各ニューロン間の結合の重み、及び、各ニューロンの閾値のそれぞれの誤差を算出する。そして、コンピュータ202は、算出した各誤差に基づいて、各ニューロン間の結合の重み、及び、各ニューロンの閾値の更新を行う。
コンピュータ202は、複数の重ね合わせ画像について、分類モデル111からの出力値が、重ね合わせ画像に割り当てられた分類に対応する値と一致するまで、上記の処理を繰り返す。それにより、分類モデル111のパラメータが最適化され、分類モデル111を学習させることができる。
なお、分類モデル111の各種のパラメータの初期値は、テンプレートにより与えられてもよい。或いは、パラメータの初期値は、人間の入力により手動で与えられてもよい。分類モデル111の再学習を行うときには、コンピュータ202は、再学習を行う対象となる分類モデル111の学習済みパラメータD23に基づいて、パラメータの初期値を用意してもよい。
ステップS303では、コンピュータ202は、学習によって最適化されたパラメータを学習済みパラメータD23として記憶装置104に保存する。これにより、コンピュータ202は分類モデル111の学習を終了する。
上述した分類システム100のコンピュータ102は、分類モデル111及び学習済みパラメータD23を学習システム200のコンピュータ202から取得することで、学習済みの分類モデル111を取得することができる。
なお、学習システム200のコンピュータ202は、上述した分類モデル111の学習を定期的に実行することで、学習済みパラメータD23を更新してもよい。学習システム200のコンピュータ202は、更新した学習済みパラメータD23を分類システム100のコンピュータ102に転送してもよい。分類システム100のコンピュータ102は、転送された学習済みパラメータD23によって、分類モデル111のパラメータを更新してもよい。
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、発明の要旨を逸脱しない範囲で種々の変更が可能である。
分類システム100、及び/又は、学習システム200の構成が変更されてもよい。例えば、分類システム100は、複数のコンピュータを含んでもよい。上述した分類システム100による処理は、複数のコンピュータに分散して実行されてもよい。例えば、重ねあわせ画像の生成と分類の決定とは、異なるコンピュータによって実行されてもよい。
図21は、変形例に係る分類システム100を示す図である。図21に示すように、分類システム100は、第1のコンピュータ102aと第2のコンピュータ102bとを含んでもよい。第1のコンピュータ102aと第2のコンピュータ102bとは互いに通信可能であってもよい。例えば、第1のコンピュータ102aと第2のコンピュータ102bとは通信ネットワークNTを介して通信可能であってもよい。
第1のコンピュータ102aは、上述した動画データD11の取得と、重ね合わせ画像の生成とを行ってもよい。第2のコンピュータ102bは、第1のコンピュータ102aから重ね合わせ画像を取得してもよい。第2のコンピュータ102bは、上述した分類モデル111を用いた画像分類と、作業車両1の動作の分類とを行ってもよい。第1のコンピュータ102aは、第2のコンピュータ102bから、動作の分類と実行時間とを含む管理データを受信してもよい。
学習システム200は、複数のコンピュータを含んでもよい。上述した学習システム200による処理は、複数のコンピュータで分散して実行されてもよい。例えば、上記の本実施形態では、コンピュータ202が、学習データの生成と、分類モデル111の学習とを実行している。しかし、学習データの生成と、分類モデル111の学習とは、異なるコンピュータによって実行されてもよい。すなわち、学習データ生成モジュール211と学習モジュール212とは異なるコンピュータに実装されてもよい。
分類システム100のコンピュータ102、及び/又は、学習システム200のコンピュータ202の構成が変更されてもよい。例えば、コンピュータ102は、複数のプロセッサを含んでもよい。コンピュータ202は、複数のプロセッサを含んでもよい。上述した処理の少なくとも一部は、CPUに限らず、GPU(Graphics Processing Unit)などの他のプロセッサによって実行されてもよい。上述した処理は、複数のプロセッサに分散して実行されてもよい。
上記実施形態では、分類モデル111はニューラルネットワーク120を含む。しかし、分類モデル111は、ニューラルネットワークに限らず、例えばサポートベクターマシンなど、機械学習を用いて静止画像に対して精度良く分類を行えるモデルあってもよい。
上述した分類モデル111は、上述した学習データD21を用いて機械学習により学習したモデルに限らず、当該学習したモデルを利用して生成されたモデルであってもよい。例えば、分類モデル111は、学習済みモデルに新たなデータを用いて更に学習させることで、パラメータを変化させ、精度をさらに高めた別の学習済みモデル(派生モデル)であってもよい。或いは、分類モデル111は、学習済みモデルにデータの入出力を繰り返すことで得られる結果を基に学習させた別の学習済みモデル(蒸留モデル)であってもよい。
図22は、蒸留モデルを生成するためにコンピュータ202(プロセッサ203)によって実行される処理を示すフローチャートである。図22に示すように、ステップS401〜S403において、コンピュータ202は、動画データから重ね合わせ画像を生成する。ステップS401〜S403の各処理は、上述したステップS201〜S203と同様であるため、詳細な説明を省略する。
ステップS404では、コンピュータ202は、学習済みの第1の分類モデルを用いた画像分類を実行する。コンピュータ202は、ステップS403で生成した重ね合わせ画像を、第1の分類モデルへの入力データとして用いて、ニューラルネットワークに基づく画像分類を実行する。ステップS405では、コンピュータ202は、作業車両1の動作の分類を決定する。コンピュータ202は、第1の分類モデルによる画像分類によって、作業車両1の動作の分類を決定する。ステップS404及びステップS405の処理は、上述したステップS104及びステップS105の処理と同様である。
ステップS406では、コンピュータ202は、ステップS403で生成した重ね合わせ画像と、ステップS405で決定した作業車両1の動作の分類とを学習データD22として記憶装置204に保存する。
ステップS407では、コンピュータ202は、学習データD22によって第2の分類モデルの学習を行う。ステップS408では、コンピュータ202は、学習によって最適化されたパラメータを学習済みパラメータD23として記憶装置104に保存する。ステップS407及びステップS408の処理は、上述したステップS302及びステップS303の処理と同様である。なお、コンピュータ202は、他のコンピュータによって生成された学習データD22によって第2の分類モデルの学習を行ってもよい。
以上のように第2の分類モデル(蒸留モデル)を学習させることで、コンピュータ102は、第1の分類モデルよりもシンプルな第2の分類モデルを用いて、作業車両1の動作の分類を決定することができる。それにより、作業車両1の動作の分類を決定するためのコンピュータ102の負荷を軽減することができる。
動作データは、複数の画像から生成された作業車両の動作の変化を示すデータであればよく、重ね合わせ画像に限らず、他のデータであってもよい。動作データは、複数の画像に含まれる一群の画像を示すデータであってもよい。図23は変形例に係る動作データを示す図である。図23に示すように示すように、動作データは、複数の画像を連結した連結画像IM51であってもよい。連結画像IM51は、上述した動画データMV1に含まれる第1〜第3の画像F11−F13をシリアルに連結した画像である。この場合、図24に示すように、コンピュータ102は、第1〜第3の画像F11−F13の画素値をシリアルに入力層121に入力してもよい。
このような変形例によっても、上述した実施形態と同様に、人工知能を用いて作業車両1の動作をコンピュータ102によって容易、且つ、精度良く判定することができる。ただし、背景などのデータが多く入力されることになるため、動作の判定にとって不要なデータが増える。そのため、変形例では、重ね合わせ画像を用いる上記の実施形態と比べて、動作の判定精度が劣る。言い換えれば、上記の実施形態では、重ね合わせ画像を用いることで、不要なデータを削減することができ、それにより判定精度を向上させることができる。
動作データは、複数の画像の画素値から得られた値を含めばよく、画像に限られなくてもよい。例えば、図15において、コンピュータ102は、画素値の平均値average_pixel[0][0]を計算し、計算した値を直ちに入力層121に入力し、average_pixel[0][0]を初期化してもよい。コンピュータ102は、同様の処理をaverage_pixel[2][2]まで繰り返してもよい。この場合、コンピュータ102は、動作データとして画像を生成しないが、複数の画像の画素値を合成することで得られた値を動作データとして生成して、入力層121に入力することができる。
動作データは、複数の画像において共通する部分が省略されたものであってもよい。例えば、複数の画像に共通に含まれる背景を示す画素値が、動作データから省略されてもよい。コンピュータ102は、複数の画像のなかから基準となる画像を決定し、他の画像に対して基準となる画像との差分を算出してもよい。コンピュータ102は、この差分から動作データを生成して、入力層121に入力してもよい。
重ね合わせ画像、或いは連結画像を生成する方法は変更されてもよい。例えば、上記の実施形態では、動画データD11,D21中の3フレームの画像を重ね合わせることで、重ね合わせ画像が生成されている。しかし、重ね合わせ画像において重ね合わされる画像のフレーム数は3つに限らず、3つより少ない、或いは3つより多くてもよい。
コンピュータ102,202は、連続したフレームの画像を抜き出して重ね合わせ画像、或いは連結画像を生成してもよい。或いは、コンピュータ102,202は、連続したフレームの一部を飛ばして画像を抜き出してもよい。例えば、コンピュータ102,202は、連続した複数のフレームから、1又はそれよりも多くのフレームを飛ばして画像を抜き出してもよい。
コンピュータ102,202は、複数の画像をグレースケール化して重ね合わせ画像、或いは連結画像を生成してもよい。コンピュータ102,202は、複数の画像の一部の濃さを変更してもよい。すなわち、コンピュータ102,202は、異なる濃さを有する複数の画像から、重ね合わせ画像、或いは連結画像を生成してもよい。コンピュータ102,202は、抜き出した画像の一部を切り抜いて重ね合わせ画像、或いは連結画像を生成してもよい。
作業車両は、油圧ショベルに限らず、ブルドーザ、ホイールローダ、グレーダー、或いはダンプトラックなどの他の車両であってもよい。分類モデル111、学習済みパラメータD23、及び/又は学習データD22は、作業車両の種類ごとに用意されてもよい。或いは、分類モデル111、学習済みパラメータD23、及び/又は学習データD22は、複数種類の作業車両に共通であってもよい。その場合、分類モデル111は、作業車両の動作と共に作業車両の種類を推定してもよい。
上述した処理の一部が省略、或いは変更されてもよい。例えば、動作時間を記録する処理が省略されてもよい。管理データを生成する処理が省略されてもよい。
本発明によれば、人工知能を用いて作業車両の動作を容易、且つ、精度良く判定することができる。
100 分類システム
111 分類モデル
103 プロセッサ
101 カメラ
200 学習システム

Claims (22)

  1. コンピュータによって実行される方法であって、
    動作中の作業車両を時系列的に示す複数の画像から生成された前記作業車両の動作変化を示す動作データを取得することと、
    学習済みの分類モデルを用いた画像分類を実行することにより、前記動作データから前記作業車両の動作の分類を決定することと、
    を備える方法。
  2. 前記動作データは、前記複数の画像の画素値を合成することで得られる、
    請求項1に記載の方法。
  3. 前記動作データは、前記複数の画像を重ね合わせて生成された重ね合わせ画像を示す、
    請求項1に記載の方法。
  4. 前記動作データは、前記複数の画像に含まれる一群の画像を示す、
    請求項1に記載の方法。
  5. 前記動作データは、前記複数の画像において互いに対応する画素の画素値の平均値で表される、
    請求項1に記載の方法。
  6. 動作中の前記作業車両を撮影した動画を取得することと、
    前記動画から前記複数の画像を抜き出すことと、
    抜き出した前記複数の画像から、前記動作データを生成すること、
    をさらに備える、
    請求項1から5のいずれかに記載の方法。
  7. 前記複数の画像を抜き出すことは、前記動画に含まれる連続したフレームの一部を飛ばして前記画像を抜き出すことを含む、
    請求項6に記載の方法。
  8. 前記動作データを生成することは、抜き出した前記複数の画像の一部を他と異なる濃さに変えることを含む、
    請求項6又は7に記載の方法。
  9. 前記動作データを生成することは、前記複数の画像をグレースケール化することを含む、
    請求項1から8のいずれかに記載の方法。
  10. 前記分類が示す前記作業車両の動作時間を記録することと、
    前記分類と前記動作時間とを含む管理データを生成すること、
    をさらに備える、
    請求項1から9のいずれかに記載の方法。
  11. 前記分類モデルは、ニューラルネットワークを含む、
    請求項1から10のいずれかに記載の方法。
  12. 学習済みの分類モデルと、
    プロセッサと、
    を備え、
    前記プロセッサは、
    動作中の作業車両を時系列的に示す複数の画像から生成された前記作業車両の動作変化を示す動作データを取得し、
    前記分類モデルを用いた画像分類を実行することにより、前記動作データから前記作業車両の動作の分類を決定するようにプログラムされている、
    システム。
  13. 前記作業車両の動画を撮影するカメラをさらに備え、
    前記プロセッサは、
    前記カメラから前記動画を取得し、
    前記動画から前記複数の画像を抜き出し、
    抜き出した前記複数の画像から、前記動作データを生成するようにプログラムされている、
    請求項12に記載のシステム。
  14. 前記プロセッサは、
    前記分類が示す前記作業車両の動作時間を記録し、
    前記分類と前記動作時間とを含む管理データを生成するようにプログラムされている、
    請求項12又は13に記載のシステム。
  15. 前記分類モデルは、ニューラルネットワークを含む、
    請求項12から14のいずれかに記載のシステム。
  16. 学習済み分類モデルの製造方法であって、
    動作中の作業車両を時系列的に示す複数の画像から生成された前記作業車両の動作変化を示す動作データと、前記動作データに割り当てられた前記作業車両の動作の分類とを含む学習データを取得することと、
    前記学習データにより前記分類モデルを学習させること、
    を備える製造方法。
  17. 動作中の前記作業車両を撮影した動画を取得することと、
    前記動画から前記複数の画像を抜き出すことと、
    抜き出した前記複数の画像から、前記動作データを生成することと、
    前記動作データに前記作業車両の動作の分類を割り当てること、
    をさらに備える、
    請求項16に記載の製造方法。
  18. 分類モデルを学習させるための学習データであって、
    動作中の作業車両を時系列的に示す複数の画像から生成された前記作業車両の動作変化を示す動作データと、
    前記動作データに割り当てられた前記作業車両の動作の分類と、
    を備える学習データ。
  19. 前記動作データは、前記複数の画像を重ね合わせて生成された重ね合わせ画像を示し、 前記重ね合わせ画像は、
    元の画像と、
    前記元の画像に対して、縮小、拡大、回転、平行移動、左右反転、及び色の変更のうちの1つ以上を施した複数の加工済み画像と、
    を含む、
    請求項18に記載の学習データ。
  20. 分類モデルを学習させるための学習データの製造方法であって、
    動作中の作業車両を時系列的に示す複数の画像を取得することと、
    前記複数の画像から前記作業車両の動作変化を示す動作データを生成することと、
    前記動作データに割り当てられる前記作業車両の動作の分類を取得すること、
    を備える製造方法。
  21. 前記作業車両を撮影した動画を取得することをさらに備え、
    前記複数の画像を取得することは、前記動画から前記複数の画像を抜き出すことを含む、
    請求項20に記載の製造方法。
  22. 学習済み分類モデルの製造方法であって、
    動作中の作業車両を時系列的に示す複数の画像から生成された前記作業車両の動作変化を示す動作データを取得することと、
    学習済みの第1の分類モデルを用いた画像分類を実行することにより、前記動作データから前記作業車両の動作の分類を決定することと、
    前記動作データと、決定された前記作業車両の動作の分類とを含む学習データにより、第2の分類モデルを学習させること、
    を備える製造方法。
JP2017217287A 2017-11-10 2017-11-10 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法 Active JP7345236B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2017217287A JP7345236B2 (ja) 2017-11-10 2017-11-10 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法
US16/500,028 US11556739B2 (en) 2017-11-10 2018-10-26 Method for estimating operation of work vehicle, system, method for producing trained classification model, training data, and method for producing training data
CN201880021484.4A CN110462628B (zh) 2017-11-10 2018-10-26 估计作业车辆的动作的方法、系统、分类模型的制造方法以及学习数据及其制造方法
PCT/JP2018/039830 WO2019093152A1 (ja) 2017-11-10 2018-10-26 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法
DE112018001587.4T DE112018001587T5 (de) 2017-11-10 2018-10-26 Verfahren zur schätzung von operationen eines arbeitsfahrzeugs, system, verfahren zur erzeugung eines trainierten klassifikationsmodells, trainingsdaten und verfahren zur erzeugung von trainingsdaten
KR1020197028316A KR20190120322A (ko) 2017-11-10 2018-10-26 작업 차량의 동작을 추정하기 위한 방법, 시스템, 학습된 분류 모델의 제조 방법, 학습 데이터, 및 학습 데이터의 제조 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017217287A JP7345236B2 (ja) 2017-11-10 2017-11-10 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法

Publications (2)

Publication Number Publication Date
JP2019087200A true JP2019087200A (ja) 2019-06-06
JP7345236B2 JP7345236B2 (ja) 2023-09-15

Family

ID=66438929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017217287A Active JP7345236B2 (ja) 2017-11-10 2017-11-10 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法

Country Status (6)

Country Link
US (1) US11556739B2 (ja)
JP (1) JP7345236B2 (ja)
KR (1) KR20190120322A (ja)
CN (1) CN110462628B (ja)
DE (1) DE112018001587T5 (ja)
WO (1) WO2019093152A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021047650A (ja) * 2019-09-18 2021-03-25 ヤフー株式会社 識別装置、識別方法及び識別プログラム
JP2021105962A (ja) * 2019-12-27 2021-07-26 株式会社安藤・間 教師データ生成装置、及び教師データ生成方法
WO2022113764A1 (ja) * 2020-11-25 2022-06-02 日立建機株式会社 動作把握システム
EP3940153A4 (en) * 2019-07-01 2023-01-11 Komatsu Ltd. METHOD FOR PRODUCING A TRAINED WORK CLASSIFICATION ESTIMATING MODEL, DATA FOR LEARNING, COMPUTER IMPLEMENTED METHOD, AND SYSTEM INCLUDING A CONSTRUCTION MACHINE

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7345236B2 (ja) * 2017-11-10 2023-09-15 株式会社小松製作所 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法
US11104345B2 (en) * 2018-04-18 2021-08-31 Rivian Ip Holdings, Llc Methods, systems, and media for determining characteristics of roads
KR20210059712A (ko) 2018-08-07 2021-05-25 블링크에이아이 테크놀로지스, 아이엔씨. 이미지 향상을 위한 인공지능 기법
JP7167668B2 (ja) * 2018-11-30 2022-11-09 コニカミノルタ株式会社 学習方法、学習装置、プログラムおよび記録媒体
JP7277256B2 (ja) * 2019-05-24 2023-05-18 コニカミノルタ株式会社 作業分析システム、作業分析装置、および作業分析プログラム
JP7310408B2 (ja) * 2019-07-29 2023-07-19 コベルコ建機株式会社 建設機械の作業情報生成システム
JP7124852B2 (ja) * 2020-07-30 2022-08-24 カシオ計算機株式会社 教師データの生成方法、教師データの生成装置及びプログラム
US20220135036A1 (en) * 2020-11-04 2022-05-05 Deere & Company System and method for work state estimation and control of self-propelled work vehicles
CA3199759A1 (en) * 2020-11-17 2022-05-27 Fyusion, Inc. Damage detection portal
US20230008129A1 (en) * 2021-07-12 2023-01-12 Caterpillar Inc. Systems and methods for improving machine performance based on machine application identification

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1060948A (ja) * 1996-08-21 1998-03-03 Yutani Heavy Ind Ltd 油圧ショベル
JPH10290450A (ja) * 1997-04-14 1998-10-27 Nippon Telegr & Teleph Corp <Ntt> フレーム多重画像作成方法
JP2002298143A (ja) * 2001-03-30 2002-10-11 Omron Corp 運動動作解析支援装置
KR101441107B1 (ko) * 2013-04-29 2014-09-23 주식회사 에스원 승강기내 이상 행동 판별 방법 및 그 장치
JP2017033047A (ja) * 2015-07-28 2017-02-09 株式会社コンピュータシステム研究所 安全管理支援装置、安全管理支援プログラムおよび記憶媒体

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999872A (en) * 1996-02-15 1999-12-07 Kabushiki Kaisha Kobe Seiko Sho Control apparatus for hydraulic excavator
US20060034535A1 (en) * 2004-08-10 2006-02-16 Koch Roger D Method and apparatus for enhancing visibility to a machine operator
US8570396B2 (en) * 2009-04-23 2013-10-29 Csr Technology Inc. Multiple exposure high dynamic range image capture
US8498448B2 (en) * 2011-07-15 2013-07-30 International Business Machines Corporation Multi-view object detection using appearance model transfer from similar scenes
JP5924961B2 (ja) * 2012-02-02 2016-05-25 住友建機株式会社 建設機械、建設機械管理システム、携帯通信端末、及び建設機械の作業状態を表示する方法
CA2884788A1 (en) 2012-09-20 2014-03-27 Volvo Construction Equipment Ab Method for automatically recognizing and setting attachment and device therefor
WO2015056809A1 (ja) * 2013-10-18 2015-04-23 楽天株式会社 画像生成装置、画像生成方法及び画像生成プログラム
WO2016157499A1 (ja) * 2015-04-02 2016-10-06 株式会社日立製作所 画像処理装置、物体検知装置、画像処理方法
US10514694B1 (en) * 2015-07-21 2019-12-24 Hrl Laboratories, Llc System and method for classifying agents based on agent movement patterns
US10579923B2 (en) * 2015-09-15 2020-03-03 International Business Machines Corporation Learning of classification model
JP6454632B2 (ja) * 2015-11-11 2019-01-16 日立建機株式会社 運搬車両
JP6144373B2 (ja) 2016-02-17 2017-06-07 住友建機株式会社 ショベル、ショベル管理システム、及び携帯通信端末
CN109564575B (zh) * 2016-07-14 2023-09-05 谷歌有限责任公司 使用机器学习模型来对图像进行分类
CN106125612B (zh) 2016-07-22 2019-03-12 厦门大学 一种装载机铲装过程的作业斗数识别方法与识别装置
US10163033B2 (en) * 2016-12-13 2018-12-25 Caterpillar Inc. Vehicle classification and vehicle pose estimation
JP7036610B2 (ja) * 2017-03-16 2022-03-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 学習方法およびプログラム
US20180313061A1 (en) * 2017-04-26 2018-11-01 Caterpillar Inc. Control system using fuzzy logic to display machine productivity data
US10873357B2 (en) * 2017-05-02 2020-12-22 Deere & Company Smart attachment for a work vehicle
KR102575200B1 (ko) * 2017-08-08 2023-09-05 스미토모 겐키 가부시키가이샤 쇼벨 및 쇼벨의 지원장치
JP7345236B2 (ja) * 2017-11-10 2023-09-15 株式会社小松製作所 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1060948A (ja) * 1996-08-21 1998-03-03 Yutani Heavy Ind Ltd 油圧ショベル
JPH10290450A (ja) * 1997-04-14 1998-10-27 Nippon Telegr & Teleph Corp <Ntt> フレーム多重画像作成方法
JP2002298143A (ja) * 2001-03-30 2002-10-11 Omron Corp 運動動作解析支援装置
KR101441107B1 (ko) * 2013-04-29 2014-09-23 주식회사 에스원 승강기내 이상 행동 판별 방법 및 그 장치
JP2017033047A (ja) * 2015-07-28 2017-02-09 株式会社コンピュータシステム研究所 安全管理支援装置、安全管理支援プログラムおよび記憶媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RYO SHIMIZU: "深層ニューラル・ネットワークの効率を劇的に上げる「蒸留」", WIRELESSWIRE NEWS [オンライン], JPN6018050825, 30 September 2016 (2016-09-30), ISSN: 0004912962 *
橋村 佳祐 他: "距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話", 電子情報通信学会技術研究報告, vol. 第116巻 第248号, JPN6018050823, 9 October 2016 (2016-10-09), JP, pages 17 - 22, ISSN: 0004912961 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3940153A4 (en) * 2019-07-01 2023-01-11 Komatsu Ltd. METHOD FOR PRODUCING A TRAINED WORK CLASSIFICATION ESTIMATING MODEL, DATA FOR LEARNING, COMPUTER IMPLEMENTED METHOD, AND SYSTEM INCLUDING A CONSTRUCTION MACHINE
JP2021047650A (ja) * 2019-09-18 2021-03-25 ヤフー株式会社 識別装置、識別方法及び識別プログラム
JP7109414B2 (ja) 2019-09-18 2022-07-29 ヤフー株式会社 識別装置、識別方法及び識別プログラム
JP2021105962A (ja) * 2019-12-27 2021-07-26 株式会社安藤・間 教師データ生成装置、及び教師データ生成方法
JP7412171B2 (ja) 2019-12-27 2024-01-12 株式会社安藤・間 教師データ生成装置、及び教師データ生成方法
WO2022113764A1 (ja) * 2020-11-25 2022-06-02 日立建機株式会社 動作把握システム
JP2022083497A (ja) * 2020-11-25 2022-06-06 日立建機株式会社 動作把握システム

Also Published As

Publication number Publication date
US11556739B2 (en) 2023-01-17
US20200050890A1 (en) 2020-02-13
WO2019093152A1 (ja) 2019-05-16
DE112018001587T5 (de) 2019-12-24
CN110462628A (zh) 2019-11-15
JP7345236B2 (ja) 2023-09-15
CN110462628B (zh) 2023-04-21
KR20190120322A (ko) 2019-10-23

Similar Documents

Publication Publication Date Title
WO2019093152A1 (ja) 作業車両の動作を推定するための方法、システム、学習済みの分類モデルの製造方法、学習データ、及び学習データの製造方法
JP7166088B2 (ja) 作業車両による作業を判定するためのシステム、方法、及び学習済みモデルの製造方法
JP6946831B2 (ja) 人物の視線方向を推定するための情報処理装置及び推定方法、並びに学習装置及び学習方法
JP4643766B1 (ja) 移動体検出装置及び移動体検出方法
CN111696196B (zh) 一种三维人脸模型重建方法及装置
CN112991413A (zh) 自监督深度估测方法和系统
KR101787542B1 (ko) 3차원 지형 모델과 토질 분류를 이용한 비탈면 안정성 평가 시스템 및 방법
JP6901803B2 (ja) フォールトトレランス及びフラクチュエーションロバスト性のための複数のニューラルネットワークを使用して揺れるカメラにより生成されたビデオからジッタリングを取り除くための学習方法及び学習装置、そしてそれを利用したテスト方法及びテスト装置
US20110208685A1 (en) Motion Capture Using Intelligent Part Identification
CN112837344A (zh) 一种基于条件对抗生成孪生网络的目标跟踪方法
CN113688797A (zh) 一种基于骨架提取的异常行为识别方法及系统
CN113781519A (zh) 目标跟踪方法和目标跟踪装置
CN114897728A (zh) 图像增强方法、装置、终端设备以及存储介质
CN114926726A (zh) 基于多任务网络的无人船感知方法及相关设备
CN111531546B (zh) 一种机器人位姿估计方法、装置、设备及存储介质
CN110569711B (zh) 面向人体动作识别方法
CN116385493A (zh) 野外环境下多运动目标检测与轨迹预测方法
JP2022189901A (ja) 学習方法、学習装置、プログラムおよび記録媒体
CN115018726A (zh) 一种基于U-Net的图像非均匀模糊核的估计方法
Haouas et al. Fusion of spatial autocorrelation and spectral data for remote sensing image classification
CN112734676A (zh) 一种空间尺度泛化的去雨方法
CN114067081A (zh) 一种基于双向增强网络的3d牙齿模型分割方法
Cariou et al. A point process for fully automatic road network detection in satellite and aerial images
JP2021149666A (ja) 対象検知装置、対象検知方法及び対象検知プログラム
CN117877064A (zh) 一种深层次聚合的全卷积多目标行人关键点检测方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221004

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20221004

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221017

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20221018

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20221111

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20221115

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20221122

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20230124

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230905

R151 Written notification of patent or utility model registration

Ref document number: 7345236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151