JP7079896B2 - 学習機能付き建設機械 - Google Patents

学習機能付き建設機械 Download PDF

Info

Publication number
JP7079896B2
JP7079896B2 JP2021522270A JP2021522270A JP7079896B2 JP 7079896 B2 JP7079896 B2 JP 7079896B2 JP 2021522270 A JP2021522270 A JP 2021522270A JP 2021522270 A JP2021522270 A JP 2021522270A JP 7079896 B2 JP7079896 B2 JP 7079896B2
Authority
JP
Japan
Prior art keywords
unit
command
data
learning
work
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021522270A
Other languages
English (en)
Other versions
JPWO2020241419A1 (ja
Inventor
雅幸 掃部
仁志 蓮沼
繁次 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawasaki Motors Ltd
Original Assignee
Kawasaki Jukogyo KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawasaki Jukogyo KK filed Critical Kawasaki Jukogyo KK
Publication of JPWO2020241419A1 publication Critical patent/JPWO2020241419A1/ja
Application granted granted Critical
Publication of JP7079896B2 publication Critical patent/JP7079896B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/26Indicating devices
    • E02F9/264Sensors and their calibration for indicating the position of the work tool
    • E02F9/265Sensors and their calibration for indicating the position of the work tool with follow-up actions (e.g. control signals sent to actuate the work tool)
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F3/00Dredgers; Soil-shifting machines
    • E02F3/04Dredgers; Soil-shifting machines mechanically-driven
    • E02F3/28Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets
    • E02F3/30Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets with a dipper-arm pivoted on a cantilever beam, i.e. boom
    • E02F3/32Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets with a dipper-arm pivoted on a cantilever beam, i.e. boom working downwardly and towards the machine, e.g. with backhoes
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F3/00Dredgers; Soil-shifting machines
    • E02F3/04Dredgers; Soil-shifting machines mechanically-driven
    • E02F3/28Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets
    • E02F3/36Component parts
    • E02F3/42Drives for dippers, buckets, dipper-arms or bucket-arms
    • E02F3/425Drive systems for dipper-arms, backhoes or the like
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F3/00Dredgers; Soil-shifting machines
    • E02F3/04Dredgers; Soil-shifting machines mechanically-driven
    • E02F3/28Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets
    • E02F3/36Component parts
    • E02F3/42Drives for dippers, buckets, dipper-arms or bucket-arms
    • E02F3/43Control of dipper or bucket position; Control of sequence of drive operations
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F3/00Dredgers; Soil-shifting machines
    • E02F3/04Dredgers; Soil-shifting machines mechanically-driven
    • E02F3/28Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets
    • E02F3/36Component parts
    • E02F3/42Drives for dippers, buckets, dipper-arms or bucket-arms
    • E02F3/43Control of dipper or bucket position; Control of sequence of drive operations
    • E02F3/435Control of dipper or bucket position; Control of sequence of drive operations for dipper-arms, backhoes or the like
    • E02F3/437Control of dipper or bucket position; Control of sequence of drive operations for dipper-arms, backhoes or the like providing automatic sequences of movements, e.g. linear excavation, keeping dipper angle constant
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F3/00Dredgers; Soil-shifting machines
    • E02F3/04Dredgers; Soil-shifting machines mechanically-driven
    • E02F3/28Dredgers; Soil-shifting machines mechanically-driven with digging tools mounted on a dipper- or bucket-arm, i.e. there is either one arm or a pair of arms, e.g. dippers, buckets
    • E02F3/36Component parts
    • E02F3/42Drives for dippers, buckets, dipper-arms or bucket-arms
    • E02F3/43Control of dipper or bucket position; Control of sequence of drive operations
    • E02F3/435Control of dipper or bucket position; Control of sequence of drive operations for dipper-arms, backhoes or the like
    • E02F3/438Memorising movements for repetition, e.g. play-back capability
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/2025Particular purposes of control systems not otherwise provided for
    • E02F9/205Remotely operated machines, e.g. unmanned vehicles
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/22Hydraulic or pneumatic drives
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/22Hydraulic or pneumatic drives
    • E02F9/2221Control of flow rate; Load sensing arrangements
    • E02F9/2225Control of flow rate; Load sensing arrangements using pressure-compensating valves
    • E02F9/2228Control of flow rate; Load sensing arrangements using pressure-compensating valves including an electronic controller
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/22Hydraulic or pneumatic drives
    • E02F9/2221Control of flow rate; Load sensing arrangements
    • E02F9/2232Control of flow rate; Load sensing arrangements using one or more variable displacement pumps
    • E02F9/2235Control of flow rate; Load sensing arrangements using one or more variable displacement pumps including an electronic controller
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/22Hydraulic or pneumatic drives
    • E02F9/2221Control of flow rate; Load sensing arrangements
    • E02F9/2239Control of flow rate; Load sensing arrangements using two or more pumps with cross-assistance
    • E02F9/2242Control of flow rate; Load sensing arrangements using two or more pumps with cross-assistance including an electronic controller
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/22Hydraulic or pneumatic drives
    • E02F9/2278Hydraulic circuits
    • E02F9/2282Systems using center bypass type changeover valves
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/22Hydraulic or pneumatic drives
    • E02F9/2278Hydraulic circuits
    • E02F9/2285Pilot-operated systems
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/26Indicating devices
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/26Indicating devices
    • E02F9/261Surveying the work-site to be treated
    • E02F9/262Surveying the work-site to be treated with follow-up actions to control the work tool, e.g. controller
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/26Indicating devices
    • E02F9/264Sensors and their calibration for indicating the position of the work tool
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0055Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots with safety arrangements
    • G05D1/0061Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots with safety arrangements for transition from automatic pilot to manual pilot and vice versa
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Mining & Mineral Resources (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Fluid Mechanics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Paleontology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Operation Control Of Excavators (AREA)

Description

本発明は、学習機能付き建設機械に関する。
学習機能を有する建設機械として、例えば、特許文献1に記載された建設機械が知られている。この建設機械では、転圧路の幅方向の重複長の目標値が学習される。
特許第6360583号特許公報
上記建設機械では、人が操作して建設機械が行う作業を学習し、学習した作業を自動的に行うことができない。
また、人が操作して建設機械が行う作業を学習する場合、単純に一般の学習方法を適用すると、建設機械による作業の品質を熟練の操作者による作業と同レベルに維持するために、学習の達成度を極限に高める必要がある。また、作業の態様に応じて建設機械の動作を変える必要があるが、作業の態様は無限に存在するため、実際の作業の態様に応じて建設機械の動作を適切に制御するためには、学習に対する膨大な学習用データ及び立ち上げ期間が必要とされる。そのため、建設機械による作業の自動化を短期間で達成することが困難である。
さらに、建設業界においては、少子高齢化により労働者が高齢化するとともに不足しており、熟練操作者の技能を伝承することが急務であるが、その技能の伝承者も同様に減少していくという問題があった。
本発明は上記のような課題を解決するためになされたもので、少なくとも、人が操作して建設機械が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械を提供することを第1の目的としている。
そして、第1の目的に加えて、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械を提供することを第2の目的とする。
本発明者等は、上記課題を解決するために鋭意検討した。その結果、以下の知見を得た。
建設機械では、作業部を含む動作部を、複数の油圧アクチュエータが駆動する。例えば、油圧ショベルを例に取ると、ブーム、アーム、バケット、及び運転席が動作部に相当し、ブーム、アーム、及びバケットを回動させる油圧シリンダと運転席を回動させる油圧モータとが油圧アクチュエータに相当する。
このため、操作部は、複数の油圧アクチュエータの数に応じた複数の操作レバーで構成され、操作者は、これらの複数の操作レバーを操作しながら作業を行う。また、建設機械が行う作業は、多様である。このため、従来、建設機械の作業を学習させることは難しいと考えられていた。
しかしながら、本発明者等は、建設作業においては、比較的簡単な定型作業が存在することに着目した。比較的簡単な定型作業であれば、学習することが比較的容易である。
一方、ある装置において、操作者の操作による作業を学習させるには、操作者の操作に重要な影響を及ぼす情報を特定し、それを学習時の入力データとして用いることが重要である。
そこで、本発明者等は、熟練した操作者の操作を分析した。その結果、以下のことが判明した。
操作者は、端的に言うと、目視で作業状況を確認し、建設機械の現在の動作状態を目視及び操作レバーの操作で感知するとともに作業対象からの反作用(リアクション)を体感することによって、次の操作を決定することを見出した。
油圧ショベルによる穴掘り作業を例に取ると、操作者は、目視で穴掘りの状況を確認し、バケット及びブームの姿勢を目視で認識するとともに操作レバーの現在の操作位置によって、バケット、ブーム及び運転席が現在どのように動作しようとしているかを直観する。また、バケットが地面に作用する(地面を掘る、土砂を掻き込む等する)と、その反作用を体感することによって、意図した作業(アクション)の当否を判断する。そして、これらを瞬時に勘案して次の操作を決定する。ここで、反作用とは、例えば、運転席の傾き、加速度、角加速度等である。また、操作者が次の操作を決定する際に駆動源であるエンジンの回転量、音等を重視することも判明した。
ここで、穴掘りの状況は作業状況を表す情報の一例である。操作位置は油圧ショベルの動作状態を表す情報の一例である。運転席の傾き等は、地面からの反作用の例である。エンジンの音等は、駆動源の状態を表す情報であり、ひいては油圧ショベルの動作状態を表す情報である。
そこで、本発明者等は、少なくとも、作業状況を表すデータと、動作部の動作状態を表すデータと、作業部の作業により動作部が作業対象から受ける反作用を表すデータとを、学習時の入力データ(予測基礎データ)として用いることを想到した。本発明はこのような知見に基づいてなされたものである。
上記目的を達成するために、本発明のある形態(aspect)に係る学習機能付き建設機械は、作業部を有し、前記作業部を、作業を行うよう動かす動作部と、操作者の操作に応じた指令を出力する操作部と、前記作業部による前記作業の状況を検知し、検知した作業状況を作業状況データとして出力する作業状況検知部と、前記動作部の動作状態を検知し、検知した動作状態を動作状態データとして出力する動作状態検知部と、前記作業部の作業により前記動作部が作業対象から受ける反作用を検知し、検知した反作用を反作用データとして出力する反作用検知部と、前記指令を時系列で指令データとして記憶するとともに、前記作業状況データ、前記動作状態データ、及び前記反作用データを含む予測基礎データを時系列で記憶する学習データ記憶部と、前記学習データ記憶部に記憶された前記予測基礎データを用いて前記学習データ記憶部に記憶された前記指令データを機械学習し、機械学習を終えた後、前記動作部の動作時に前記予測基礎データが入力され、前記指令の予測指令を出力する学習部と、前記指令、前記予測指令、又は前記指令及び前記予測指令に基づいて前記動作部を駆動する油圧駆動システムと、を備える。ここで、「指令データ」とは、「教師あり学習」の場合に、教師データとして用いられるデータを意味する。「予測基礎データ」は、機械学習の際に、学習部に動作指令を予測させるために学習部に入力されるデータを意味する。「作業部を・・・動かす」とは、「作業部を動作及び移動させる」ことを意味する。
この構成によれば、学習時において、熟練した操作者が建設機械を操作して、所定の作業を行う。すると、操作に応じた指令に対応する指令データと、作業部による作業状況のデータ、動作部の動作状態のデータ及び作業部の作業により動作部が作業対象から受ける反作用のデータを含む予測基礎データとが、学習データ記憶部に記憶される。そして、学習部が、学習データ記憶部に記憶された予測基礎データを入力することによって、予測指令を出力するよう学習データを機械学習する。これにより、熟練した操作者の操作が学習され、予測指令として出力することが可能になる。そして、機械学習を終えた後において、学習部に予測基礎データが入力されると、学習部が予測作指令を出力する。すると、油圧駆動システムが予測指令に基づいて動作部を駆動する。その結果、熟練した操作者の操作が学習され、その学習の結果として学習部から出力される予測指令に基づいて、当該作業が自動的に行われる。
従って、人が操作して建設機械が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械を提供することできる。
前記操作部が、前記指令として、前記操作者の操作に応じた動作指令を出力するよう構成され、学習データ記憶部が、前記動作指令を時系列で指令データとして記憶するとともに、前記作業状況データ、前記動作状態データ、及び前記反作用データを含む予測基礎データを時系列で記憶するよう構成され、前記学習部が、学習時において、前記学習データ記憶部に記憶された前記予測基礎データを用いて前記学習データ記憶部に記憶された前記指令データを機械学習し、前記機械学習を終えた後の自動制御時において、前記予測基礎データが入力され、前記予測指令である予測動作指令を出力するよう構成され、且つ、油圧駆動システムが、前記動作指令又は前記予測動作指令に従って前記動作部を駆動するよう構成されていてもよい。
この構成によれば、油圧駆動システムが、動作指令の予測指令である予測動作指令に従って動作部を駆動するよう構成されているので、熟練した操作者の操作の学習結果に従って、当該作業が自動的に行われる。
前記動作部が設けられた本体部を備え、前記反作用検知部が、前記動作部又は前記本体部の傾き、加速度、及び角加速度の少なくともいずれかを含む前記反作用を検知し、検知した反作用を前記反作用データとして出力してもよい。
この構成によれば、熟練した操作者が次の操作を決定する際に重視する、動作部又は本体部の傾き、加速度、又は角加速度が、予測基礎データに含まれるので、学習の精度が向上する。なお、動作部は本体部に設けられるので、動作部が作業対象から反作用を受けると、この反作用の影響が本体部に及ぶ。
前記動作状態検知部が、前記油圧駆動システムの作動油を加圧するポンプを駆動する駆動源の出力及び動作音の少なくともいずれかを含む駆動源の状態を検知し、検知した駆動源の状態を駆動源状態データとして出力する駆動源状態検知部を含み、前記動作状態データが、前記駆動源状態データを含んでいてもよい。
この構成によれば、熟練した操作者が次の操作を決定する際に重視する、駆動源の出力又は音が、予測基礎データに含まれるので、学習の精度が向上する。
前記動作状態データが、前記指令データを含んでいてもよい。ここで、「動作状態データが指令データを含む」とは、「教師あり学習」の場合に、学習データ記憶部に時系列で記憶された指令データが、逐次、教師データとして用いられ、当該教師データとして用いられる指令データより「時系列における以前」の時刻の指令データが動作状態データとして用いられることを意味する。
この構成によれば、熟練した操作者が次の操作を決定する際に重視する、現在の操作レバー(操作部)の位置に対応する動作指令が予測基礎データに含まれるので、学習の精度が向上する。
動作状態検知部が、前記動作部の姿勢を検知し、検知した姿勢を姿勢データとして出力する姿勢検知部をさらに備え、前記動作状態データが、前記姿勢データを含んでいてもよい。
この構成によれば、熟練した操作者が次の操作を決定する際に重視する、動作部の姿勢のデータが予測基礎データに含まれるので、学習の精度が向上する。
前記学習機能付き建設機械が、制御部を備える技能伝承建設機械であり、前記操作部が、前記指令として、前記操作者の操作に応じた手動動作修正指令を出力するよう構成され、前記油圧駆動システムが、基本動作指令と自動動作修正指令と前記手動動作修正指令とに従って前記動作部を駆動するよう構成され、且つ、前記制御部が、前記動作部によって前記作業部に基本的な動きをさせる前記基本動作指令を出力する基本動作指令部と、前記自動動作修正指令に前記手動動作修正指令を加えて動作修正指令を生成する動作修正指令生成部と、前記動作修正指令を前記指令データとして時系列で記憶する動作修正指令記憶部と前記予測基礎データを時系列で記憶する予測基礎データ記憶部とを含む前記学習データ記憶部と、前記学習部と、を備え、前記学習部が、前記予測基礎データ記憶部に記憶された前記予測基礎データを用いて前記動作修正指令記憶部に記憶された前記動作修正指令を機械学習し、機械学習を終えた後、前記動作部の動作時に前記予測基礎データが入力され、前記予測指令である前記自動動作修正指令を出力するよう構成されていてもよい。
この構成によれば、動作部は、油圧駆動システムを介して、基本動作指令と自動動作修正指令と手動動作修正指令とに従って作業部を動かすので、動作部の動作を、操作者が修正せず且つ学習部が自動動作修正しない場合、動作部は基本動作指令部が出力する基本動作指令に従って作業部に基本的な動きをさせる。操作者は、目視によって作業部による作業を確認しながら作業部の動きを監視し、基本的な動きによって所定作業が熟練した動きで行われないときには、所定作業を、熟練した動きで遂行するよう手動で修正する。すると、この手動修正に応じた手動動作修正指令が操作部から出力されることによって基本的な動きが修正され、それにより、所定作業が熟練した動きで遂行される。
一方、この所定作業に関する手動動作修正指令が、学習部が出力する自動動作修正指令に加えられて動作修正指令が生成され、この動作修正指令が学習部によって機械学習される。
上述のように学習部が自動修正をしない場合、学習部は操作者の手動の動作修正に基づく手動動作修正指令のみを学習する。学習部には、動作部の動作時において、作業部の動きに対応する予測基礎データが入力されるので、上記と類似の所定作業が熟練した動きで遂行されない動作状態が生じた場合には、学習部から上述の学習により予測される動作修正指令が自動動作修正指令として出力される。これにより、基本動作指令が、所定作業が熟練した動きで遂行される方向に自動修正され、当該自動修正が適切であれば、所定の作業が熟練した動きで遂行される。
しかし、学習が不十分である場合や、所定作業が熟練した動きで遂行されない場合における動作部の動作状態が、学習により予測されたものとかなり異なる場合等には、当該修正が行われたにも関わらず所定作業が熟練した動きで遂行されない。すると、操作者が所定の作業を、熟練した動きで遂行するよう手動で動作修正を行い、それにより、動作部によって所定の作業が熟練した動きで遂行される。そして、このさらなる手動の動作修正に対応する手動動作修正指令が、前回の手動の動作修正に対応する自動動作修正指令に加えられて、学習部によって学習される。
これにより、作業部の基本的な動きに対する学習部の修正能力が向上する。以降、これらの動作が繰り返され、作業部の基本的な動きに対する学習部の修正能力が操作者と同等のレベルまで向上すると、操作者による作業部の基本的な動きに対する修正が不要になる。この状態においては、学習部が、操作者に代わって、作業部の基本的な動きを適切に修正し、作業部に所定作業を適切に遂行させる。
このようにして、操作者が熟練者である場合、操作者の手動の動作修正が熟練者の「技能」を構成し、この「技能」が学習部に蓄積されて当該学習部に伝承され、学習部が熟練者の「技能」の「伝承者」になる。その結果、当該学習部を備える建設機械が「技能伝承建設機械」になる。
また、上記構成によれば、動作部が、油圧駆動システムを介して、基本動作指令と自動動作修正指令と手動動作修正指令とに従って動作するよう構成されているので、学習部から不十分な自動動作修正指令が出力されても、操作者が作業部の動きを見ながら手動の動作修正を行って動作部に適切な動作をさせることができる。このため、現場の実務で適切な動作の試行及び修正を行うことができる。換言すると、現場の実務を通して学習部に学習をさせることができるので、学習部に対する膨大な学習用データ及び立ち上げ期間が不要である。その結果、所定作業の自動化を短期間で達成することができる。
また、上記構成によれば、所定作業に関する作業部の基本的な動きのうち修正が不要である部分は、基本動作指令部によって自動的に遂行されるので、操作者は、必要な修正のみを行えばよい。よって、操作者の負担が軽減される。また、熟練者であっても作業がばらつくので、このように一部の作業のみを操作者の操作によって行うと、全ての作業を操作者の操作によって行う場合に比べて作業の精度が向上する。
また、操作者の手動の動作修正に対応する手動動作修正指令を記憶部に記憶することによって、熟練者の技能を伝承することが考えられるが、作業部の基本的な動きを修正しなければならない態様は無限に存在するので、そのような手法によって、熟練者の技能を伝承することは現実には困難である。一方、上記構成のように学習部を用いると、作業部の基本的な動きを修正しなければならない事象が発生する度にその態様に応じた手動の動作修正(正確には手動動作修正指令)を学習部に学習させることによって、熟練者の技能の伝承を容易に実現することができる。
さらに、上記構成によれば、動作部の動作時において、熟練した操作者が建設機械を操作し、基本動作指令及び自動動作修正指令に従った作業部の動きを必要に応じて修正しながら所定の作業を行う。すると、作業部による作業状況のデータ、動作部の動作状態のデータ、及び作業部の作業により動作部が作業対象から受ける反作用のデータを含む予測基礎データが予測基礎データ記憶部に記憶されるとともに、自動動作修正指令に手動動作修正指令が加えられた動作修正指令が動作修正指令記憶部に記憶される。そして、その後の学習時に、学習部が、予測基礎データ記憶部に記憶された予測基礎データを用いて動作修正指令記憶部に記憶された動作修正指令を機械学習する。これにより、熟練した操作者の修正操作が学習され、自動動作修正指令として出力することが可能になる。そして、その後の動作部の動作時において、学習部に予測基礎データが入力されると、学習部が自動動作修正指令を出力する。すると、油圧駆動システムが、基本動作指令とこの自動動作修正指令とを反映しながら動作部を駆動する。その結果、熟練した操作者の修正操作が学習された結果としての自動動作修正指令が反映された作業が行われる。従って、基本動作指令部による作業部の基本的な動作を操作者が修正操作するようにして、建設機械が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械を提供することできる。
これにより、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械を提供することができる。
前記手動動作修正指令が電気指令信号であり、前記動作部が、前記作業部を駆動する油圧アクチュエータと、前記基本動作指令、前記自動動作修正指令、及び前記手動動作修正指令に従って前記油圧アクチュエータの動作を油圧制御する制御弁と、を備え、前記制御弁が、電磁弁であってもよい。
この構成によれば、手動動作修正指令が電気指令信号であるので、手動動作修正指令を直接数値データ化することできる。このため、基本動作指令、自動動作修正指令、及び手動動作修正指令の加算、自動動作修正指令及び手動動作修正指令の加算、及び、動作修正指令の記憶部への記憶処理を容易に行うことができるので、手動動作修正指令が油圧信号で且つ制御弁が油圧制御弁である場合に比べて、これらの処理に関する構成を簡素化することができる。
本発明は、人が操作して建設機械が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械を提供することができるという効果を奏する。
また、本発明の特定の態様は、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械を提供できるという効果を奏する。
図1は、本発明の実施形態に係る学習機能付き建設機械の概念を示す機能ブロック図である。 図2は、本発明の実施形態1に係る学習機能付き建設機械の制御系統の構成を示す機能ブロック図である。 図3は、学習機能付き建設機械の一例である学習機能付き油圧ショベルのハードウエアの構成を示す側面図である。 図4は、図3の学習機能付き油圧ショベルの油圧駆動システムの主油圧回路を示す油圧回路図である。 図5は、図3の学習機能付き油圧ショベルの油圧駆動システムの操作系油圧回路を示す油圧回路図である。 図6は、図3の学習機能付き油圧ショベルの制御系統の構成を示す機能ブロック図である。 図7は、図3の学習機能付き油圧ショベルにおける予測動作指令、学習用指令データ、予測基礎データ、及び学習用予測基礎データのそれぞれの時系列データを示す模式図である。 図8は、図6の学習部の構成を示す機能ブロック図である。 図9は、図3の学習機能付き油圧ショベルによる建設作業の状況を示す模式図である。 図10は、本発明の実施形態2に係る学習機能付き建設機械の一例である学習機能付き油圧ショベルのハードウエアの構成を示す側面図である。 図11は、図10の学習機能付き油圧ショベルの制御系統の構成を示す機能ブロック図である。 図12は、本発明の実施形態3に係る学習機能付き建設機械の一例である学習機能付き油圧ショベルのハードウエアの構成を示す側面図である。 図13は、図12の学習機能付き油圧ショベルの制御系統の構成を示す機能ブロック図である。 図14は、本発明の実施形態4に係る技能伝承建設機械の制御系統の構成を示す機能ブロック図である。 図15は、技能伝承建設機械の一例である技能伝承油圧ショベルのハードウエアの構成を示す側面図である。 図16は、図15の技能伝承油圧ショベルの油圧駆動システムの主油圧回路を示す油圧回路図である。 図17は、図15の技能伝承油圧ショベルの油圧駆動システムの操作系油圧回路を示す油圧回路図である。 図18は、図15の技能伝承油圧ショベルの制御系統の構成を示す機能ブロック図である。 図19は、図15の技能伝承油圧ショベルの動作におけるサイクルタイムを例示する模式図である。 図20は、図15の技能伝承油圧ショベルにおける動作修正指令、学習用動作修正指令、予測基礎データ、及び学習用予測基礎データのそれぞれの時系列データを示す模式図である。 図21は、図20の学習部の構成を示す機能ブロック図である。 図22は、図15の技能伝承油圧ショベルによる建設作業の状況を示す模式図である。 図23(a)~(c)は、油圧ショベル20による穴掘り作業が隅部の掘り下げ作業における修正操作によって改善される過程を模式的に示す断面図である。 図24(a)~(c)は、油圧ショベル20による穴掘り作業が穴掘り予定地の地質に応じた修正操作によって改善される過程を模式的に示す断面図である。 図25は、本発明の実施形態5に係る技能伝承建設機械の一例である技能伝承油圧ショベルのハードウエアの構成を示す側面図である。 図26は、図25の技能伝承油圧ショベルの制御系統の構成を示す機能ブロック図である。 図27は、本発明の実施形態6に係る技能伝承建設機械の一例である技能伝承油圧ショベルのハードウエアの構成を示す側面図である。 図28は、図27の技能伝承油圧ショベルの制御系統の構成を示す機能ブロック図である。 図29は、本発明の実施形態7に係る技能伝承建設機械の一例である技能伝承油圧ショベルの動作指令生成部の構成を示す機能ブロック図である。
以下、本発明の実施の形態を、図面を参照しながら説明する。なお、以下では全ての図面を通じて同一又は相当する要素には同一の参照符号を付して、その重複する説明を省略する。また、本発明は、以下の実施形態に限定されない。
(概念)
図1は、本発明の実施形態に係る学習機能付き建設機械の概念を示す機能ブロック図である。
図1を参照すると、本発明の実施形態に係る学習機能付き建設機械1000は、作業部104を有し、作業部104を、作業を行うよう動かす動作部103と、操作者の操作に応じた指令201を出力する操作部101と、作業部104による作業の状況を検知し、検知した作業状況を作業状況データ212として出力する作業状況検知部112と、動作部103の動作状態を検知し、検知した動作状態を動作状態データ213として出力する動作状態検知部113と、作業部104の作業により動作部103が作業対象から受ける反作用を検知し、検知した反作用を反作用データ214として出力する反作用検知部114と、指令201を時系列で指令データ211として記憶するとともに、作業状況データ212、動作状態データ213、及び反作用データ214を含む予測基礎データPdを時系列で記憶する学習データ記憶部115と、学習データ記憶部115に記憶された予測基礎データPdを用いて学習データ記憶部115に記憶された指令データ211を機械学習し、機械学習を終えた後、動作部103の動作時に予測基礎データPdが入力され、指令201の予測指令1103を出力する学習部118と、指令201、予測指令1103、又は指令201及び予測指令1103に基づいて動作部103を駆動する油圧駆動システム105と、を備える。
参照符号102は、学習機能付き建設機械1000の本体部を示す。動作部103及び油圧駆動システム105は、本体部102に設けられる。
指令データ生成部1101は、指令201に基づいて指令データ211を生成する。指令データ211の生成には、例えば、操作部101から出力される油圧の指令を指令データに変換する形態(実施形態1乃至3)、及び、操作部101から出力される指令に学習部118から出力される予測指令を加算する形態(実施形態4乃至7)がある。
学習データ記憶部115は、指令データ記憶部1102及び予測基礎データ記憶部117を備える。指令データ記憶部1102は、学習時又は動作時に指令データ211を記憶し、これを学習時に学習用の指令データ211’として学習部118出力する。予測基礎データ記憶部117は、学習時又は動作時に予測基礎データPd(212~214)を記憶し、これを学習時に学習用の予測基礎データPd’として学習部118に出力する。
このような学習機能付き建設機械1000によれば、学習時(実施形態4乃至7では前回動作時)において、熟練した操作者が建設機械を操作して、所定の作業を行う。すると、操作に応じた指令に対応する指令データ211と、作業部104による作業状況のデータ212、動作部103の動作状態のデータ213及び作業部104の作業により動作部103が作業対象から受ける反作用のデータ214を含む予測基礎データPdとが、学習データ記憶部115に記憶される。そして、学習部118が、学習データ記憶部115に記憶された予測基礎データPd’を入力することによって、予測指令1103を出力するよう学習データ211’,Pd’を機械学習する。これにより、熟練した操作者の操作が学習され、予測指令1103として出力することが可能になる。そして、機械学習を終えた後において、学習部118に予測基礎データPdが入力されると、学習部118が予測指令1103を出力する。すると、油圧駆動システム105が予測指令1103に基づいて動作部103を駆動する。その結果、熟練した操作者の操作が学習され、その学習の結果として学習部118から出力される予測指令1103に基づいて、当該作業が自動的に行われる。
従って、人が操作して建設機械が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械1000を提供することできる。
以下、この学習機能付き建設機械1000の概念を具体化した実施形態を順に説明する。以下の実施形態は、学習機能付き建設機械に関する実施形態1乃至3と、学習機能付き建設機械であって、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械に関する実施形態4乃至7とに大別される。
(実施形態1)
{概要}
まず、実施形態1の学習機能付き建設機械の概要を説明する。
[構成]
図2は、本発明の実施形態1に係る学習機能付き建設機械の制御系統の構成を示す機能ブロック図である。図2において矢印は、指令、動力、情報、データの流れを示す。実線の矢印は、自動制御時における指令又はデータの流れを示し、破線は学習時における指令又はデータの流れを示す。なお、後述するように過去の予測基礎データが学習に用いられる場合には、自動制御時においても破線で示されるデータの流れが生じる。このことは、図6、1113においても同様である。
図2を参照すると、実施形態1の学習機能付き建設機械100は、操作部101と、本体部102と、動作部103と、油圧駆動システム105と、動作指令検知部110と、作業状況検知部112と、動作状態検知部113と、反作用検知部114と、学習データ記憶部115と、学習部118と、操作部駆動部119と、を備える。また、学習機能付き建設機械100は、図示されない全体制御部及び動作モード切替操作部を有し、操作者による動作モード切替操作部の操作に応じて、全体制御部が学習機能付き建設機械100の動作モードを学習モード又は自動制御モードに切り替える。以下では、学習機能付き建設機械100が学習モードで動作する時を「学習時」といい、学習機能付き建設機械100が自動制御モードで動作する時を「自動制御時」という。
実施形態1では、操作部101が、指令として、操作者の操作に応じた動作指令201を出力するよう構成され、学習データ記憶部115が、動作指令201を時系列で指令データ211として記憶するとともに、作業状況データ212、動作状態データ213、及び反作用データ214を含む予測基礎データPdを時系列で記憶するよう構成され、学習部118が、学習時において、学習データ記憶部115に記憶された予測基礎データPd’を用いて学習データ記憶部115に記憶された指令データ211’を機械学習し、機械学習を終えた後の自動制御時において、予測基礎データPdが入力され、予測指令1103である予測動作指令Pfを出力するよう構成され、且つ、油圧駆動システム105が、動作指令201又は予測動作指令Pfに従って動作部103を駆動するよう構成されている。なお、動作指令201は、指令データ生成部1101としての動作指令検知部110によって、指令データ211に変換される。
以下、この学習機能付き建設機械100の構成を詳しく説明する。
操作部101は、操作者の操作に応じた動作指令201を出力する。
本体部102には、動作部103が連結されている。
動作部103は、作業を行う作業部104を有し、作業部104を、作業を行うよう動かす。ここで、「作業部104を・・・動かす」とは、「作業部104を動作及び移動させる」ことを意味する。
「建設機械」は、操作者の操作に従って動作部が作業部を動かすことによって、建設作業を行うことができる作業機械であればよい。「建設機械」として、油圧ショベル、ブルドーザー、トラクタショベル、ホイールローダー、トレンチャー、掘削機、クレーン、リフト車等が例示される。
油圧駆動システム105は、本体部102と動作部103とに跨って設けられる。油圧駆動システム105は、操作部101から出力される動作指令201又は学習部118から出力される予測動作指令Pfに従って駆動力202を出力し、それにより動作部103を駆動する。
動作指令検知部110は、操作部101から出力される動作指令201を検知し、これを指令データ211として出力する。具体的には、動作指令201が油圧指令(パイロット圧指令)である場合に、これを電気データである指令データ211に変換して出力する。従って、動作指令検知部110は、必須の要素ではない。動作指令201が電気指令である場合には、動作指令検知部110を省略し、動作指令201を、直接、後述する指令データ記憶部116及び学習部118に入力してもよい。後述する学習機能付き油圧ショベル10では、アクセル装置50が出力するアクセル指令(電気指令)である動作指令201が指令データ211として、直接、指令データ記憶部116及び学習部118に入力される。
作業状況検知部112は、作業部104による作業の状況を検知し、検知した作業状況を作業状況データ212として出力する。
動作状態検知部113は、動作部103の動作状態を検知し、検知した動作状態を動作状態データ213として出力する。
予測基礎データは、作業状況データ212、動作状態データ213、及び反作用データ214を含む。便宜上、学習時に用いられる予測基礎データに参照符号Pd’を付与し、自動制御時に用いられる予測基礎データに参照符号Pdを付与する。また、予測基礎データは、指令データ211を含んでもよい
反作用検知部114は、作業部104の作業により動作部103又は本体部102が作業対象から受ける反作用を検知し、検知した反作用を反作用データ214として出力する。
学習データ記憶部115は、指令データ記憶部116と予測基礎データ記憶部117とを備える。
指令データ記憶部116は、指令記憶部1102として、指令データ211を時系列で記憶する。予測基礎データ記憶部117は、指令データ211、作業状況データ212、動作状態データ213、及び反作用データ214を含む予測基礎データPdをそれぞれ時系列で記憶する。
学習部118は、機械学習する学習モデルであり、そのような学習モデルとして、ニューラルネットワーク、回帰モデル、木モデル、ベイズモデル、時系列モデル、クラスタリングモデル、アンサンブル学習モデル等が例示される。本実施形態では、学習モデルは、ニューラルネットワークである。学習の形態は、教師あり学習でも教師なし学習でも構わない。また、ディープラーニングであってもよい。
学習部118は、例えば教師あり学習の場合、学習時において、指令データ記憶部116に記憶された指令データを学習用指令データPf’として読み出すとともに、予測基礎データ記憶部117に記憶された予測基礎データを学習用予測基礎データPd’として読み出す。そして、学習用指令データPf’を教師データとし、学習用予測基礎データPd’を入力データとして、学習データを作成する。そして、入力データである予測基礎データPd’を機械学習モデル(例えばニューラルネットワーク)に入力し、出力と教師データPf’との差異を評価し、その評価を機械学習モデルにフィードバックする。これにより、機械学習モデルが学習データを機械学習する。機械学習が終了すると、学習部118は、機械学習モデルの出力を予測動作指令Pfとして、外部に出力する。具体的には、自動制御時において、学習部118では、機械学習モデルが、予測基礎データPdが入力されると、予測動作指令Pfを出力する。
操作部駆動部119は、自動制御時において、学習部118から出力される予測動作指令Pfに従って操作部101を操作する。これにより、操作部101から動作指令201が出力され、この動作指令201に従って、油圧駆動システム105が動作部103を駆動する。つまり、操作部駆動部119及び操作部101は、予測動作指令Pfを動作指令201に変換する予測動作指令変換部120として機能する。操作部駆動部119は、例えば、モータ、マニピュレータ(ロボット)等で構成される。
従って、操作部駆動部119は、必須の要素ではない。例えば、操作部駆動部119に代えて、電気指令信号である予測動作指令Pfを油圧指令(パイロット圧指令)に変換する予測動作指令変換部を設け、自動制御時には、操作部101からの動作指令に代えて、この予測動作指令変換部の出力を油圧駆動システム105に入力するように構成してもよい。予測動作指令変換部は、例えば、電磁弁からなるパイロット弁(電磁比例弁)で構成することができる。なお、学習機能付き建設機械100が、操作部101から電気指令の動作指令201が出力されるように構成されている場合には、予測動作指令変換部120は不要であり、学習部118から出力される予測動作指令Pfが直接油圧駆動システム105に入力される。
油圧駆動システム105は、このように、操作部駆動部119及び操作部101により動作指令に変換された予測動作指令Pfに従って動作部103を駆動する。
[動作]
学習時において、熟練した操作者が学習機能付き建設機械100を操作して、所定の作業を行う。すると、操作に応じた動作指令201に対応する指令データ211と、作業部104による作業の状況を表す作業状況データ212、動作部の動作状態を表す動作状態データ213、及び作業部104の作業により動作部103又は本体部102が作業対象から受ける反作用を表す反作用データ214を含む予測基礎データとが、学習データ記憶部115に記憶される。上記所定作業は、例えば、比較的簡単な定型作業である。このような定型作業として、穴掘り作業、整地作業、転圧作業等が例示される。
そして、学習時において、学習部118が、指令データ記憶部116に記憶された指令データを学習用指令データPf’として読み出すとともに、予測基礎データ記憶部117に記憶された予測基礎データを学習用予測基礎データPd’として読み出す。そして、学習用指令データPf’を教師データとし、学習用予測基礎データPd’を入力データとして、学習データを作成する。そして、学習部118が、この学習データを機械学習する。機械学習が終了した学習部118は、自動制御時において、予測基礎データPdが入力されると、予測動作指令Pfを出力する。すると、油圧駆動システム105が、操作部駆動部119及び操作部101により動作指令201に変換された予測動作指令Pfに従って動作部103を駆動する。その結果、熟練した操作者の操作が学習され、その学習の結果として学習部118から出力される予測動作指令Pfに従って、当該作業が自動的に行われる。
このように、実施形態1によれば、油圧駆動システム105が、動作指令201の予測指令である予測動作指令Pfに従って動作部103を駆動するよう構成されているので、熟練した操作者の操作の学習結果に従って、当該作業が自動的に行われる。
{具体的構成}
次に、学習機能付き建設機械100の具体的な構成を、建設機械の一例である油圧ショベル10を例に取って説明する。
[ハードウエアの構成]
<全体構成>
まず、学習機能付き油圧ショベル10の全体構成を説明する。
図3は、学習機能付き建設機械の一例である学習機能付き油圧ショベル10のハードウエアの構成を示す側面図である。
学習機能付き油圧ショベル(以下、単に油圧ショベルという場合がある)10は、本体部102を備える。本体部102には、走行体19が設けられている。走行体19は、例えば、無限軌道(キャタピラ)を備えた車両走行装置で構成される。
本体部102の上には、旋回体15が、鉛直な第1回転軸線A1の周りに旋回可能に設けられている。旋回体15には、運転席(不図示)が設けられ、運転席に操作部101(図6参照)が設けられている。なお、図6の操作部101には示されていないが、運転席には、走行体19を操作する走行操作装置が設けられている。旋回体15には、さらに、旋回体15を旋回させる旋回モータ14が設けられている。旋回モータ14は、油圧モータで構成されている。また、旋回体15には、走行用のエンジン26(図6参照)が設けられている。エンジン26は、作業時には、油圧駆動システム1のポンプ部107(図6参照)を駆動する。
旋回体15には、ブーム16の基端部が、水平な第2回動軸線A2の周りに回動自在に連結されている。ブーム16の基端部及び旋回体15には、それぞれ、ブームシリンダ11の先端部及び基端部が回動自在に連結されており、ブームシリンダ11が伸縮することによって、ブーム16が第2回動軸線A2を中心に揺動する。
ブーム16の先端部には、アーム17の基端部が、水平な第3回動軸線A3の周りに回動自在に連結されている。アーム17の基端部及びブーム16の中央部にはそれぞれアームシリンダ12の先端部及び基端部が回動自在に連結されており、アームシリンダ12が伸縮することによって、アーム17が第3回動軸線A3を中心に揺動する。
アーム17の先端部には、バケット18の基端部が、水平な第4回動軸線A4の周りに回動自在に連結されている。バケット18の基端部及びアーム17の中央部にはそれぞれバケットシリンダ13の先端部及び基端部が回動自在に連結されており、バケットシリンダ13が伸縮することによって、バケット18が第4回動軸線A4を中心に回動する。バケット18はアタッチメントの一例であり、他のアタッチメントを取り付けてもよい。
ブーム16、アーム17、及びバケット18がフロント作業機を構成する。また、バケット18が作業部104を構成し、旋回体15及びフロント作業機(ブーム16、アーム17、及びバケット18)が動作部103を構成する。
油圧ショベル10は、これらの他に、左右一対の油圧走行モータ(不図示)を備える。
操作者は、操作部101(不図示の走行操作装置を含む)を操作することによって、油圧ショベルを所望の場所に位置させ、旋回体15を旋回させ、ブーム16,17の姿勢を変化させ、且つ、バケット18を回動させることによって所望の作業を行う。
学習機能付き油圧ショベル10は、さらに、第1撮像器311を備える。第1撮像器311はバケット18による作業の状況を撮像する。第1撮像器311によって撮像された撮像画像は、後述する画像処理部312(図6参照)において、作業状況を表すデータが得られるように画像処理され、画像処理部312から作業状況データ212として出力される。第1撮像器311の光軸321は、作業対象に向けられる。
第1撮像器311は、例えば、3次元カメラ、深度センサ付きカメラ等によって構成される。第1撮像器311は、例えば、適宜な支持部材を介して本体部102に固定され、あるいは、適宜な支持部材を介して油圧ショベル10の車両とは別個の固定物体(地面等)に固定され、あるいは、ドローンに搭載される。
<油圧駆動システム1>
次に、油圧ショベル10を動作させる油圧駆動システム1を説明する。
図4は、学習機能付き油圧ショベル10の油圧駆動システム1の主油圧回路を示す油圧回路図である。図5は、学習機能付き油圧ショベル10の駆動システムの操作系油圧回路を示す油圧回路図である。主油圧回路及び操作系油圧回路は、旋回体15に設けられている。
油圧駆動システム1は、上述のように、油圧アクチュエータとしてブームシリンダ11、アームシリンダ12、及びバケットシリンダ13を含むとともに、旋回モータ14及び左右一対の油圧走行モータ(不図示)を含む。
図4を参照すると、油圧駆動システム1は、上述のアクチュエータへ作動油を供給するための第1主ポンプ21及び第2主ポンプ23を含む。なお、図4では、図面の簡略化のために、旋回モータ14以外のアクチュエータを省略している。
第1主ポンプ21及び第2主ポンプ23は、エンジン26により駆動される。また、エンジン26は、副ポンプ25も駆動する。第1主ポンプ21、第2主ポンプ23及び副ポンプ25がポンプ部107(図6参照)を構成する。エンジン26は、アクセル装置50(図6参照)により出力を調整される。アクセル装置50は、例えば、アクセルペダルを備え、その踏み込み量に応じた電気指令であるアクセル指令をエンジン制御装置(不図示)に出力する。エンジン制御装置は、アクセル指令に従ってエンジン26の出力(回転速度)を制御する。
第1主ポンプ21及び第2主ポンプ23は、例えば、傾転角に応じた流量の作動油を吐出する可変容量型のポンプである。ここでは、第1主ポンプ21及び第2主ポンプ23が、斜板の角度により傾転角が規定される斜板ポンプである。但し、第1主ポンプ21及び第2主ポンプ23は、駆動軸とシリンダブロックのなす角により傾転角が規定される斜軸ポンプであってもよい。
第1主ポンプ21の吐出流量Q1及び第2主ポンプ23の吐出流量Q2は、電気ポジティブコントロール方式により制御される。具体的には、第1主ポンプ21の傾転角が第1流量調整装置22により調整され、第2主ポンプ23の傾転角が第2流量調整装置24により調整される。副ポンプ25は、サブブリードライン37を通じて第1流量調整装置22及び第2流量調整装置24に接続されている。副ポンプ25は、第1流量調整装置22及び第2流量調整装置24の駆動源として機能する。第1流量調整装置22及び第2流量調整装置24については、詳細に後述する。
第1主ポンプ21からは、第1センターブリードライン31がタンクまで延びている。第1センターブリードライン31上には、アーム第1制御弁41及び旋回制御弁43を含む複数の制御弁(アーム第1制御弁41及び旋回制御弁43以外は図示せず)が配置されている。各制御弁は、ポンプライン32により第1主ポンプ21と接続されている。つまり、第1センターブリードライン31上の制御弁は、第1主ポンプ21に対してパラレルに接続されている。また、各制御弁は、タンクライン33によりタンクと接続されている。
同様に、第2主ポンプ23からは、第2センターブリードライン34がタンクまで延びている。第2センターブリードライン34上には、アーム第2制御弁42及びバケット制御弁44を含む複数の制御弁(アーム第2制御弁42及びバケット制御弁44以外は図示せず)が配置されている。各制御弁は、ポンプライン35により第2主ポンプ23と接続されている。つまり、第2センターブリードライン34上の制御弁は、第2主ポンプ23に対してパラレルに接続されている。また、各制御弁は、タンクライン36によりタンクと接続されている。
アーム第1制御弁41は、アーム第2制御弁42と共にアームシリンダ12に対する作動油の供給及び排出を制御する。つまり、アームシリンダ12へは、アーム第1制御弁41を介して第1主ポンプ21から作動油が供給されるとともに、アーム第2制御弁42を介して第2主ポンプ23から作動油が供給される。アーム第1制御弁41及びアーム第2制御弁42がアーム制御弁40(図5参照)を構成する。
旋回制御弁43は、旋回モータ14に対する作動油の供給及び排出を制御する。つまり、旋回モータ14へは、旋回制御弁43を介して第1主ポンプ21から作動油が供給される。具体的には、旋回モータ14は、一対の給排ライン61,62により旋回制御弁43と接続されている。給排ライン61,62のそれぞれからは逃しライン63が分岐しており、逃しライン63はタンクにつながっている。各逃しライン63には、リリーフ弁64が設けられている。また、給排ライン61,62は、一対のメイクアップライン65によりタンクとそれぞれ接続されている。各メイクアップライン65には、タンクから給排ライン(61または62)に向かう流れは許容するがその逆の流れは禁止する逆止弁66が設けられている。
バケット制御弁44は、バケットシリンダ13に対する作動油の供給及び排出を制御する。つまり、バケットシリンダ13へは、バケット制御弁44を介して第2主ポンプ23から作動油が供給される。
図4に示されていないが、第2センターブリードライン34上の制御弁はブーム第1制御弁45(図5参照)を含み、第1センターブリードライン31上の制御弁はブーム第2制御弁46(図5参照)を含む。ブーム第2制御弁46は、ブーム上げ操作に専用の弁である。つまり、ブームシリンダ11へは、ブーム上げ操作時にはブーム第1制御弁45及びブーム第2制御弁を介して作動油が供給され、ブーム下げ操作時にはブーム第1制御弁45のみを介して作動油が供給される。
図5に示すように、ブーム制御弁47(ブーム第1制御弁45及びブーム第2制御弁)はブーム操作装置71により操作される。アーム制御弁40(アーム第1制御弁41及びアーム第2制御弁42)はアーム操作装置51により操作される。旋回制御弁43は旋回操作装置54により操作される。バケット制御弁44はバケット操作装置57により操作される。ブーム操作装置71、アーム操作装置51、旋回操作装置54、及びバケット操作装置57のそれぞれは、操作レバーを含み、操作レバーの傾倒角に応じた操作信号(指令)を出力する。
本実施形態では、ブーム操作装置71、アーム操作装置51、旋回操作装置54、及びバケット操作装置57のそれぞれが、操作レバーの傾倒角に応じたパイロット圧指令を出力するパイロット操作弁である。このため、アーム操作装置51は一対のパイロットライン52,53によりアーム第1制御弁41の一対のパイロットポートと接続され、旋回操作装置54は一対のパイロットライン55,56により旋回制御弁43の一対のパイロットポートと接続され、バケット操作装置57は一対のパイロットライン58,59によりバケット制御弁44の一対のパイロットポートと接続され、ブーム操作装置71は一対のパイロットライン72,73によりブーム第1制御弁45の一対のパイロットポートと接続されている。また、アーム第2制御弁42の一対のパイロットポートは、一対のパイロットライン52a,53aによりパイロットライン52,53と接続されている。また、ブーム第2制御弁46では、ブーム上げ操作用のパイロットポートのみが、パイロットライン73aによりパイロットライン73と接続されており、他方のパイロットポートは、パイロットライン72と接続されていない。従って、ブーム第2制御弁46は、ブーム操作装置71がブーム下げ操作された場合には動作しない。
但し、各操作装置が操作レバーの傾倒角に応じた電気信号(指令)を出力する電気ジョイスティックであり、各制御弁のパイロットポートに一対の電磁比例弁が接続されてもよい。
パイロットライン52,53,55,56,58,59,72,73には、パイロット圧指令の圧力を検出する圧力センサ81~86,91,92がそれぞれ設けられている。なお、アーム操作装置51から出力されるパイロット圧指令の圧力を検出する圧力センサ81,82は、パイロットライン52a,53aに設けられてもよい。これらの圧力センサ81~86,91,92が動作指令検知部110(図6参照)を構成する。
上述した第1流量調整装置22及び第2流量調整装置24は、流量制御装置8により電気的に制御される。例えば、流量制御装置8は、ROMやRAMなどのメモリとCPUを有し、ROMに格納されたプログラムがCPUにより実行される。流量制御装置8は、圧力センサ81~86,91,92で検出されるパイロット圧指令(操作信号)が大きくなるほど、第1主ポンプ21及び/または第2主ポンプ23の傾倒角が大きくなるように第1流量調整装置22及び第2流量調整装置24を制御する。例えば、旋回操作が単独で行われたときには、流量制御装置8は、旋回操作装置54から出力されるパイロット圧指令が大きくなるほど第1主ポンプ21の傾倒角が大きくなるように、第1流量調整装置22を制御する。
[制御系統の構成]
次に、学習機能付き油圧ショベル10の制御系統の構成を説明する。
<全体構成>
図6は、学習機能付き油圧ショベル10の制御系統の構成を示す機能ブロック図である。図6には、本実施形態における学習機能と関連する油圧ショベル10の制御系統が示されている。従って、本実施形態における学習機能と関連しない走行体19の制御系統は省略されている。また、学習機能付き油圧ショベル10は、図示されない全体制御部及び動作モード切替操作部を有し、操作者による動作モード切替操作部の操作に応じて、全体制御部が学習機能付き油圧ショベル10の動作モードを学習モード又は自動制御モードに切り替える。
図6を参照すると、アクセル装置50、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71が操作部101を構成する。操作部101は、旋回体15の運転席に設けられる。
操作者がアクセル装置50のアクセルペダルを踏み込むと、アクセル装置50がアクセルペダルの踏み込み量に応じたアクセル指令である動作指令201を出力する。すると、エンジン26が動作指令201に応じた出力でポンプ部107を駆動する。すると、ポンプ部107が、油圧回路106に、ポンプ部107の出力に応じた吐出量で作動油を吐出する。
操作者が旋回操作装置54の操作レバーを操作すると、旋回操作装置54が操作レバーの傾倒角に応じたパイロット圧指令(旋回指令)である動作指令201を出力する。すると、旋回制御弁43が動作指令201に応じて作動油を旋回モータ14に対し給排する。すると、旋回モータ14が作動油の給排に応じて旋回体15を旋回する。
操作者がブーム操作装置71の操作レバーを操作すると、ブーム操作装置71が操作レバーの傾倒角に応じたパイロット圧指令(ブーム動作指令)である動作指令201を出力する。すると、ブーム制御弁47が動作指令201に応じて作動油をブームシリンダ11に対し給排する。すると、ブームシリンダ11が作動油の給排に応じてブーム16、ひいてはブーム16及びアーム17を上げ下げする。
操作者がアーム操作装置51の操作レバーを操作すると、アーム操作装置51が操作レバーの傾倒角に応じたパイロット圧指令(アーム動作指令)である動作指令201を出力する。すると、アーム制御弁44が動作指令201に応じて作動油をアームシリンダ12に対し給排する。すると、アームシリンダ12が作動油の給排に応じてアーム17を揺動させる。
操作者がバケット操作装置57の操作レバーを操作すると、バケット操作装置57が操作レバーの傾倒角に応じたパイロット圧指令(バケット動作指令)である動作指令201を出力する。すると、バケット制御弁44が動作指令201に応じて作動油をバケット18に対し給排する。すると、バケットシリンダ13が作動油の給排に応じてバケット18を回動させる。
これらの操作により、操作者が意図する作業が行われる。
一方、圧力センサ81~86,91,92が、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71からそれぞれ出力されるパイロット圧指令である動作指令201をそれぞれ検知し、これらを、それぞれ、指令データ211として出力する。圧力センサ81~86,91,92が、動作指令検知部110を構成する。
学習データ記憶部115の指令データ記憶部116が、これらの指令データ211を、それぞれ、時系列で記憶する。また、指令データ記憶部116は、アクセル装置50から出力されるアクセル指令である動作指令201を時系列で指令データ211として記憶する。指令データ211は、アクセル指令、アーム動作指令、旋回指令、バケット動作指令、及びブーム動作指令を含む。
上述のように、第1撮像器311がバケット18による作業の状況を撮像する。すると、画像処理部312が、第1撮像器311によって撮像された撮像画像を画像処理することによって、所定の作業状況を表すデータを生成し、これを作業状況データ212として出力する。従って、第1撮像器311及び画像処理部312が作業状況検知部112を構成する。
油圧ショベル10には、マイク313が設けられている。マイク313は、例えば、旋回体15に設けられたエンジン26の近傍に設置され、エンジン26の動作音を受音してこれを動作音データに変換し、この動作音データを動作状態データ213として出力する。エンジン26の動作音は、エンジン26の出力が大きくなるほど大きくなり、エンジン26の出力が小さくなるほど小さくなる。それ故、動作音データは、ポンプ部107の駆動源の状態を表す駆動源状態であり、ひいては油圧ショベル10の動作状態を表す動作状態データである。従って、マイク313が、駆動源状態検知部、ひいては動作状態検知部113を構成する。
油圧ショベル10の旋回体15又は本体部102には、ジャイロセンサ314が設けられている。ジャイロセンサ314は、旋回体15又は本体部102の傾き及び振動(加振力、加速度、角加速度等を含む)を検知してこれを傾き及び振動データに変換し、この傾き及び振動データを反作用データ214として出力する。例えば、ブームがバケット18を地面に突き立てると、地面からの反力で旋回体15及び本体部102が傾くとともに旋回体15及び本体部102がブーム(動作部103)を介して加振力を受けて振動する。それ故、ジャイロセンサ314が出力する傾き及び振動データは、動作部103及び本体部102が受ける反作用を表す。従って、ジャイロセンサ314が反作用検知部114を構成する。
学習データ記憶部115の予測基礎データ記憶部117が、画像処理部312が出力する作業状況データ212、マイク313が出力する動作状態データ213、ジャイロセンサ314が出力する反作用データ214、動作指令検知部110が出力する指令データ211、及びアクセル装置50が出力する動作指令である指令データ211を、それぞれ、時系列で予測基礎データとして記憶する。
学習部118は、上述のように、学習時において、学習データを機械学習し、機械学習を終えた後、自動制御時において、予測基礎データPdが入力されると、予測動作指令Pfを出力する。
学習データ記憶部115、学習部118、画像処理部312、及び上述の図示されない全体制御部は、例えば、プロセッサとメモリとを有する演算器で構成される。学習部118、全体制御部、及び画像処理部312は、この演算器のメモリに格納された所定のプログラムをプロセッサが実行することによって実現される機能ブロックである。学習データ記憶部115は、このメモリによって構成される。この演算器は、具体的には、例えば、マイクロコントローラ、MPU、FPGA(Field Programmable Gate Array)、PLC(Programmable Logic Controller)等で構成される。学習データ記憶部115、学習部118、画像処理部312、及び上述の図示されない全体制御部は、集中制御を行う単独の演算器で構成されてもよく、分散制御を行う複数の演算器で構成されてもよい。これらの単独の演算器又は複数の演算器は、例えば、油圧ショベル10の旋回体15に設けられる。
操作部駆動部119は、ここでは、第1乃至5サーボモータM1~M5によって構成される。第1乃至5サーボモータM1~M5は、学習部118が出力する予測動作指令Pfに従って、それぞれ、ブーム操作装置71の操作レバー、バケット操作装置57の操作レバー、旋回操作装置54の操作レバー、アーム操作装置51の操作レバー、及びアクセル装置50のアクセルペダルを回動させる。これにより、自動制御時において、油圧駆動システム1のブーム制御弁47、バケット制御弁44、旋回制御弁43、及びアーム制御弁40が、予測動作指令Pfに従って、動作部103のブーム16、バケット18、旋回体15、及びアーム17を駆動するとともに、エンジン26が、予測動作指令Pfに従って、油圧駆動システム1のポンプ部107を駆動する。
次に、学習部118の構成を詳しく説明する。図7は、学習機能付き油圧ショベル10における予測動作指令Pf、学習用指令データPf’、予測基礎データPd、及び学習用予測基礎データPd’のそれぞれの時系列データを示す模式図である。図8は、学習部118の構成を示す機能ブロック図である。
<各時系列データの時間的関係>
最初に各時系列データの時間的関係を説明する。
図7を参照すると、油圧ショベル10は、自動制御によって所定作業を遂行する。この所定作業を油圧ショベル10に学習させるために、油圧ショベル10が、熟練した操作者によって、学習用動作としてこの所定作業をさせられる。時刻t0’は、この学習用動作の開始時刻を示す。この学習用動作は時刻tu’に終了する。この学習用動作においては、指令データ211及び予測基礎データ212~214が、それぞれ、所定のサンプリング間隔で取得され、それぞれ、指令データ記憶部116及び予測基礎データ記憶部117に時系列で記憶される。
学習用動作が終了すると、指令データ記憶部116及び予測基礎データ記憶部117から、指令データ及び予測基礎データが、それぞれ、学習用指令データPf’及び学習用予測基礎データPd’として読み出される。学習用指令データPf’は、時系列データPf0’、Pf1’、Pf3’・・・Pfu’(以下、Pf0’~Pfu’と略記する)である。以下、各時系列データにおける添え字の数字は、サンプリング時刻(間欠的な時刻)の順序を表す。従って、この添え字の数字が同じである時系列データは、同じサンプリング時刻に取得されたデータであることを意味する。学習用予測基礎データPd’も同様にして時系列データPd0’~Pdu’である。
これらの学習用指令データPf’及び学習用予測基礎データPd’を用いて機械学習が行われる。機械学習が終了すると、油圧ショベル10が自動制御されて所定作業が行われる。現在時刻t0は、自動制御時におけるこの所定作業の開始時刻を示す。自動制御時には、指令データ211及び予測基礎データ212~214が、それぞれ、所定のサンプリング間隔で取得され、予測基礎データPdとして、逐次、学習部118に入力される。予測基礎データPdは、時系列データPd0~Pduである。
学習部118は、この予測基礎データPdに応じて、予測動作指令Pfを出力する。予測動作指令Pfは、時系列データPf0~Pfuである。
この予測動作指令Pfに従って油圧ショベル10が動作し、それにより、油圧ショベル10が自動制御される。
<学習部118の構成>
図8を参照すると、学習部118は、例えば、ニューラルネットワーク1400と、学習データ及び教師データ生成部1401と、データ入力部1402と、学習評価部1403と、を備える。
ニューラルネットワーク400は、入力層と、中間層と、出力層とを備える。各層のニューロンの数は、適宜設定される。ニューラルネットワーク400の学習には、周知の学習方法を適用することができる。従って、ここでは簡単に説明する。ここでは、ニューラルネットワーク400は、例えば、リカレント型ニューラルネットワークである。学習の形態は、例えば、教師あり学習である。
学習データ及び教師データ生成部1401は、学習用指令データPf’の時系列データPf0’~Pfu’から教師データpnの時系列データpn1~pnuを生成する。また、学習用予測基礎データPd’の時系列データPd0’~Pdu’から学習データの時系列データPd0’~Pdu-1’を生成する。
データ入力部1402は、入力層の各ニューロンに学習データの時系列データPd0’~Pdu-1’を順次入力する。この際、データ入力部1402が、あるサンプリング時刻tiにおける学習データの時系列データPdiを入力すると、ニューラルネットワーク1400が、前向き演算によって、次のサンプリング時刻ti+1における予測動作指令Pni+1を計算する。すると、学習評価部1403が、教師データpnの時系列データpn1~pnuから次のサンプリング時刻ti+1における時系列データpni+1を取り込んで、予測動作指令Pni+1と教師データpnの時系列データpni+1とについて、例えば、アクセル指令、アーム動作指令、旋回指令、バケット動作指令、及びブーム動作指令のそれぞれの二乗誤差の総和値eを計算する。次いで、学習評価部1403は、後ろ向き演算によって、ニューラルネットワーク1400の重みを更新する。データ入力部1402及び学習評価部403は、この処理を、学習データの時系列データPd0’~Pdu-1’の全てについて行い、例えば、全ての処理において、二乗誤差の総和値eが所定の閾値以下になると学習を終了する。
この学習が終了した後、自動制御時において、データ入力部1402が、例えば、現在のサンプリング時刻t0における予測基礎データPd0を入力する。するとニューラルネットワーク1400が、次のサンプリング時刻t1における予測動作指令Pn1を、予測動作指令Pf1として出力する。なお、予測動作指令Pf0として、適宜な初期動作指令が出力される。
これにより、油圧ショベル10が、ニューラルネットワーク1400(学習部118)の学習結果に基づく予測動作指令Pfによって自動制御される。
なお、学習時において、データ入力部1402は、各サンプリング時刻tiにおける学習データの時系列データPdiを入力する際に、それ以前の時系列データPdi-1~Pdi-n(nは所定の正数)を入力してもよい。但し、この場合には、自動制御時において、データ入力部1402が、これと同様に、各サンプリング時刻tjにおいて、現在の予測基礎データPdjとともに過去の予測基礎データPdj-1~Pdj-nを入力する必要がある。自動制御時には、各サンプリング時刻tjにおいて、予測基礎データ記憶部117に時系列で予測基礎データPd0~Pdj-1が記憶されているので、データ入力部1402は、これを予測基礎データ記憶部117から読み出して、過去の予測基礎データPdj-1~Pdj-nを生成する。このようにすると、ニューラルネットワーク1400の学習効率が向上する。その理由は、操作者は、バケット18の動きを予測する際に現時点の瞬時における、作業状況、油圧ショベル10の動作状態、及び作業対象からの反作用だけではなく、それ以前からの一連の作業状況、油圧ショベル10の動作状態、及び作業対象からの反作用を考慮して、次のバケット18の動きを予測し、それによって、バケット18の動きを正確に予測するからである。
なお、作業状況、油圧ショベル10の動作状態、及び作業対象からの反作用以外の情報を学習データ及び油圧ショベル10の自動制御時の入力データとして用いてもよい。
[動作]
次に、以上のように構成された学習機能付き油圧ショベル10の動作を説明する。以下では、油圧ショベル10が、所定作業として穴掘り作業を行う場合を例に挙げて、油圧ショベル10の動作を説明する。
図9は、学習機能付き油圧ショベル10による建設作業の状況を示す模式図である。
図9を参照すると、まず、穴131を掘る予定地の上方に第1撮像器311が設置される。第1撮像器311は、例えば、地上に設置された適宜な支持部材に取り付けられる。第1撮像器311は、例えば、無線によって、油圧ショベル10の旋回体15に設けられた上記演算器(学習部118)にデータ通信可能に接続される。第1撮像器311は、例えば、穴131の中央部の上方に位置し、且つ光軸321が穴131の中央部を向くように設置される。
次に、油圧ショベル10が学習モードに切り替えられる。そして、まず、油圧ショベル10が、初期状態に設定される。この初期状態として、例えば、油圧ショベル10が穴131を掘るのに適した設置場所に位置し、且つ、初期姿勢(例えば、図9に示す姿勢)を取る。設置位置は、例えば、油圧ショベル10が移動しないで、バケット18で土砂を掬って穴131を掘り、且つ、バケット18内の掬った土砂を土砂置場に廃棄することが可能な場所に設定される。ここでは、設定位置が、穴131の予定地と土砂置き場との中間位置に設定されていると仮定する。また、第1撮像器311が3次元カメラで構成されていると仮定する。
<穴掘り作業>
次いで、熟練の操作者が油圧ショベル10を操作して穴掘り作業を行う。操作者は、例えば、この穴掘り作業を、概略、以下のようにして行う。
まず、バケット18を穴131の上方の降下位置から降下させて穴131の予定地の地面(穴131内の地面を含む)に突き立てる(突き立て動作)。この突き立て動作では、操作者は、バケット18を降下させる前に先端の爪が下方を向くようにバケット18を操作する。次いで、突き立てたバケット18を地面に押し付けながらバケット18を手前に回動させて土砂を掬い取る(掬い取り動作)。次いで、バケット18を上記降下位置まで移動させて穴131から引き上げる(引き上げ動作)。次いで、ブーム16,17が土砂置き場を向くまで旋回体15を旋回させる(順方向旋回動作)。次いで、バケット18を向こう側に回動させてバケット18内の土砂を土砂置き場に排出する(土砂排出動作)。次いで、バケット18が上記降下位置に位置するように旋回体15を逆方向に旋回させる(逆方向旋回動作)。以降、この一連の動作を繰り返し、所定の穴131が、所定の平面形状を有し、且つ所定の深さを有するように出来上がると、穴掘り作業を終了する。
<次の操作の判断情報>
この一連の動作において、操作者は、目視で穴掘りの状況を確認し、バケット18及びブーム16,17の姿勢を目視で認識するとともに各操作装置51,54,57,71の操作レバーの現在の操作位置によって、バケット18、ブーム及び運転席(旋回体15)が現在どのように動作しようとしているかを直観する。また、バケット18が地面に作用する(地面を掘る、土を掻き込む等する)と、その反作用を体感することによって、意図した作業(アクション)の当否を判断する。そして、これらを瞬時に勘案して次の操作を決定する。ここで、反作用とは、例えば、運転席の傾き及び振動(加振力、加速度、角加速度等を含む)である。また、操作者は、次の操作を決定する際に駆動源であるエンジン26の状態(回転量、音等)を重視する。
ここで、穴掘りの状況は作業状況を表す情報の一例である。操作位置は油圧ショベル10の動作状態を表す情報の一例である。運転席(旋回体15)の傾き及び振動は、地面からの反作用の例である。エンジン26の状態(回転量、音等)は、駆動源の状態を表す情報であり、ひいては油圧ショベル10の動作状態を表す情報である。
<学習用のデータ取得>
一方、これらの一連の動作において、以下のように学習用のデータが取得される。
第1撮像器311は、バケット18による穴掘り作業の状況を撮像し、画像処理部312が、この撮像画像を画像処理して、穴掘り作業の状況を表すデータを作業状況データ212として生成し、これを学習データ記憶部115(正確には予測基礎データ記憶部117)が記憶する。
具体的には、第1撮像器311は、突き立て動作から引き上げ動作までの動作において、主に、アーム17及びバケット18並びに穴131を撮像し、順方向旋回動作から逆方向旋回動作までの動作において、主に穴131を撮像する。画像処理部312は、例えば、この撮像画像にエッジ処理等の周知の画像処理を施して、アーム17及びバケット18の領域と穴131の領域とを判別し、穴131の平面形状及び中央部の深さのデータを生成する。特に、土砂排出動作時における撮像画像にはアーム17及びバケット18の領域が存在せず、穴131の領域のみが存在するので、土砂排出動作時における作業状況データ212においては、穴131の平面形状及び中央部の深さのデータが正確に特定される。
操作者がアクセル装置50、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71を操作すると、学習データ記憶部115(指令データ記憶部116及び予測基礎データ記憶部117)が、各操作に対応する動作指令201の指令データ211を記憶する。上記一連の動作において、アクセル装置50、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71の操作にそれぞれ対応する指令データ211の組み合わせによって、バケット18、ブーム及び運転席(旋回体15)が各時点に0いてどのように動作しようとしているかが特定される。
マイク313は、上記一連の動作において、エンジン26の音を受音する。この受音データ(動作状態データ213)を、学習データ記憶部115(正確には予測基礎データ記憶部117)が記憶する。
特に、掬い取り動作では、例えば、操作者はエンジンの出力を増大させてバケット18を回動させる。これにより、穴131の地面の土砂を好適に掬い取ることができる。従って、掬い取り動作において、受音データの大きさによって、増大されたエンジンの出力の大きさが特定される。
ジャイロセンサ314は、上記一連の動作において、旋回体15(運転席)又は本体部102の傾き及び振動(加振力、加速度、角加速度等を含む)を、穴131の地面からの反作用として検知する。この反作用データ214を学習データ記憶部115(正確には予測基礎データ記憶部117)が記憶する。
特に、突き立て動作において、バケット18を地面に突き立てた際の地面からの反作用は、地面の硬さを表している。従って、突き立て動作において、反作用データの大きさによって、バケット18が突き立てられた地面の硬さが特定される。
このように、本実施形態では、次の操作の判断に適した情報を特定することが可能なデータが、学習データとして取得される。
<機械学習>
学習用動作が終了した後、学習データ記憶部に記憶された学習データを用いて、ニューラルネットワークが機械学習させられる。この際、上述のように、各サンプリング時刻tiにおける学習データの時系列データPdiを入力する際に、それ以前の時系列データPdi-1~Pdi-n(nは所定の正数)が入力される。
<自動制御>
機械学習を終えた油圧ショベル10が、上述の初期状態に設定される。次いで、油圧ショベル10が、自動制御モードに切り替えられる。そして、油圧ショベル10の自動制御が開始される。この自動制御時には、予測基礎データPd(作業状況データ212、指令データ211、動作状態データ(受音データ)213、及び反作用データ214が学習部118(正確にはニューラルネットワークのデータ入力部402)に入力されるとともに予測基礎データ記憶部117に記憶される。そして、データ入力部402が、各サンプリング時刻tjにおいて、現在の予測基礎データPdjとともに、予測基礎データ記憶部117に記憶された時系列データPd0~Pdj-1のうちの過去の予測基礎データPdj-1~Pdj-nを入力する。これにより、学習部118が予測動作指令Pfを出力する。
このようにして、油圧ショベル10が自動制御され、熟練の操作者に操作された場合と同様に穴掘り作業が行われる。
以上に説明したように、実施形態1によれば、学習時において、熟練した操作者が建設機械100を操作して、所定の作業を行うと、操作に応じた動作指令201に対応する指令データ211と、作業部104による作業状況のデータ212、動作部103の動作状態のデータ213及び作業部104の作業により動作部103又は本体部102が作業対象から受ける反作用のデータ214を含む予測基礎データとが、学習データ記憶部115に記憶される。そして、学習部118が、学習データ記憶部115に記憶された予測基礎データを入力することによって、予測動作指令を出力するよう学習データを機械学習する。これにより、熟練した操作者の操作が学習され、予測動作指令Pfとして出力することが可能になる。そして、自動制御時において、学習部118に予測基礎データPdが入力されると、学習部118が予測動作指令Pfを出力する。すると、油圧駆動システム1が予測動作指令Pfに従って動作部103を駆動する。その結果、熟練した操作者の操作が学習され、その学習の結果として学習部118から出力される予測動作指令Pfに従って、当該作業が自動的に行われる。従って、人が操作して建設機械100が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械100を提供することできる。
(実施形態2)
本発明の実施形態2は、実施形態1の油圧ショベル10において、動作状態検知部113が、さらに、第2撮像器331及び画像処理部333を備える形態を例示する。
図10は、実施形態2に係る学習機能付き油圧ショベル10のハードウエアの構成を示す側面図である。図11は、図10の学習機能付き油圧ショベル10の制御系統の構成を示す機能ブロック図である。
図10及び図11を参照すると、本実施形態の油圧ショベル10は、動作状態検知部113が、さらに、第2撮像器331及び画像処理部333を備える。これ以外の構成は、実施形態1の油圧ショベル10と同じである。
第2撮像器331は、油圧ショベル10の全体を撮像する。第2撮像器331によって撮像された撮像画像は、画像処理部333において、油圧ショベル10の姿勢表すデータが得られるように画像処理され、画像処理部333から動作状態データ213として出力される。第2撮像器331の光軸332は、油圧ショベル10に向けられる。
第2撮像器331は、例えば、通常のデジタルカメラによって構成される。第2撮像器331は、例えば、適宜な支持部材を介して油圧ショベル10の車両とは別個の固定物体(地面等)に固定され、あるいは、ドローンに搭載される。
画像処理部333は、例えば、第2撮像器331が撮像した撮像画像を画像処理して、油圧ショベル10の外形を抽出し、この外形データを動作状態データ213として出力する。この外形データは、油圧ショベル10の動作部103の姿勢を特定できる姿勢データである。
実施形態2によれば、実施形態1で述べた一連の動作において、動作状態データ213の中の油圧ショベル10の外形によって油圧ショベル10の姿勢が特定されるので、学習部118の機械学習の効率が向上し、且つ、自動制御時において学習部118が出力する予測動作指令Pfがより適切なものになる。
(実施形態3)
本発明の実施形態3は、実施形態1の油圧ショベル10において、動作状態検知部113が、さらに、センサ部341を備える形態を例示する。
図12は、実施形態3に係る学習機能付き油圧ショベル10のハードウエアの構成を示す側面図である。図13は、図12の学習機能付き油圧ショベル10の制御系統の構成を示す機能ブロック図である。
図13を参照すると、本実施形態の油圧ショベル10は、動作状態検知部113が、さらに、センサ部341を備える。これ以外の構成は、実施形態1の油圧ショベル10と同じである。センサ部341は、センサS1~S4で構成される。
図12を参照すると、油圧ショベル10にセンサS1~S4が設けられている。具体的には、旋回体15に、当該旋回体15の回転軸線A1周りの回転角を検知するセンサS1が設けられている。ブーム16の基端部に、当該ブーム16の回転軸線A2周りの回転角を検知するセンサS2が設けられている。アーム17の基端部に、当該アーム17の回転軸線A3周りの回転角を検知するセンサS3が設けられている。アーム17の先端部に、バケット18の回転軸線A4周りの回転角を検知するセンサS4が設けられている。
センサ部341は、センサS1~S4がそれぞれ検知した回転角のデータを、動作状態データ213として出力する。センサS1~S4がそれぞれ検知した回転角のデータの組み合わせは、油圧ショベル10の動作部103の姿勢を特定できる姿勢データである。
実施形態によれば、実施形態1で述べた一連の動作において、動作状態データ213の中のセンサS1~S4によりそれぞれ検知された回転角の組み合わせによって油圧ショベル10の姿勢が特定されるので、学習部118の機械学習の効率が向上し、且つ、自動制御時において学習部118が出力する予測動作指令Pfがより適切なものになる。
(実施形態4)
{概要}
まず、実施形態4の技能伝承建設機械の概要を説明する。
[構成]
図14は、本発明の実施形態4に係る技能伝承建設機械の制御系統の構成を示す機能ブロック図である。図14において矢印は、指令、動力、情報、データの流れを示す。実線の矢印は、動作部103の動作時における指令又はデータの流れを示し、破線は学習時における指令又はデータの流れを示す。なお、後述するように過去の予測基礎データが学習に用いられる場合には、動作部の動作時においても破線で示されるデータの流れが生じる。このことは、図18、26、28においても同様である。
図14を参照すると、実施形態4の技能伝承建設機械200は、操作部101と、本体部102と、動作部103と、油圧駆動システム105と、作業状況検知部112と、動作状態検知部113と、反作用検知部114と、制御部401と、備える。
制御部401は、基本動作指令部2119と、動作指令生成部2120と、動作修正指令生成部2110と、学習データ記憶部115と、学習部118と、を備える。学習データ記憶部115は、動作修正指令記憶部2116と、予測基礎データ記憶部117と、を備える。
実施形態4では、学習機能付き建設機械が制御部401を備える技能伝承建設機械200であり、操作部101が、指令201として、操作者の操作に応じた手動動作修正指令403を出力するよう構成され、油圧駆動システム105が、基本動作指令402と自動動作修正指令404と手動動作修正指令403とに従って動作部103を駆動するよう構成され、且つ、制御部401が、動作部103によって作業部に基本的な動きをさせる基本動作指令402を出力する基本動作指令部2119と、指令データ生成部1101として自動動作修正指令404に手動動作修正指令403を加えて動作修正指令Pmを生成する動作修正指令生成部2110と、指令データ記憶部1102であって、動作修正指令Pmを指令データとして時系列で記憶する動作修正指令記憶部2116と、予測基礎データ記憶部117と、学習部118と、を備える。そして、学習部118が、予測基礎データ記憶部117に記憶された予測基礎データPd’を用いて動作修正指令記憶部2116に記憶された動作修正指令Pm’を機械学習し、機械学習を終えた後、動作部103の動作時に予測基礎データPdが入力され、予測指令1103である自動動作修正指令404を出力するよう構成されている。
以下、この技能伝承建設機械200の構成を詳しく説明する。
「建設機械」は、操作者の操作に従って動作部が作業部を動かすことによって、建設作業を行うことができる作業機械であればよい。「建設機械」として、油圧ショベル、ブルドーザー、トラクタショベル、ホイールローダー、トレンチャー、掘削機、クレーン、リフト車等が例示される。
操作部101は、操作者の操作に応じた手動動作修正指令403を出力する。
本体部102には、動作部103が連結されている。
動作部103は、作業を行う作業部104を有し、作業部104を、作業を行うよう動かす。ここで、「作業部104を・・・動かす」とは、「作業部104を動作及び移動させる」ことを意味する。
油圧駆動システム105は、本体部102と動作部103とに跨って設けられる。油圧駆動システム105は、動作指令生成部2120から出力される動作指令201に従って駆動力202を出力し、それにより動作部103を駆動する。
作業状況検知部112は、作業部104による作業の状況を検知し、検知した作業状況を作業状況データ212として出力する。
動作状態検知部113は、動作部103の動作状態を検知し、検知した動作状態を動作状態データ213として出力する。
ここで、学習部118の後述する機械学習において、学習対象である動作修正指令を予測するために用いられるデータを予測基礎データと呼ぶ。予測基礎データは、作業状況データ212、動作状態データ213、及び反作用データ214を含む。便宜上、学習に用いられる予測基礎データに参照符号Pd’を付与し、動作部103の動作時に用いられる予測基礎データに参照符号Pdを付与する。なお、予測基礎データPd,Pd’が、作業状況データ212、動作状態データ213、及び反作用データ214以外のデータを含んでもよい。
反作用検知部114は、作業部104の作業により動作部103又は本体部102が作業対象から受ける反作用を検知し、検知した反作用を反作用データ214として出力する。
基本動作指令部2119は、動作部103によって作業部104に基本的な動きをさせる基本動作指令402を出力する。
動作修正指令生成部2110は、自動動作修正指令404に手動動作修正指令403を加えて動作修正指令Pmを生成する。
動作修正指令記憶部2116は、動作修正指令Pmを時系列で記憶する。予測基礎データ記憶部117は、作業状況データ212、動作状態データ213、及び反作用データ214を含む予測基礎データを時系列で記憶する。
学習部118は、機械学習する学習モデルであり、そのような学習モデルとして、ニューラルネットワーク、回帰モデル、木モデル、ベイズモデル、時系列モデル、クラスタリングモデル、アンサンブル学習モデル等が例示される。本実施形態では、学習モデルは、ニューラルネットワークである。学習の形態は、教師あり学習でも教師なし学習でも構わない。
学習部118は、例えば教師あり学習の場合、学習時において、動作修正指令記憶部2116に記憶された動作修正指令Pmを学習用の動作修正指令Pm’として読み出すとともに、予測基礎データ記憶部117に記憶された予測基礎データPdを学習用予測基礎データPd’として読み出す。そして、学習用の動作修正指令Pm’を教師データpnとし、学習用の予測基礎データPd’を入力データとして、学習データを作成する。そして、入力データである予測基礎データPd’を機械学習モデル(例えばニューラルネットワーク)に入力し、その出力Pnと教師データpnとの差異を評価し、その評価を機械学習モデルにフィードバックする。これにより、機械学習モデルが学習データを機械学習する。換言すると、機械学習モデルが、予測基礎データPd’を用いて動作修正指令Pm’を学習する。
機械学習が終了すると、学習部118は、機械学習モデルの出力を自動動作修正指令404として、外部に出力する。具体的には、動作部103の動作時において、学習部118では、機械学習モデルが、予測基礎データPdが入力されると、学習対象であった動作修正指令Pm’の予測指令である自動動作修正指令404を出力する。
動作指令生成部2120は、基本動作指令402に、この自動動作修正指令404及び操作部101から出力される手動動作修正指令403を加えて、動作指令201を生成する。ここで、基本動作指令、自動動作修正指令、及び手動動作修正指令は、油圧駆動システム105が備える油圧制御弁の開度を表す数値データであり、それ故、相互に加算及び減算することが可能である。
油圧駆動システム105は、この動作指令201に従って動作部103を駆動する。
[動作]
上記所定作業は、例えば、比較的簡単な定型作業である。このような定型作業として、穴掘り作業、整地作業、転圧作業等が例示される。このような所定作業が、技能伝承建設機械200によって、作業場所を変えながら、複数回、繰り返し行われると仮定する。この場合、互いに前後する2回の所定作業の合間に、前の回の所定作業における動作修正指令Pm’が学習部118によって学習され、後の回の所定作業において、学習部118に予測基礎データPdが入力されると、前記の学習結果を反映した自動動作修正指令404を学習部118が出力する。
具体的には、前の回の所定作業において、熟練した操作者が技能伝承建設機械200を操作し、基本動作指令402及び自動動作修正指令404に従った作業部104の動きを必要に応じて修正しながら所定の作業を行う。
すると、作業部104による作業状況を表す作業状況データ212、動作部103の動作状態を表す動作状態データ213、及び作業部の作業により動作部が作業対象から受ける反作用を表す反作用データ214を含む予測基礎データPdが時系列で予測基礎データ記憶部117に記憶されるとともに、自動動作修正指令404に手動動作修正指令403が加えられた動作修正指令Pmが時系列で動作修正指令記憶部2116に記憶される。そして、その後の学習時に、学習部118が、予測基礎データ記憶部117から予測基礎データPd’を読み出し、これを用いて、動作修正指令記憶部2116から読み出した動作修正指令Pm’を機械学習する。これにより、熟練した操作者の修正操作が学習され、自動動作修正指令404として出力することが可能になる。そして、後の回の所定作業において、学習部118に予測基礎データPdが入力されると、学習部118が自動動作修正指令404を出力する。すると、油圧駆動システム105が、基本動作指令402とこの自動動作修正指令404とを反映しながら動作部103を駆動する。その結果、熟練した操作者の修正操作が学習された結果としての自動動作修正指令404が反映された作業が行われる。従って、基本動作指令部2119による作業部104の基本的な動きを操作者が修正操作するようにして、技能伝承建設機械200が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械200を提供することできる。
これにより、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械200を提供することができる。
{具体的構成}
次に、技能伝承建設機械200の具体的な構成を、建設機械の一例である油圧ショベル20を例に取って説明する。
[ハードウエアの構成]
<全体構成>
まず、技能伝承油圧ショベル20の全体構成を説明する。この技能伝承油圧ショベル20の全体構成は、基本的に実施形態1の学習機能付き油圧ショベル10と同じであるが、一部において異なる。
図15は、技能伝承建設機械の一例である技能伝承油圧ショベル20のハードウエアの構成を示す側面図である。
技能伝承油圧ショベル(以下、単に油圧ショベルという場合がある)20は、本体部102を備える。本体部102には、走行体19が設けられている。走行体19は、例えば、無限軌道(キャタピラ)を備えた車両走行装置で構成される。
本体部102の上には、旋回体15が、鉛直な第1回動軸線A1の周りに旋回可能に設けられている。旋回体15には、運転席(不図示)が設けられ、運転席に操作部101(図18参照)が設けられている。なお、図18の操作部101には示されていないが、運転席には、走行体19を操作する走行操作装置が設けられている。旋回体15には、さらに、旋回体15を旋回させる旋回モータ14が設けられている。旋回モータ14は、油圧モータで構成されている。また、旋回体15には、走行用のエンジン26(図18参照)が設けられている。エンジン26は、作業時には、油圧駆動システム1のポンプ部107(図18参照)を駆動する。
旋回体15には、ブーム16の基端部が、水平な第2回動軸線A2の周りに回動自在に連結されている。ブーム16の基端部及び旋回体15には、それぞれ、ブームシリンダ11の先端部及び基端部が回動自在に連結されており、ブームシリンダ11が伸縮することによって、ブーム16が第2回動軸線A2を中心に揺動する。
ブーム16の先端部には、アーム17の基端部が、水平な第3回動軸線A3の周りに回動自在に連結されている。アーム17の基端部及びブーム16の中央部にはそれぞれアームシリンダ12の先端部及び基端部が回動自在に連結されており、アームシリンダ12が伸縮することによって、アーム17が第3回動軸線A3を中心に揺動する。
アーム17の先端部には、バケット18の基端部が、水平な第4回動軸線A4の周りに回動自在に連結されている。バケット18の基端部及びアーム17の基端部にはそれぞれバケットシリンダ13の先端部及び基端部が回動自在に連結されており、バケットシリンダ13が伸縮することによって、バケット18が第4回動軸線A4を中心に回動する。バケット18はアタッチメントの一例であり、他のアタッチメントを取り付けてもよい。
ブーム16、アーム17、及びバケット18がフロント作業機を構成する。また、バケット18が作業部104を構成し、旋回体15及びフロント作業機(ブーム16、アーム17、及びバケット18)が動作部103を構成する。
油圧ショベル20は、これらの他に、左右一対の油圧走行モータ(不図示)を備える。
後述するように、技能伝承油圧ショベル20の運転席には、油圧ショベル20の動作モードを、手動モードと半自動モードとを相互に切り替える動作モード切替操作部(不図示)が設けられている。操作者は、動作モード切替操作部を操作して動作モードを手動モードに設定し、その後、操作部101(不図示の走行操作装置を含む)を操作することによって、油圧ショベルを上記所定作業の作業場所に位置させ、その後、動作モード切替操作部を操作して動作モードを半自動モードに切り替え、その後、旋回体15を旋回させ、ブーム16,17の姿勢を変化させ、且つ、バケット18を回動させることによって当該所定作業を行う。
技能伝承油圧ショベル20は、さらに、第1撮像器311を備える。第1撮像器311はバケット18による作業の状況を撮像する。第1撮像器311によって撮像された撮像画像は、後述する画像処理部312(図18参照)において、作業状況を表すデータが得られるように画像処理され、画像処理部312から作業状況データ212として出力される。第1撮像器311の光軸321は、作業対象に向けられる。
第1撮像器311は、例えば、3次元カメラ、深度センサ付きカメラ等によって構成される。第1撮像器311は、例えば、適宜な支持部材を介して本体部102に固定され、あるいは、適宜な支持部材を介して油圧ショベル20の車両とは別個の固定物体(地面等)に固定され、あるいは、ドローンに搭載される。
<油圧駆動システム1>
次に、油圧ショベル20を動作させる油圧駆動システム1を説明する。
図16は、技能伝承油圧ショベル20の油圧駆動システム1の主油圧回路を示す油圧回路図である。図17は、技能伝承油圧ショベル20の駆動システムの操作系油圧回路を示す油圧回路図である。主油圧回路及び操作系油圧回路は、旋回体15に設けられている。
油圧駆動システム1は、上述のように、油圧アクチュエータとしてブームシリンダ11、アームシリンダ12、及びバケットシリンダ13を含むとともに、旋回モータ14及び左右一対の油圧走行モータ(不図示)を含む。
図16を参照すると、油圧駆動システム1は、上述のアクチュエータへ作動油を供給するための第1主ポンプ21及び第2主ポンプ23を含む。なお、図16では、図面の簡略化のために、旋回モータ14以外のアクチュエータを省略している。
第1主ポンプ21及び第2主ポンプ23は、エンジン26により駆動される。また、エンジン26は、副ポンプ25も駆動する。第1主ポンプ21、第2主ポンプ23及び副ポンプ25がポンプ部107(図18参照)を構成する。エンジン26は、アクセル装置50(図18参照)により出力を調整される。アクセル装置50は、例えば、アクセルペダルを備え、その踏み込み量に応じた電気指令であるアクセル修正指令75を出力する。すると、エンジン制御装置(不図示)がアクセル修正指令75に対応する個別動作指令75’に従ってエンジン26の出力(回転速度)を制御する。
第1主ポンプ21及び第2主ポンプ23は、例えば、傾転角に応じた流量の作動油を吐出する可変容量型のポンプである。ここでは、第1主ポンプ21及び第2主ポンプ23が、斜板の角度により傾転角が規定される斜板ポンプである。但し、第1主ポンプ21及び第2主ポンプ23は、駆動軸とシリンダブロックのなす角により傾転角が規定される斜軸ポンプであってもよい。
第1主ポンプ21の吐出流量Q1及び第2主ポンプ23の吐出流量Q2は、電気ポジティブコントロール方式により制御される。具体的には、第1主ポンプ21の傾転角が第1流量調整装置22により調整され、第2主ポンプ23の傾転角が第2流量調整装置24により調整される。副ポンプ25は、サブブリードライン37を通じて第1流量調整装置22及び第2流量調整装置24に接続されている。副ポンプ25は、第1流量調整装置22及び第2流量調整装置24の駆動源として機能する。第1流量調整装置22及び第2流量調整装置24については、詳細に後述する。
第1主ポンプ21からは、第1センターブリードライン31がタンクまで延びている。第1センターブリードライン31上には、アーム第1制御弁41及び旋回制御弁43を含む複数の制御弁(アーム第1制御弁41及び旋回制御弁43以外は図示せず)が配置されている。各制御弁は、ポンプライン32により第1主ポンプ21と接続されている。つまり、第1センターブリードライン31上の制御弁は、第1主ポンプ21に対してパラレルに接続されている。また、各制御弁は、タンクライン33によりタンクと接続されている。
同様に、第2主ポンプ23からは、第2センターブリードライン34がタンクまで延びている。第2センターブリードライン34上には、アーム第2制御弁42及びバケット制御弁44を含む複数の制御弁(アーム第2制御弁42及びバケット制御弁44以外は図示せず)が配置されている。各制御弁は、ポンプライン35により第2主ポンプ23と接続されている。つまり、第2センターブリードライン34上の制御弁は、第2主ポンプ23に対してパラレルに接続されている。また、各制御弁は、タンクライン36によりタンクと接続されている。
アーム第1制御弁41は、アーム第2制御弁42と共にアームシリンダ12に対する作動油の供給及び排出を制御する。つまり、アームシリンダ12へは、アーム第1制御弁41を介して第1主ポンプ21から作動油が供給されるとともに、アーム第2制御弁42を介して第2主ポンプ23から作動油が供給される。アーム第1制御弁41及びアーム第2制御弁42がアーム制御弁40(図17参照)を構成する。
旋回制御弁43は、旋回モータ14に対する作動油の供給及び排出を制御する。つまり、旋回モータ14へは、旋回制御弁43を介して第1主ポンプ21から作動油が供給される。具体的には、旋回モータ14は、一対の給排ライン61,62により旋回制御弁43と接続されている。給排ライン61,62のそれぞれからは逃しライン63が分岐しており、逃しライン63はタンクにつながっている。各逃しライン63には、リリーフ弁64が設けられている。また、給排ライン61,62は、一対のメイクアップライン65によりタンクとそれぞれ接続されている。各メイクアップライン65には、タンクから給排ライン(61または62)に向かう流れは許容するがその逆の流れは禁止する逆止弁66が設けられている。
バケット制御弁44は、バケットシリンダ13に対する作動油の供給及び排出を制御する。つまり、バケットシリンダ13へは、バケット制御弁44を介して第2主ポンプ23から作動油が供給される。
図16に示されていないが、第2センターブリードライン34上の制御弁はブーム第1制御弁45(図17参照)を含み、第1センターブリードライン31上の制御弁はブーム第2制御弁46(図17参照)を含む。ブーム第2制御弁46は、ブーム上げ操作に専用の弁である。つまり、ブームシリンダ11へは、ブーム上げ操作時にはブーム第1制御弁45及びブーム第2制御弁を介して作動油が供給され、ブーム下げ操作時にはブーム第1制御弁45のみを介して作動油が供給される。
また、本実施形態では、各制御弁41-46は、電磁制御弁で構成されている。
図17を参照すると、ブーム制御弁47(ブーム第1制御弁45及びブーム第2制御弁)はブーム操作装置71により操作される。アーム制御弁40(アーム第1制御弁41及びアーム第2制御弁42)はアーム操作装置51により操作される。旋回制御弁43は旋回操作装置54により操作される。バケット制御弁44はバケット操作装置57により操作される。
詳しく説明すると、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71のそれぞれは、操作レバーを含み、操作レバーの傾倒角に応じた電気指令作信号である一対の個別手動動作修正指令(52,53),(55,56),(58,59),(72,73)を出力する。これらの個別手動動作修正指令(52,53),(55,56),(58,59),(72,73)と、後述するアクセル装置50が出力するアクセル修正指令75とが手動動作修正指令403を構成する。
アーム操作装置51から出力される一対の個別手動動作修正指令52,53は、動作指令生成部2120において、基本動作指令402のうちのアーム操作装置51に対応する一対の個別基本動作指令(不図示)及び自動動作修正指令404のうちのアーム操作装置51に対応する一対の個別自動動作修正指令(不図示)と合算されてアーム操作装置51に対応する一対の個別動作指令52’,53’となり、それぞれ、アーム第1制御弁41の一対の電磁部(ソレノイド)及びアーム第2制御弁42の一対の電磁部に入力される。
旋回操作装置54から出力される一対の個別手動動作修正指令55,56は、動作指令生成部2120において、基本動作指令402のうちの旋回操作装置54に対応する一対の個別基本動作指令(不図示)及び自動動作修正指令404のうちの旋回操作装置54に対応する一対の個別自動動作修正指令(不図示)と合算されて旋回操作装置54に対応する一対の個別動作指令55’,56’となり、旋回制御弁43の一対の電磁部に入力される。
バケット操作装置57から出力される一対の個別手動動作修正指令58,59は、動作指令生成部2120において、基本動作指令402のうちのバケット操作装置57に対応する一対の個別基本動作指令(不図示)及び自動動作修正指令404のうちのバケット操作装置57に対応する一対の個別自動動作修正指令(不図示)と合算されてバケット操作装置57に対応する一対の個別動作指令58’,59’となり、バケット制御弁44の一対の電磁部に入力される。
ブーム操作装置71から出力される一対の個別手動動作修正指令72,73は、動作指令生成部2120において、基本動作指令402のうちのブーム操作装置71に対応する一対の個別基本動作指令(不図示)及び自動動作修正指令404のうちのブーム操作装置71に対応する一対の個別自動動作修正指令(不図示)と合算されてブーム操作装置71に対応する一対の個別動作指令72’,73’となり、ブーム第1制御弁45の一対の電磁部に入力される。また、個別動作指令73’が、ブーム第2制御弁46のブーム上げ用の電磁部に入力され、ブーム第2制御弁46のブーム下げの電磁部には個別動作指令が入力されない。従って、ブーム第2制御弁46は、ブーム操作装置71がブーム下げ操作された場合には動作しない。
なお、アクセル装置50から出力されるアクセル修正指令75は、動作指令生成部2120において、基本動作指令402のうちのアクセル装置50に対応する個別基本動作指令(不図示)及び自動動作修正指令404のうちのアクセル装置50に対応する個別自動動作修正指令(不図示)と合算されてアクセル装置50に対応する個別動作指令75’となり、エンジン26に入力される。
一対の個別動作指令(52’,53’),(55’,56’),(58’,59’),(72’,73’)及び個別動作指令75’が動作指令201を構成する。
上述した第1流量調整装置22及び第2流量調整装置24は、流量制御装置8により電気的に制御される。例えば、流量制御装置8は、ROMやRAMなどのメモリとCPUを有し、ROMに格納されたプログラムがCPUにより実行される。流量制御装置8は、各操作装置51,54,57,71に対応する一対の個別動作指令(52’,53’),(55’,56’),(58’,59’),(72’,73’)が大きくなるほど、第1主ポンプ21及び/または第2主ポンプ23の傾倒角が大きくなるように第1流量調整装置22及び第2流量調整装置24を制御する。例えば、旋回操作が単独で行われたときには、流量制御装置8は、旋回操作装置54に対応する一対の個別動作指令(55’,56’)が大きくなるほど第1主ポンプ21の傾倒角が大きくなるように、第1流量調整装置22を制御する。
[制御系統の構成]
次に、技能伝承油圧ショベル20の制御系統の構成を説明する。
<全体構成>
図18は、技能伝承油圧ショベル20の制御系統の構成を示す機能ブロック図である。図18には、本実施形態における学習機能と関連する油圧ショベル20の制御系統が示されている。従って、本実施形態における学習機能と関連しない走行体19の制御系統は省略されている。また、技能伝承油圧ショベル20は、図示されない全体制御部及び動作モード切替操作部を有し、操作者による動作モード切替操作部の操作に応じて、全体制御部が技能伝承油圧ショベル20の動作モードを手動モード又は半自動モードに切り替える。
<操作部>
図18を参照すると、アクセル装置50、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71が操作部101を構成する。操作部101は、旋回体15の運転席に設けられる。
<油圧制御>
*手動モード*
手動モードでは、操作者がアクセル装置50のアクセルペダルを踏み込むと、アクセル装置50がアクセルペダルの踏み込み量に応じたアクセル修正指令75を出力する。すると、エンジン26が、このアクセル修正指令75に対応する個別動作指令75’に応じた出力でポンプ部107を駆動する。すると、ポンプ部107が、油圧回路106に、ポンプ部107の出力に応じた吐出量で作動油を吐出する。
操作者が旋回操作装置54の操作レバーを操作すると、旋回操作装置54が操作レバーの傾倒角に応じた一対の個別手動動作修正指令55,56(旋回手動動作修正指令)を出力する。すると、旋回制御弁43が、この一対の個別手動動作修正指令55,56に対応する一対の個別動作指令55’,56’に応じて作動油を旋回モータ14に対し給排する。すると、旋回モータ14が作動油の給排に応じて旋回体15を旋回する。
操作者がブーム操作装置71の操作レバーを操作すると、ブーム操作装置71が操作レバーの傾倒角に応じた一対の個別手動動作修正指令72,73’(ブーム手動動作修正指令)を出力する。すると、ブーム制御弁47が、この一対の個別手動動作修正指令72,73に対応する一対の個別動作指令72’,73’に応じて作動油をブームシリンダ11に対し給排する。すると、ブームシリンダ11が作動油の給排に応じてブーム16を上げ下げする。
操作者がアーム操作装置51の操作レバーを操作すると、アーム操作装置51が操作レバーの傾倒角に応じた一対の個別手動動作修正指令52,53(アーム手動動作修正指令)を出力する。すると、アーム制御弁40が、この一対の個別手動動作修正指令52,53に対応する一対の個別動作指令52’,53’に応じて作動油をアームシリンダ12に対し給排する。すると、アームシリンダ12が作動油の給排に応じてアーム17を揺動させる。
操作者がバケット操作装置57の操作レバーを操作すると、バケット操作装置57が操作レバーの傾倒角に応じた一対の個別手動動作修正指令58,59(バケット手動動作修正指令)を出力する。すると、バケット制御弁44が、この一対の個別手動動作修正指令58,59の対応する一対の個別動作指令58’,59’に応じて作動油をバケットシリンダ13に対し給排する。すると、バケットシリンダ13が作動油の給排に応じてバケット18を回動させる。
これらの操作により、操作者が意図する作業が行われる。
*半自動モード*
半自動モードでは、基本動作指令部2119から出力される基本動作指令402及び学習部118から出力される自動動作修正指令404に従って、動作部103(15-18)が動作し、操作者が、操作部101(50,51,54,57,71)を操作すると、その操作に応じて動作部103の動作が修正される。
<予測基礎データ検知部>
上述のように、第1撮像器311がバケット18による作業の状況を撮像する。すると、画像処理部312が、第1撮像器311によって撮像された撮像画像を画像処理することによって、所定の作業状況を表すデータを生成し、これを作業状況データ212として出力する。従って、第1撮像器311及び画像処理部312が作業状況検知部112を構成する。
油圧ショベル20には、マイク313が設けられている。マイク313は、例えば、旋回体15に設けられたエンジン26の近傍に設置され、エンジン26の動作音を受音してこれを動作音データに変換し、この動作音データを動作状態データ213として出力する。エンジン26の動作音は、エンジン26の出力が大きくなるほど大きくなり、エンジン26の出力が小さくなるほど小さくなる。それ故、動作音データは、ポンプ部107の駆動源の状態を表す駆動源状態であり、ひいては油圧ショベル20の動作状態を表す動作状態データである。従って、マイク313が、駆動源状態検知部、ひいては動作状態検知部113を構成する。
油圧ショベル20の旋回体15又は本体部102には、ジャイロセンサ314が設けられている。ジャイロセンサ314は、旋回体15又は本体部102の傾き及び振動(加振力、加速度、角加速度等を含む)を検知してこれを傾き及び振動データに変換し、この傾き及び振動データを反作用データ214として出力する。例えば、ブーム16及びアーム7がバケット18を地面に突き立てると、地面からの反力で旋回体15及び本体部102が傾くとともに旋回体15及び本体部102がアーム17及びブーム16(動作部103)を介して加振力を受けて振動する。それ故、ジャイロセンサ314が出力する傾き及び振動データは、動作部103及び本体部102が受ける反作用を表す。従って、ジャイロセンサ314が反作用検知部114を構成する。
<制御部>
制御部401、画像処理部312、及び上述の図示されない全体制御部は、例えば、プロセッサとメモリとを有する演算器で構成される。動作修正指令生成部2110、学習部118、基本動作指令部2119、動作指令生成部2120、全体制御部、及び画像処理部312は、この演算器のメモリに格納された所定のプログラムをプロセッサが実行することによって実現される機能ブロックである。学習データ記憶部115は、このメモリによって構成される。この演算器は、具体的には、例えば、マイクロコントローラ、MPU、FPGA(Field Programmable Gate Array)、PLC(Programmable Logic Controller)等で構成される。制御部401、画像処理部312、及び上述の図示されない全体制御部は、集中制御を行う単独の演算器で構成されてもよく、分散制御を行う複数の演算器で構成されてもよい。これらの単独の演算器又は複数の演算器は、例えば、油圧ショベル20の旋回体15に設けられる。
<基本動作指令部2119>
基本動作指令部2119は、上述の演算器のメモリに格納された所定作業用の制御プログラムに従って、基本動作指令402を出力する。
<動作指令生成部2120>
動作指令生成部2120は、ここでは、上述のように、アーム操作装置51から出力される一対の個別手動動作修正指令52,53と、基本動作指令部2119から出力される基本動作指令402のうちのアーム操作装置51に対応する一対の個別基本動作指令(不図示)と、学習部118から出力される自動動作修正指令404のうちのアーム操作装置51に対応する一対の個別自動動作修正指令(不図示)とを合算して、アーム操作装置51に対応する一対の個別動作指令52’,53’を生成する。
また、旋回操作装置54から出力される一対の個別手動動作修正指令55,56と、基本動作指令402のうちの旋回操作装置54に対応する一対の個別基本動作指令(不図示)と、自動動作修正指令404のうちの旋回操作装置54に対応する一対の個別自動動作修正指令(不図示)とを合算して、旋回操作装置54に対応する一対の個別動作指令55’,56’を生成する。
また、バケット操作装置57から出力される一対の個別手動動作修正指令58,59と、基本動作指令402のうちのバケット操作装置57に対応する一対の個別基本動作指令(不図示)と、自動動作修正指令404のうちのバケット操作装置57に対応する一対の個別自動動作修正指令(不図示)とを合算して、バケット操作装置57に対応する一対の個別動作指令58’,59’を生成する。
また、ブーム操作装置71から出力される一対の個別手動動作修正指令72,73と、基本動作指令402のうちのブーム操作装置71に対応する一対の個別基本動作指令(不図示)と、自動動作修正指令404のうちのブーム操作装置71に対応する一対の個別自動動作修正指令(不図示)とを合算して、ブーム操作装置71に対応する一対の個別動作指令72’,73’を生成する。
また、アクセル装置50から出力されるアクセル修正指令75と、基本動作指令402のうちのアクセル装置50に対応する個別基本動作指令(不図示)と、自動動作修正指令404のうちのアクセル装置50に対応する個別自動動作修正指令(不図示)とを合算して、アクセル装置50に対応する個別動作指令75’を生成する。
<動作修正指令生成部2110>
動作修正指令生成部2110は、ここでは、アーム操作装置51から出力される一対の個別手動動作修正指令52,53と、学習部118から出力される自動動作修正指令404のうちのアーム操作装置51に対応する一対の個別自動動作修正指令(不図示)とを合算して、アーム操作装置51に対応する一対の個別動作修正指令(不図示。以下、アーム動作修正指令という)を生成する。
また、旋回操作装置54から出力される一対の個別手動動作修正指令55,56と、自動動作修正指令404のうちの旋回操作装置54に対応する一対の個別自動動作修正指令(不図示)とを合算して、旋回操作装置54に対応する一対の個別動作修正指令(不図示。以下、旋回動作修正指令という)を生成する。
また、バケット操作装置57から出力される一対の個別手動動作修正指令58,59と、自動動作修正指令404のうちのバケット操作装置57に対応する一対の個別自動動作修正指令(不図示)とを合算して、バケット操作装置57に対応する一対の個別動作修正指令(不図示。以下、バケット動作修正指令という)を生成する。
また、ブーム操作装置71から出力される一対の個別手動動作修正指令72,73と、自動動作修正指令404のうちのブーム操作装置71に対応する一対の個別自動動作修正指令(不図示)とを合算して、ブーム操作装置71に対応する一対の個別動作修正指令(不図示。以下、ブーム動作修正指令という)を生成する。
また、アクセル装置50から出力されるアクセル修正指令75と、自動動作修正指令404のうちのアクセル装置50に対応する個別自動動作修正指令(不図示)とを合算して、アクセル装置50に対応する個別動作修正指令(不図示。以下、アクセル動作修正指令という)を生成する。
これらの個別動作修正指令が、動作修正指令Pmを構成する。
<学習データ記憶部115>
学習データ記憶部115の動作修正指令記憶部2116が、この動作修正指令Pmを時系列で記憶する。
学習データ記憶部115の予測基礎データ記憶部117が、画像処理部312が出力する作業状況データ212、マイク313が出力する動作状態データ213、及びジャイロセンサ314が出力する反作用データ214を含む予測基礎データPdを時系列で記憶する。
<学習部118>
学習部118は、上述のように、学習時において、動作修正記憶部2116から読み出した動作修正指令(以下、学習用動作修正指令と呼ぶ)Pm’及び予測基礎データ記憶部17から読み出した予測基礎データ(以下、学習用予測基礎データと呼ぶ)Pd’からなる学習データを機械学習し、当該機械学習を終えた後、動作部103の動作時において、予測基礎データPdが入力されると、自動動作修正指令404を出力する。
次に、学習部118の構成を詳しく説明する。図19は、図15の技能伝承油圧ショベル20の動作におけるサイクルタイムを例示する模式図である。図20は、技能伝承油圧ショベル20における動作修正指令Pm、学習用動作修正指令Pm’、予測基礎データPd、及び学習用予測基礎データPd’のそれぞれの時系列データを示す模式図である。図21は、学習部118の構成を示す機能ブロック図である。
<各時系列データの時間的関係>
最初に各時系列データの時間的関係を説明する。
図19を参照すると、油圧ショベル20は、所定作業を複数回繰り返し遂行する。相前後する所定作業の時間間隔は一定ではないが、本実施形態では、便宜上、相前後する所定作業における前の所定作業の開始時刻から後の所定作業が開始される直前までの時間を「サイクルタイム」と呼ぶ。また、前の所定作業と後の所定作業との間の時間が、学習部118が「前の所定作業」における学習データ(学習用動作修正指令Pm’及び学習用予測基礎データPd’)を用いて学習する時間に充当される。以下、この「間の時間」を「学習時間」と呼び、油圧ショベル20が所定作業を行う時間を「動作時間」と呼ぶ。また、各サイクルタイムの「動作時間」における油圧ショベル20の動作を「~回動作」と呼ぶ。
20においては、現在進行中の「動作」が「今回動作」であり、その前の「動作」が「前回動作」である。現在進行中の動作において、動作修正指令Pmの時系列データPm0、Pm1、Pm2、Pm3・・・Pmu(以下、Pm0~Pmuと略記する)が所定のサンプリング間隔で取得される。また、予測基礎データPdの時系列データPd0~Pduが同様に取得される。そして、前回動作において取得された動作修正指令Pmの時系列データPm0~Pmuが、今回動作における学習用動作修正指令Pm’の時系列データPm0’~Pmu’になる。また、前回動作において取得された予測基礎データPdの時系列データPd0~Pduが、今回動作における学習用予測基礎データPd’の時系列データPd0’~Pdu’になる。以下、各時系列データにおける添え字の数字は、サンプリング時刻(間欠的な時刻)の順序を表す。従って、この添え字の数字が同じである時系列データは、同じサンプリング時刻に取得されたデータであることを意味する。
<学習部118の構成>
図21を参照すると、学習部118は、例えば、ニューラルネットワーク500と、学習データ及び教師データ生成部501と、データ入力部502と、学習評価部503と、を備える。
ニューラルネットワーク500は、入力層と、中間層と、出力層とを備える。各層のニューロンの数は、適宜設定される。ニューラルネットワーク500の学習には、周知の学習方法を適用することができる。従って、ここでは簡単に説明する。ここでは、ニューラルネットワーク500は、例えば、リカレント型ニューラルネットワークである。学習の形態は、例えば、教師あり学習である。
学習データ及び教師データ生成部501は、学習用動作修正指令Pm’の時系列データPm0’~Pmu’から教師データpnの時系列データpn1~pnuを生成する。また、学習用予測基礎データPd’の時系列データPd0’~Pdu’から学習データの時系列データPd0’~Pdu-1’を生成する。
データ入力部502は、入力層の各ニューロンに学習データの時系列データPd0’~Pdu-1’を順次入力する。この際、データ入力部502が、あるサンプリング時刻tiにおける学習データの時系列データPdiを入力すると、ニューラルネットワーク500が、前向き演算によって、次のサンプリング時刻ti+1における予測動作修正指令Pni+1を計算する。すると、学習評価部503が、教師データpnの時系列データpn1~pnuから次のサンプリング時刻ti+1における時系列データpni+1を取り込んで、予測動作修正指令Pni+1と教師データpnの時系列データpni+1とについて、例えば、アクセル動作修正指令、アーム動作修正指令、旋回動作修正指令、バケット動作修正指令、及びブーム動作修正指令のそれぞれの二乗誤差の総和値eを計算する。次いで、学習評価部503は、後ろ向き演算によって、ニューラルネットワーク500の重みを更新する。データ入力部502及び学習評価部503は、この処理を、学習データの時系列データPd0’~Pdu-1’の全てについて行い、例えば、全ての処理において、二乗誤差の総和値eが所定の閾値以下になると学習を終了する。
この学習が終了すると、油圧ショベル20の次回動作において、データ入力部502は、現在のサンプリング時刻t0における予測基礎データPd0を入力する。すると、ニューラルネットワーク500が、次のサンプリング時刻t1における予測動作修正指令Pn1を、自動動作修正指令404として出力する。なお、自動動作修正指令404の初期値として、適宜な初期動作指令が出力される。
これにより、油圧ショベル20の動作にニューラルネットワーク500(学習部118)の学習結果が反映される。
なお、入力部502は、あるサンプリング時刻tiにおける学習用予測基礎データPd’の時系列データPdiを入力する際に、それ以前の時系列データPdi-1~Pdi-n(nは所定の正数)を入力してもよい。但し、この場合には、動作時間において、データ入力部502が、これと同様に、各サンプリング時刻tjにおいて、現在の予測基礎データPdjとともに過去の予測基礎データPdj-1~Pdj-nを入力する必要がある。動作時間においては、各サンプリング時刻tjにおいて、予測基礎データ記憶部117に時系列で予測基礎データPd0~Pdj-1が記憶されているので、データ入力部502は、これを予測基礎データ記憶部117から読み出して、過去の予測基礎データPdj-1~Pdj-nを生成する。このようにすると、ニューラルネットワーク500の学習効率が向上する。その理由は、操作者は、バケット18の動きを予測する際に現時点の瞬時における、作業状況、油圧ショベル20の動作状態、及び作業対象からの反作用だけではなく、それ以前からの一連の作業状況、油圧ショベル20の動作状態、及び作業対象からの反作用を考慮して、次のバケット18の動きを予測し、それによって、バケット18の動きを正確に予測するからである。
なお、作業状況、油圧ショベル20の動作状態、及び作業対象からの反作用以外の情報を学習データ及び油圧ショベル20の動作時間における入力データとして用いてもよい。
[動作]
次に、以上のように構成された技能伝承油圧ショベル20の動作を説明する。以下では、油圧ショベル20が、所定作業として穴掘り作業を行う場合を例に挙げて、油圧ショベル20の動作を説明する。
図22は、技能伝承油圧ショベル20による建設作業の状況を示す模式図である。
図22を参照すると、まず、穴131を掘る予定地の上方に第1撮像器311が設置される。第1撮像器311は、例えば、地上に設置された適宜な支持部材に取り付けられる。第1撮像器311は、例えば、無線によって、油圧ショベル20の旋回体15に設けられた上記演算器(学習部118)にデータ通信可能に接続される。第1撮像器311は、例えば、穴131の中央部の上方に位置し、且つ光軸321が穴131の中央部を向くように設置される。
次に、油圧ショベル20が、初期状態に設定される。この初期状態として、例えば、油圧ショベル20が穴131を掘るのに適した設置場所に位置し、且つ、初期姿勢(例えば、図22に示す姿勢)を取る。設置位置は、例えば、油圧ショベル20が移動しないで、バケット18で土砂を掬って穴131を掘り、且つ、バケット18内の掬った土砂を土砂置場に廃棄することが可能な場所に設定される。ここでは、設定位置が、穴131の予定地と土砂置き場との中間位置に設定されていると仮定する。また、第1撮像器311が3次元カメラで構成されていると仮定する。
そして、油圧ショベル20が半自動モードに切り替えられる。
<穴掘り作業>
*修正操作なしの場合*
次いで、熟練の操作者が油圧ショベル20を修正操作しながら穴掘り作業を行う。ここでは、まず、操作者が油圧ショベル20の基本動作を確認するために、修正操作をしない。この動作を、以下、初回動作と呼ぶ。この初回動作では、穴掘り作業は、基本動作指令部2119が、基本動作指令402を出力して動作部103を操作することによって行われる。ここでは、基本動作指令部2119を規定する(実現する)所定作業用の制御プログラムでは、穴掘り予定地の地質(地盤の組成、硬さ等)が所定の地質であると想定されている。この穴掘り作業は、例えば、概略以下のようにして行われる。
まず、基本動作指令部2119は、バケット18を、穴131の上方の降下位置から降下させて穴131の予定地の地面(穴131内の地面を含む)に突き立てる(突き立て動作)。この突き立て動作では、バケット18が降下させられる前に先端の爪が下方を向くようにバケット18が操作される。次いで、突き立てたバケット18を地面に押し付けながらバケット18を手前に回動させて土砂を掬い取る(掬い取り動作)。次いで、バケット18を上記降下位置まで移動させて穴131から引き上げる(引き上げ動作)。次いで、ブーム16が土砂置き場を向くまで旋回体15を旋回させる(順方向旋回動作)。次いで、バケット18を向こう側に回動させてバケット18内の土砂を土砂置き場に排出する(土砂排出動作)。次いで、バケット18が上記降下位置に位置するように旋回体15を逆方向に旋回させる(逆方向旋回動作)。以降、この一連の動作を所定回数繰り返すと、穴掘り作業を終了する。
一方、この間に学習用のデータが取得され、所定作業の終了後、学習部118による機械学習が行われるが、これらは後で詳しく説明する。
*第1の態様の修正操作有りの場合*
次に、操作者は、修正操作の一例としての第1の態様の修正操作を行う。図23(a)~(c)は、油圧ショベル20による穴掘り作業が隅部の掘り下げ作業における修正操作によって改善される過程を模式的に示す断面図である。図23(a)~(c)において、実線は、実際に形成された穴131の断面形状を示し、二点鎖線は、所定作業用の制御プログラムにおいて想定されている穴131の所定の断面形状を示す。
初回動作における修正操作なしの作業によって、図23(a)に示すような隅部が掘り残された断面形状の穴が形成される。隅部の堀り下げ作業は難しいため、所定作業用の制御プログラムでは十分に対応できなかったからである。
この場合、操作者は、動作モード切替操作部を操作して動作モードを手動モードに切り替え、手動で油圧ショベル20を操作することによって、穴131を所定の断面形状に形成する。そして、次の穴掘り予定地に油圧ショベル20を移動させる。ここからの動作を、以下、第2回動作と呼ぶ。
図18を参照すると、操作者は、油圧ショベル20を半自動モードに切り替える。すると、油圧ショベル20が上述の基本動作を開始する。操作者は、必要に応じて、操作部101を操作することによって、油圧ショベル20の動作部103の動作を修正する。特に穴131の隅部を掘り下げる際には、基本動作をほぼ全面的に修正する。
このように、操作者が操作部101、すなわち、アクセル装置50、アーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71を操作すると、手動動作修正指令403が出力され、この手動動作修正指令403によって、基本動作指令402が修正される。その結果、この修正に応じて、動作部103の基本動作が修正される。一方、学習部118が出力する自動動作修正指令404に、この手動動作修正指令403が加算されて動作修正指令Pmが生成される。
<次の操作の判断情報>
この修正の際、操作者は、目視で穴掘りの状況を確認し、バケット18、アーム17、及びブーム16の姿勢を目視で認識することによって、バケット18、アーム17、ブーム16及び運転席(旋回体15)が現在どのように動作しようとしているかを直観する。また、バケット18が地面に作用する(地面を掘る、土を掻き込む等する)と、その反作用を体感することによって、現在の作業(アクション)の当否を判断する。そして、これらを瞬時に勘案して次の操作を決定する。ここで、反作用とは、例えば、運転席の傾き及び振動(加振力、加速度、角加速度等を含む)である。また、操作者は、次の操作を決定する際に駆動源であるエンジン26の状態(回転量、音等)を重視する。
ここで、穴掘りの状況は作業状況を表す情報の一例である。バケット18、アーム17、及びブーム16の姿勢は油圧ショベル20の動作状態を表す情報の一例である。運転席(旋回体15)の傾き及び振動は、地面からの反作用の例である。エンジン26の状態(回転量、音等)は、駆動源の状態を表す情報であり、ひいては油圧ショベル20の動作状態を表す情報である。従って、これらの情報を、学習部118による機械学習の予測基礎データPd’として用いることが好ましい。
<学習用のデータ取得>
学習データ記憶部115の動作修正指令記憶部2116が、上述の各操作に対応する動作修正指令Pmを記憶する。
一方、上記所定作業の一連の動作において、以下のように予測基礎データPdが取得される。
第1撮像器311は、バケット18による穴掘り作業の状況を撮像し、画像処理部312が、この撮像画像を画像処理して、穴掘り作業の状況を表すデータを作業状況データ212として生成し、これを学習データ記憶部115の予測基礎データ記憶部117が記憶する。
具体的には、第1撮像器311は、突き立て動作から引き上げ動作までの動作において、主に、アーム17及びバケット18並びに穴131を撮像し、順方向旋回動作から逆方向旋回動作までの動作において、主に穴131を撮像する。画像処理部312は、例えば、この撮像画像にエッジ処理等の周知の画像処理を施して、アーム17及びバケット18の領域と穴131の領域とを判別し、穴131の平面形状及び中央部の深さのデータを生成する。特に、土砂排出動作時における撮像画像にはアーム17及びバケット18の領域が存在せず、穴131の領域のみが存在するので、土砂排出動作時における作業状況データ212においては、穴131の平面形状及び中央部の深さのデータが正確に特定される。
マイク313は、上記所定作業の一連の動作において、エンジン26の音を受音する。この受音データ(動作状態データ213)を、予測基礎データ記憶部117が記憶する。
特に、掬い取り動作では、例えば、操作者はエンジンの出力を増大させてバケット18を回動させる。これにより、穴131の地面の土砂を好適に掬い取ることができる。従って、掬い取り動作において、受音データの大きさによって、増大されたエンジンの出力の大きさが特定される。
ジャイロセンサ314は、上記所定作業の一連の動作において、旋回体15(運転席)又は本体部102の傾き及び振動(加振力、加速度、角加速度等を含む)を、穴131の地面からの反作用として検知する。この反作用データ214を学習データ記憶部115(正確には予測基礎データ記憶部117)が記憶する。
特に、突き立て動作において、バケット18を地面に突き立てた際の地面からの反作用は、地面の硬さを表している。従って、突き立て動作において、反作用データの大きさによって、バケット18が突き立てられた地面の硬さが特定される。
このように、本実施形態では、次の操作の判断に適した情報を特定することが可能なデータが、学習データとして取得される。
<機械学習>
油圧ショベル20による所定作業が完了すると、制御部401は、学習データ記憶部115に記憶された学習データを用いて、ニューラルネットワーク500が機械学習させられる。この際、上述のように、各サンプリング時刻tiにおける学習データの時系列データPdiを入力する際に、それ以前の時系列データPdi-1~Pdi-n(nは所定の正数)が入力される。
この第2回動作における所定作業では、図23(b)に示すように、初回動作と比べると改善されたものの、隅部の掘り下げが依然として不十分である。操作者は、動作モード切替操作部を操作して動作モードを手動モードに切り替え、手動で油圧ショベル20を操作することによって、穴131を所定の断面形状に形成する。そして、次の穴掘り予定地に油圧ショベル20を移動させ、上述の初期状態に設定する。ここからの動作を、以下、第3回動作と呼ぶ。
図18を参照すると、操作者は、油圧ショベル20を半自動モードに切り替える。すると、油圧ショベル20が、上述の学習結果を反映した自動動作修正指令404を出力し、基本動作指令402が自動動作修正指令404によって修正される。これにより、動作部103の動作が第2回動作における修正操作を反映するように修正される。
操作者は、この第2回動作における修正操作を反映した動作部103の動作を、穴131の形状が所定の断面形状になるように、さらに修正操作する。これにより、このさらなる修正操作に対応する動動作修正指令403が出力され、この手動動作修正指令403によって、自動動作修正指令404により修正された基本動作指令402がさらに修正される。その結果、この第3回動作における所定作業では、図23(c)に示すように、隅部が十分掘り下げられた所定の断面形状を有する穴131が形成される。
一方、第2回動作における修正操作の学習結果を反映した自動動作修正指令404に、このさらなる追加修正操作に対応する手動動作修正指令403が加算されて動作修正指令Pmが生成される。
この動作修正指令Pmを、この後の学習時に学習部118が機械学習し、当該動作修正指令Pmを反映した自動動作修正指令404を学習部118が出力する。これにより、基本動作指令部2119から出力される基本動作指令402が、第2回動作及び第3回動作において累積してなされた修正操作が反映された自動動作修正指令404によって修正される。これにより、動作部103の動作が第2回動作及び第3回動作における修正操作を反映するように修正される。従って、それ以降は、操作者が操作部101を操作することによる改善が不要になる。
このように、本実施形態の油圧ショベル20によれば、操作者による手動動作修正指令403が学習部118に蓄積されるので、最終的には、操作者の技能(ここでは穴掘り作業)が学習部118に伝承される。また、学習部118が実務を通じて学習するので、学習期間が短くて済む。
*第2の態様の修正操作有りの場合*
次に、操作者が第2の態様の修正操作を行う場合を例示する。
図24(a)~(c)は、油圧ショベル20による穴掘り作業が穴掘り予定地の地質に応じた修正操作によって改善される過程を模式的に示す断面図である。図24(a)において、破線は、操作者が修正操作をしなかったと仮定した場合の穴131の断面形状を示す。
図24(a)を参照すると、穴131を掘る予定地の地質が、所定作業用の制御プログラムによって想定されている所定の地質より柔らかい(穴を掘り易い)場合、油圧ショベル20の動作部103が基本動作を行うと、破線で示すように、所定の断面形状より深い形状の穴131が形成されてしまう。しかし、ここでは、熟練の操作者が、半自動モードで油圧ショベル20を修正操作しながら穴掘りを行う。その結果、所定の断面形状を有する穴131が形成される。そして、この修正操作が学習部118によって機械学習される。従って、これ以降、穴131を掘る予定地の地質が今回動作と同様である場合には、操作者が修正操作をすることなく、制御部401の制御によって、油圧ショベル20が所定の断面形状の穴を掘る。
しかし、例えば、穴131を掘る予定地の地質が所定作業用の制御プログラムによって想定されている所定の地質より硬い(穴を掘り難い)場合、学習部118は、作業中に取得される予測基礎データ(例えば、バケット18を地面に突き立てたときの運転席の傾き、振動等、及び穴掘りの途中に第1撮像器311が撮像した穴131の形状等)が、穴131を掘る予定地の地質が所定の地質より柔らかい場合と異なるので、学習部118は、例えば、修正量がゼロの自動動作修正指令404を出力する。このため、操作者が、何ら修正操作をしない場合、動作部103は基本動作指令に従って基本的な動作を行い、図24(b)に示すように、例えば、所定の断面形状より浅い断面形状の穴131が形成されてしまう。
しかし、実際には、熟練の操作者が、この硬い地質に適切に対処して、動作部103の動作を修正操作しながら穴掘りを行う。その結果、図24(c)に示すように、所定の断面形状を有する穴131が形成される。そして、この修正操作が学習部118によって機械学習される。従って、これ以降、穴131を掘る予定地の地質がこの動作におけるものと同様の硬さである場合には、操作者が修正操作をすることなく、制御部401の制御によって、油圧ショベル20が所定の断面形状の穴を掘る。従って、これ以降、穴131を掘る予定地の地質がこの動作におけるものと同様の硬さである場合には、操作者が修正操作をすることなく、制御部401の制御によって、油圧ショベル20が所定の断面形状の穴を掘る。
このように、動作部103の基本的な動作を修正しなければならない態様は多数存在するが、油圧ショベル20のように機械学習する学習部118を用いると、動作部103の基本的な動作を修正しなければならない事象が発生する度に、その態様に応じた手動動作修正指令403(正確には動作修正指令Pm)を学習部118に学習させることによって、操作者の技能の伝承を容易に実現することができる。
また、油圧ショベル20によれば、所定作業に関する動作部103の基本的な動作のうち修正が不要である部分は、基本動作指令部2119によって自動的に遂行されるので、操作者は、必要な修正のみを行えばよい。よって、操作者の負担が軽減される。また、熟練者であっても作業がばらつくので、このように一部の作業のみを操作者の操作によって行うと、全ての作業を操作者の操作によって行う場合に比べて作業の精度が向上する。
<まとめ>
以上に説明したように、実施形態4によれば、基本動作指令部2119による作業部104の基本的な動作を操作者が修正操作するようにして、建設機械200が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械200を提供することできる。
これにより、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械200を提供することができる。
また、実施形態4によれば、既存の油圧ショベルに、制御部401を構成する演算器と、予測基礎データを取得する検知器とを付加することによって、既存の油圧ショベルを本発明の技能伝承油圧ショベル20に改造することができる。
また、この実施形態4の記載を参照することによって、本発明を、油圧ショベル20以外の建設機械に容易に適用することができる。
(実施形態5)
本発明の実施形態5は、実施形態4の油圧ショベル20において、動作状態検知部113が、さらに、第2撮像器331及び画像処理部333を備える形態を例示する。
図25は、実施形態5に係る技能伝承油圧ショベル20のハードウエアの構成を示す側面図である。図26は、図25の技能伝承油圧ショベル20の制御系統の構成を示す機能ブロック図である。
図25及び図26を参照すると、本実施形態の油圧ショベル20は、動作状態検知部113が、さらに、第2撮像器331及び画像処理部333を備える。これ以外の構成は、実施形態4の油圧ショベル20と同じである。
第2撮像器331は、油圧ショベル20の全体を撮像する。第2撮像器331によって撮像された撮像画像は、画像処理部333において、油圧ショベル20の姿勢表すデータが得られるように画像処理され、画像処理部333から動作状態データ213として出力される。第2撮像器331の光軸332は、油圧ショベル20に向けられる。
第2撮像器331は、例えば、通常のデジタルカメラによって構成される。第2撮像器331は、例えば、適宜な支持部材を介して油圧ショベル20の車両とは別個の固定物体(地面等)に固定され、あるいは、ドローンに搭載される。
画像処理部333は、例えば、第2撮像器331が撮像した撮像画像を画像処理して、油圧ショベル20の外形を抽出し、この外形データを動作状態データ213として出力する。この外形データは、油圧ショベル20の動作部103の姿勢を特定できる姿勢データである。
実施形態5によれば、実施形態4で述べた一連の動作において、動作状態データ213の中の油圧ショベル20の外形によって油圧ショベル20の姿勢が特定されるので、学習部118の機械学習の効率が向上し、且つ、動作部103の動作時において学習部118が出力する自動動作修正指令404がより適切なものになる。
(実施形態6)
本発明の実施形態6は、実施形態4の油圧ショベル20において、動作状態検知部113が、さらに、センサ部341を備える形態を例示する。
図27は、実施形態6に係る技能伝承油圧ショベル20のハードウエアの構成を示す側面図である。図28は、図27の技能伝承油圧ショベル20の制御系統の構成を示す機能ブロック図である。
図28を参照すると、本実施形態の油圧ショベル20は、動作状態検知部113が、さらに、センサ部341を備える。これ以外の構成は、実施形態4の油圧ショベル20と同じである。センサ部341は、センサS1~S4で構成される。
図27を参照すると、油圧ショベル20にセンサS1~S4が設けられている。具体的には、旋回体15に、当該旋回体15の回動軸線A1周りの回転角を検知するセンサS1が設けられている。ブーム16の基端部に、当該ブーム16の回動軸線A2周りの回転角を検知するセンサS2が設けられている。アーム17の基端部に、当該アーム17の回動軸線A3周りの回転角を検知するセンサS3が設けられている。アーム17の先端部に、バケット18の回動軸線A4周りの回転角を検知するセンサS4が設けられている。
センサ部341は、センサS1~S4がそれぞれ検知した回転角のデータを、動作状態データ213として出力する。センサS1~S4がそれぞれ検知した回転角のデータの組み合わせは、油圧ショベル20の動作部103の姿勢を特定できる姿勢データである。
実施形態6によれば、実施形態4で述べた一連の動作において、動作状態データ213の中のセンサS1~S4によりそれぞれ検知された回転角の組み合わせによって油圧ショベル20の姿勢が特定されるので、学習部118の機械学習の効率が向上し、且つ、動作部103の動作時において学習部118が出力する自動動作修正指令404がより適切なものになる。
(実施形態7)
本発明の実施形態は、実施形態4乃至6のいずれかの油圧ショベル20において、操作装置がパイロット圧を発生し、制御弁がパイロット圧によって制御される構成である形態を例示する。
図29は、本発明の実施形態7に係る技能伝承建設機械の一例である技能伝承油圧ショベルの動作指令生成部の構成を示す機能ブロック図である。
18及び図29を参照すると、実施形態7では、操作部101のアーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71が、それぞれ、パイロット圧の一対の個別手動動作修正指令(52,53),(55,56),(58,59),(72,73)を、それぞれ出力する。また、アーム制御弁40、旋回制御弁43、バケット制御弁44、及びブーム制御弁47がパイロット圧で制御される制御弁で構成されている。
一方、動作指令生成部2120が、加算器2120aと、圧力/電気変換器2120bと、電気/圧力変換器2120cとを備える。
圧力/電気変換器2120bは、例えば、4対の圧電素子で構成され、操作部101のアーム操作装置51、旋回操作装置54、バケット操作装置57、及びブーム操作装置71から出力される、パイロット圧信号の4対の個別手動動作修正指令(52,53),(55,56),(58),(72,73)を、それぞれ、電気信号の4対の個別手動動作修正指令(52,53),(55,56),(58,59),(72,73)に変換して、これらを加算器2120aに出力する。
加算器2120aは、実施形態4の動作指令生成部2120と同様に動作する。すなわち、これらの4対の個別手動動作修正指令(52,53),(55,56),(58,59),(72,73)に、それぞれに対応する4対の個別基本動作指令と、それぞれに対応する4対の個別自動動作修正指令とを加算し、4対の個別動作指令を生成する。そして、これらの4対の個別動作指令を電気/圧力変換器2120cに出力する。
電気/圧力変換器2120cは、4対の電磁比例弁を含むマルチコントロールバルブで構成され、4対の個別動作指令を、それぞれ、パイロット圧信号の4対の個別動作指令(52’,53’),(55’,56’),(58’,59’),(72’,73’)に変換し、これらを、それぞれ、アーム制御弁40、旋回制御弁43、バケット制御弁44、及びブーム制御弁47に出力する。
なお、4対の個別手動動作修正指令(52,53),(55,56),(58 ,59),(72,73)が手動動作修正指令403の一部を構成し、4対の個別動作指令(52’,53’),(55’,56’),(58’,59’),(72’,73’)が動作指令201の一部を構成する。
このような実施形態7によれば、操作装置がパイロット圧の手動動作修正指令を発生し、制御弁がパイロット圧の動作指令によって制御される油圧ショベル20に本発明を適用することができる。
また、実施形態7によれば、既存の油圧ショベルに、制御部401を構成する演算器と、予測基礎データを取得する検知器と、圧力/電気変換器2120bを構成する圧電素子と、電気/圧力変換器2120cを構成するマルチコントロールバルブとを付加することによって、既存の油圧ショベルを本発明の技能伝承油圧ショベル20に改造することができる。
(その他の実施形態)
実施形態2の油圧ショベル10が、動作状態検知部113において、さらに、実施形態3のセンサ部341を備えてもよい。
また、実施形態1乃至3において、動作状態検知部113が、マイク313に代えて又はマイク313に加えて、各制御弁40,43,44,47の動作を検知する作動センサを備えてもよい。作動センサとして、各制御弁40,43,44,47が接続された油路に設けられた圧力センサ、各制御弁40,43,44,47の弁体の位置を検知する位置センサ等が例示される。
また、実施形態1乃至3において、動作状態検知部113が、マイク313に代えて又はマイク313に加えて、エンジン26の回転速度を検知し、検知した回転速度のデータ(駆動源状態データ)を出力する回転速度センサを備えてもよい。回転速度センサとして、ロータリーエンコーダ、回転計、タコメータ等が例示される。
また、実施形態1乃至3において、学習部118における学習の形態が教師なし学習であってもよい。
また、実施形態1乃至3において、油圧ショベル10の駆動源が、エンジン26以外のものであってあってもよい。そのような駆動源として、電気モータが例示される。
実施形態5の油圧ショベル20が、動作状態検知部113において、さらに、実施形態6のセンサ部341を備えてもよい。また、この油圧ショベル20が実施形態7のように修正されてもよい。
また、実施形態4乃至7のいずれかにおいて、動作状態検知部113が、マイク313に代えて又はマイク313に加えて、各制御弁40,43,44,47の動作を検知する作動センサを備えてもよい。
また、実施形態4乃至7のいずれかにおいて、動作状態検知部113が、マイク313に代えて又はマイク313に加えて、エンジン26の回転速度を検知し、検知した回転速度のデータ(駆動源状態データ)を出力する回転速度センサを備えてもよい。回転速度センサとして、ロータリーエンコーダ、回転計、タコメータ等が例示される。
また、実施形態4乃至7のいずれかにおいて、学習部118における学習の形態が教師なし学習であってもよい。
また、実施形態4乃至7のずれかにおいて、油圧ショベル20の駆動源が、エンジン26以外のものであってあってもよい。そのような駆動源として、電気モータが例示される。
実施形態4乃至6のいずれかにおいて、動作指令生成部2120を、油圧パイロット圧信号同志を加えるように構成してもよい。
上記説明から、当業者にとっては、多くの改良や他の実施形態が明らかである。従って、上記説明は、例示としてのみ解釈されるべきである。
本発明の学習機能付き建設機械は、人が操作して建設機械が行う作業を学習し、学習した作業を自動的に行うことが可能な建設機械として有用である。
また、本発明の技能伝承建設機械は、建設業界における熟練操作者の技能を伝承することが可能であり、且つ、所定の作業の自動化を短期間で達成することが可能な技能伝承建設機械として有用である。
1 油圧駆動システム
8 流量制御装置
10 学習機能付き油圧ショベル(油圧ショベル)
11 ブームシリンダ
12 アームシリンダ
13 バケットシリンダ
14 旋回モータ
15 旋回体
16 ブーム
17 アーム
18 バケット
19 走行体
20 油圧ショベル
21 第1主ポンプ
22 第1流量調整装置
23 第2主ポンプ
24 第2流量調整装置
25 副ポンプ
40 アーム制御弁
43 旋回制御弁
44 バケット制御弁
47 ブーム制御弁
50 アクセル装置
51 アーム操作装置
54 旋回操作装置
57 バケット操作装置
71 ブーム操作装置
81~86,91,92 圧力センサ
100 学習機能付き建設機械(建設機械)
101 操作部
102 本体部
103 動作部
104 作業部
105 油圧駆動システム
106 油圧回路
107 ポンプ部
110 動作指令検知部
112 作業状況検知部
113 動作状態検知部
114 反作用検知部
115 学習データ記憶部
116 指令データ記憶部
117 予測基礎データ記憶部
118 学習部
119 操作部駆動部
120 予測動作指令変換部
131 穴
200 技能伝承建設機械
201 動作指令
202 駆動力
211,211’ 指令データ
212 作業状況データ
213 動作状態データ
214 反作用データ
311 第1撮像器
312 画像処理部
313 マイク
314 ジャイロセンサ
321 光軸
331 第2撮像器
332 光軸
333 画像処理部
341 センサ部
1400 ニューラルネットワーク
1401 学習データ及び教師データ生成部
1402 データ入力部
1403 学習評価部
500 ニューラルネットワーク
501 学習データ及び教師データ生成部
502 データ入力部
503 学習評価部
1000 学習機能付き建設機械
1101 指令データ生成部
1102 指令記憶部
1103 予測指令
2110 動作修正指令生成
2116 動作修正指令記憶部
2119 基本動作指令部
2120 動作指令生成部
A1~A4 第1乃至第4回動軸線
M1~M5 サーボモータ
Pd 予測基礎データ
Pd’ 学習用予測基礎データ
Pf 予測動作指令
Pf’ 学習用指令データ
S1~S4 センサ

Claims (11)

  1. 作業部を有し、前記作業部を、作業を行うよう動かす動作部と、
    操作者の操作に応じた指令を出力する操作部と、
    前記作業部による前記作業の状況を検知し、検知した作業状況を作業状況データとして出力する作業状況検知部と、
    前記動作部の動作状態を検知し、検知した動作状態を動作状態データとして出力する動作状態検知部と、
    前記作業部の作業により前記動作部が作業対象から受ける反作用を検知し、検知した反作用を反作用データとして出力する反作用検知部と、
    前記指令を時系列で指令データとして記憶するとともに、前記作業状況データ、前記動作状態データ、及び前記反作用データを含む予測基礎データを時系列で記憶する学習データ記憶部と、
    前記学習データ記憶部に記憶された前記予測基礎データを用いて前記学習データ記憶部に記憶された前記指令データを機械学習し、機械学習を終えた後、前記動作部の動作時に前記予測基礎データが入力され、前記指令の予測指令を出力する学習部と、
    前記指令、前記予測指令、又は前記指令及び前記予測指令に基づいて前記動作部を駆動する油圧駆動システムと、を備える、学習機能付き建設機械。
  2. 前記操作部が、前記指令として、前記操作者の操作に応じた動作指令を出力するよう構成され、
    学習データ記憶部が、前記動作指令を時系列で指令データとして記憶するとともに、前記作業状況データ、前記動作状態データ、及び前記反作用データを含む予測基礎データを時系列で記憶するよう構成され、
    前記学習部が、学習時において、前記学習データ記憶部に記憶された前記予測基礎データを用いて前記学習データ記憶部に記憶された前記指令データを機械学習し、前記機械学習を終えた後の自動制御時において、前記予測基礎データが入力され、前記予測指令である予測動作指令を出力するよう構成され、且つ、
    油圧駆動システムが、前記動作指令又は前記予測動作指令に従って前記動作部を駆動するよう構成されている、請求項1に記載の学習機能付き建設機械。
  3. 前記動作部が設けられた本体部を備え、
    前記反作用検知部が、前記動作部又は前記本体部の傾き、加速度、及び角加速度の少なくともいずれかを含む前記反作用を検知し、検知した反作用を前記反作用データとして出力する、請求項2に記載の学習機能付き建設機械。
  4. 前記動作状態検知部が、前記油圧駆動システムの作動油を加圧するポンプを駆動する駆動源の出力及び動作音の少なくともいずれかを含む駆動源の状態を検知し、検知した駆動源の状態を駆動源状態データとして出力する駆動源状態検知部を含み、
    前記動作状態データが、前記駆動源状態データを含む、請求項2又は3に記載の学習機能付き建設機械。
  5. 前記動作状態データが、前記指令データを含む、請求項2乃至4のいずれかに記載の学習機能付き建設機械。
  6. 動作状態検知部が、前記動作部の姿勢を検知し、検知した姿勢を姿勢データとして出力する姿勢検知部をさらに備え、
    前記動作状態データが、前記姿勢データを含む、請求項2乃至5のいずれかに記載の学習機能付き建設機械。
  7. 前記学習機能付き建設機械が、制御部を備える技能伝承建設機械であり、
    前記操作部が、前記指令として、前記操作者の操作に応じた手動動作修正指令を出力するよう構成され、
    前記油圧駆動システムが、基本動作指令と自動動作修正指令と前記手動動作修正指令とに従って前記動作部を駆動するよう構成され、且つ、
    前記制御部が、
    前記動作部によって前記作業部に基本的な動きをさせる前記基本動作指令を出力する基本動作指令部と、
    前記自動動作修正指令に前記手動動作修正指令を加えて動作修正指令を生成する動作修正指令生成部と、
    前記動作修正指令を前記指令データとして時系列で記憶する動作修正指令記憶部と前記予測基礎データを時系列で記憶する予測基礎データ記憶部とを含む前記学習データ記憶部と、
    前記学習部と、を備え、
    前記学習部が、前記予測基礎データ記憶部に記憶された前記予測基礎データを用いて前記動作修正指令記憶部に記憶された前記動作修正指令を機械学習し、機械学習を終えた後、前記動作部の動作時に前記予測基礎データが入力され、前記予測指令である前記自動動作修正指令を出力するよう構成されている、請求項1に記載の学習機能付き建設機械。
  8. 前記動作部が設けられた本体部を備え、
    前記反作用検知部が、前記動作部又は前記本体部の傾き、加速度、及び角加速度の少なくともいずれかを含む前記反作用を検知し、検知した反作用を前記反作用データとして出力する、請求項7に記載の学習機能付き建設機械。
  9. 前記動作状態検知部が、前記油圧駆動システムの作動油を加圧するポンプを駆動する駆動源の出力及び動作音の少なくともいずれかを含む駆動源の状態を検知し、検知した駆動源の状態を駆動源状態データとして出力する駆動源状態検知部を含み、
    前記動作状態データが、前記駆動源状態データを含む、請求項7又は8に記載の学習機能付き建設機械。
  10. 前記動作状態検知部が、前記動作部の姿勢を検知し、検知した姿勢を姿勢データとして出力する姿勢検知部をさらに備え、
    前記動作状態データが、前記姿勢データを含む、請求項7乃至9のいずれかに記載の学習機能付き建設機械。
  11. 前記手動動作修正指令が電気指令信号であり、
    前記動作部が、前記作業部を駆動する油圧アクチュエータと、前記基本動作指令、前記自動動作修正指令、及び前記手動動作修正指令に従って前記油圧アクチュエータの動作を油圧制御する制御弁と、を備え、
    前記制御弁が、電磁弁である、請求項7乃至10のいずれかに記載の学習機能付き建設機械。
JP2021522270A 2019-05-24 2020-05-20 学習機能付き建設機械 Active JP7079896B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2019097382 2019-05-24
JP2019097381 2019-05-24
JP2019097382 2019-05-24
JP2019097381 2019-05-24
PCT/JP2020/019977 WO2020241419A1 (ja) 2019-05-24 2020-05-20 学習機能付き建設機械

Publications (2)

Publication Number Publication Date
JPWO2020241419A1 JPWO2020241419A1 (ja) 2021-11-18
JP7079896B2 true JP7079896B2 (ja) 2022-06-02

Family

ID=73552205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021522270A Active JP7079896B2 (ja) 2019-05-24 2020-05-20 学習機能付き建設機械

Country Status (4)

Country Link
US (1) US20220220709A1 (ja)
JP (1) JP7079896B2 (ja)
CN (2) CN113228139A (ja)
WO (1) WO2020241419A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7481908B2 (ja) * 2020-05-29 2024-05-13 株式会社小松製作所 掘削計画作成装置、作業機械および掘削計画作成方法
WO2023021776A1 (ja) * 2021-08-18 2023-02-23 Soinn株式会社 情報処理装置、情報処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体
US20230106822A1 (en) * 2021-10-04 2023-04-06 Caterpillar Trimble Control Technologies Llc Implement-on-ground detection using vibration signals
KR20240039049A (ko) * 2022-03-31 2024-03-26 히다치 겡키 가부시키 가이샤 작업 기계

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016130409A (ja) 2015-01-13 2016-07-21 株式会社小松製作所 掘削機械、掘削機械の制御方法及び掘削システム
JP2016156193A (ja) 2015-02-25 2016-09-01 株式会社日立製作所 操作支援システムおよび操作支援システムを備えた作業機械
JP6360583B1 (ja) 2017-03-29 2018-07-18 大成建設株式会社 建設機械用機械学習装置、建設機械および建設機械用機械学習方法
WO2018203091A1 (en) 2017-05-05 2018-11-08 J.C. Bamford Excavators Ltd Working machine
US20190031237A1 (en) 2016-04-18 2019-01-31 Robo Industries, Inc. Vehicle automatic power and driving control
WO2019189888A1 (ja) 2018-03-30 2019-10-03 住友重機械工業株式会社 建設機械の運転支援システム、建設機械
JP2020004096A (ja) 2018-06-28 2020-01-09 株式会社小松製作所 作業車両による作業を判定するためのシステム、方法、及び学習済みモデルの製造方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59168755A (ja) * 1983-03-14 1984-09-22 Sanyo Electric Co Ltd 自動ダイアル装置
US5493798A (en) * 1994-06-15 1996-02-27 Caterpillar Inc. Teaching automatic excavation control system and method
JP2002202716A (ja) * 2000-12-28 2002-07-19 Shin Caterpillar Mitsubishi Ltd 機械の電気・電子回路研修方法
JP2003184131A (ja) * 2001-12-19 2003-07-03 Hitachi Constr Mach Co Ltd 建設機械の操作装置
JP5217250B2 (ja) * 2007-05-28 2013-06-19 ソニー株式会社 学習装置および学習方法、情報加工装置および情報加工方法、並びにプログラム
JP4427759B2 (ja) * 2007-06-29 2010-03-10 アイシン・エィ・ダブリュ株式会社 車両挙動学習装置及び車両挙動学習プログラム
JP6159955B1 (ja) * 2016-04-14 2017-07-12 株式会社大都技研 遊技台
JP6517762B2 (ja) * 2016-08-23 2019-05-22 ファナック株式会社 人とロボットが協働して作業を行うロボットの動作を学習するロボットシステム
JP6710644B2 (ja) * 2017-01-05 2020-06-17 株式会社東芝 動作解析装置、動作解析方法およびプログラム
CN206789176U (zh) * 2017-04-15 2017-12-22 沈阳建筑大学 一种多功能组合式工程机械教具
JP7316052B2 (ja) * 2019-01-29 2023-07-27 株式会社小松製作所 作業機械を含むシステム、およびコンピュータによって実行される方法
JP7419348B2 (ja) * 2019-04-04 2024-01-22 株式会社小松製作所 作業機械を含むシステム、コンピュータによって実行される方法、および学習済みの姿勢推定モデルの製造方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016130409A (ja) 2015-01-13 2016-07-21 株式会社小松製作所 掘削機械、掘削機械の制御方法及び掘削システム
JP2016156193A (ja) 2015-02-25 2016-09-01 株式会社日立製作所 操作支援システムおよび操作支援システムを備えた作業機械
US20190031237A1 (en) 2016-04-18 2019-01-31 Robo Industries, Inc. Vehicle automatic power and driving control
JP6360583B1 (ja) 2017-03-29 2018-07-18 大成建設株式会社 建設機械用機械学習装置、建設機械および建設機械用機械学習方法
WO2018203091A1 (en) 2017-05-05 2018-11-08 J.C. Bamford Excavators Ltd Working machine
WO2019189888A1 (ja) 2018-03-30 2019-10-03 住友重機械工業株式会社 建設機械の運転支援システム、建設機械
JP2020004096A (ja) 2018-06-28 2020-01-09 株式会社小松製作所 作業車両による作業を判定するためのシステム、方法、及び学習済みモデルの製造方法

Also Published As

Publication number Publication date
CN113228139A (zh) 2021-08-06
US20220220709A1 (en) 2022-07-14
WO2020241419A1 (ja) 2020-12-03
JPWO2020241419A1 (ja) 2021-11-18
CN115467382A (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
JP7079896B2 (ja) 学習機能付き建設機械
CN101903839B (zh) 持续的作业机具角度控制
JP6676825B2 (ja) 作業機械
CN102041824B (zh) 一种挖掘机工作装置的自动控制系统及控制方法
US20210215483A1 (en) Controlling movement of a machine using sensor fusion
CN111042245B (zh) 一种挖掘机辅助作业控制方法及系统
CN108055855A (zh) 作业机械
US20170328031A1 (en) Operation identification of a work machine
CN113167054B (zh) 包括作业机械的系统、由计算机执行的方法及学习用数据
CN108779614A (zh) 作业机械
CN109778941B (zh) 一种基于强化学习的半自主挖掘系统和方法
WO2021020464A1 (ja) ショベル
CN109511267A (zh) 作业机械以及作业机械的控制方法
US20210025133A1 (en) Anticipatory modification of machine settings based on predicted operational state transition
US11920321B2 (en) System and method for automatically performing an earthmoving operation
JP2023174887A (ja) 作業機械、情報処理装置
US20230243130A1 (en) Excavation plan creation device, working machine, and excavation plan creation method
JP6762881B2 (ja) 掘削機
JPH09256405A (ja) 建設機械の干渉防止装置
JP2020002751A (ja) 作業機械
CN114428483B (zh) 作业机械遥控端力反馈控制方法、装置及系统
JP6816783B2 (ja) クレーン
WO2023100689A1 (ja) 建設機械の駆動装置、これを備えた建設機械及び建設機械システム
JP7134024B2 (ja) 建設機械
CN115387426B (zh) 作业机械的控制方法、装置、设备及作业机械

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220523

R150 Certificate of patent or registration of utility model

Ref document number: 7079896

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150