WO2020100894A1 - 学習装置、方法、及びプログラム - Google Patents

学習装置、方法、及びプログラム Download PDF

Info

Publication number
WO2020100894A1
WO2020100894A1 PCT/JP2019/044332 JP2019044332W WO2020100894A1 WO 2020100894 A1 WO2020100894 A1 WO 2020100894A1 JP 2019044332 W JP2019044332 W JP 2019044332W WO 2020100894 A1 WO2020100894 A1 WO 2020100894A1
Authority
WO
WIPO (PCT)
Prior art keywords
learning
label
data
time
unit
Prior art date
Application number
PCT/JP2019/044332
Other languages
English (en)
French (fr)
Inventor
雄貴 蔵内
阿部 直人
瀬下 仁志
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/293,458 priority Critical patent/US20210406781A1/en
Publication of WO2020100894A1 publication Critical patent/WO2020100894A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • B60W40/06Road conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles

Definitions

  • the present invention relates to a learning device, a method, and a program, and more particularly to a learning device, a method, and a program for estimating a target state.
  • Non-Patent Documents 1 and 2 See, for example, Non-Patent Documents 1 and 2).
  • the road surface condition estimation as described above is often performed using a model constructed by machine learning using learning data. However, depending on the condition of the road surface, there is a problem that the desired estimation result cannot be obtained and the estimation accuracy is not sufficient.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a learning device, method, and program capable of learning a model for accurately estimating a label indicating a data state.
  • the learning device is learning data that is time-series data, and includes learning data to which any one of a plurality of types of labels is assigned as a correct answer label at each time.
  • the batch size which is a unit of the learning data used in machine learning, as a predetermined size
  • the learning data of the batch size in the learning data set is used, and a label is given by machine learning determined in advance.
  • a first learning unit that learns the first model for estimation and outputs an estimation result of the label at each time for each learning data, and a first learning unit that outputs a correct answer label for each time for each of the learning data
  • a second model for outputting any label from the label estimation result at each time by a predetermined machine learning with the label estimation result as an input and the batch size as a size larger than the predetermined size.
  • a second learning unit for learning is
  • the first learning unit is learning data that is time-series data, and is learning data that includes any of a plurality of types of labels as correct answer labels at each time.
  • a batch size which is a unit of learning data used in machine learning, as a predetermined size, and using learning data of the batch size in the learning data set.
  • a step of learning the model is learning data that is time-series data, and is learning data that includes any of a plurality of types of labels as correct answer labels at each time.
  • the program according to the third invention is a program for causing a computer to function as each unit of the learning device according to the first invention.
  • the learning device the method, and the program of the present invention, it is possible to obtain an effect that a model for estimating a label indicating a data condition can be learned with high accuracy.
  • the batch size in machine learning is learned stepwise to improve the estimation accuracy.
  • FIG. 1 shows an example of the result of estimating the condition of the road surface on which a moving body moves by conventional machine learning.
  • FIG. 1 shows a correct answer label and a likelihood estimation result of each estimation class, and is a graph in which the vertical axis represents likelihood and the horizontal axis represents time series time.
  • the time series time is 100 ms.
  • the unit of 100 ms is a unit time for shifting the batch at the time of learning
  • the graph of FIG. 1 indicates that there is a time transition of 100 ms for each unit.
  • time shown in the embodiments of the present invention represents a unit time of 100 ms.
  • the estimated class of the condition of the road surface on which the moving body moves is “flat” indicating a flat road, “stationary” indicating that the moving body is in a stationary state, “staircase ⁇ ” indicating an up staircase, and “staircase” indicating a down staircase. ⁇ ”.
  • the correct label is assigned to each time of the time series, the likelihood of the desired label may not always be the highest in the likelihood of the estimation result.
  • the correct answer label in the time series 1 to 71 is “staircase ⁇ ”, but the likelihood of the label “flat” shown in (B) is higher than the likelihood of the label “staircase ⁇ ” shown in (A).
  • the accuracy is higher and the correct result cannot be obtained.
  • One of the causes of such an estimation result is that the number of correct labels in the learning data is uneven. For example, if the label is subdivided and a label “2 cm step ⁇ ” indicating an uphill 2 cm step is used, it is assumed that such a label will appear less frequently in the learning data.
  • the estimation accuracy of the label having a small number of appearances is corrected by the two-step learning in which the learning with a large batch size is utilized while utilizing the highly accurate learning when the batch size is small.
  • Learn to For example, if there is a label that appears once in 1000 times, with a unit of 100 ms as one batch, the batch size is set to 1024 which is 1000 or more, and 2048 or 4096 with a margin. This makes it possible to estimate a desired label even if the learning data is biased.
  • the estimation system 1 includes a learning device 20 and an estimation device 40.
  • Each of the learning device 20 and the estimation device 40 can be configured by a computer including a CPU, a RAM, and a ROM that stores a program and various data for executing processing of the operation described below.
  • a learning data set including learning data that is time series data is input to the learning device 20.
  • learning data road surface data detected in time series by a plurality of types of sensors that detect the state of the moving object that is the estimation target is used.
  • one of a plurality of types of labels is given as a correct answer label every time.
  • the label is the type of road surface condition such as “flat”, “stationary”, “stair ⁇ ”, “stair ⁇ ”, etc. It is also possible to subdivide the condition of the road surface and use a label such as "2 cm step ⁇ ".
  • the model for learning the likelihood for each label is learned from the input data obtained from the road surface data by shifting the window having a width of 1500 ms by 100 ms.
  • the correct answer class is the condition of the road surface corresponding to the time of 750 ms which is the center of the window.
  • the window width may be shorter than 1500 ms.
  • various sensors such as an acceleration sensor, a gyro sensor, a geomagnetic sensor, a gravity sensor, an atmospheric pressure sensor, and an inclination sensor can be appropriately used according to the estimation target.
  • the learning device 20 includes a first learning unit 24 and a second learning unit 32.
  • the first learning unit 24 constructs a learned first model 26 using the learning first model 22.
  • the first learning model 22 is a model for obtaining the likelihood of the label for each label.
  • the second learning unit 32 constructs the learned second model 34 using the learning second model 30.
  • various machine learning such as CNN (Convolutional Neural Network), RNN (Recurrent Neural Network), LSTM (Long short-term memory), SVM (Support Vector Machine), etc. Can be used.
  • the first learning unit 24 receives a learning data set as an input, sets a batch size, which is a unit of learning data used in machine learning as a predetermined size, and uses learning data of a predetermined batch size in the learning data set to perform machine learning.
  • the parameters of the first model for learning 22 are learned to construct the learned first model 26.
  • the batch size is set to 64 to 512
  • the number of learnings is set to 500
  • the number of epochs (the number of times the learning unit is repeated with the number of learnings set to 1) is set to 50, etc. All you have to do is learn.
  • the window having the width of 1500 ms is shifted by 100 ms, and the parameters of the first learning model 22 are learned from the input data obtained from the learning data and the correct answer label so that the likelihood of the correct answer label becomes the highest.
  • the first learning unit 24 assigns a correct answer label to the likelihood of each time for each label of each of the learning data obtained in the learning process, and stores it as the time series likelihood data 28.
  • the correct answer label is given, for example, by giving the correct answer label corresponding to time to each of the likelihoods of the labels “flat”, “still”, “stair ⁇ ”, and “stair ⁇ ”. For example, if it is the likelihood of each label from time 1 to 71 shown in FIG. 1, “staircase ⁇ ” is given as the correct label.
  • the second learning unit 32 receives the time-series likelihood data 28 as an input, sets the batch size to a size larger than the predetermined size of the first learning unit 24, and uses machine learning to select one of the labels from the label estimation result at each time.
  • the parameters of the learning second model 30 for outputting are learned and the learned second model 34 is constructed.
  • the batch size 1024, 2048, 4096 or the like having a size larger than the batch sizes 64 to 512 used in the first learning unit 24 is used.
  • the number of learnings and the number of epochs may be the same as or different from the machine learning of the first learning unit 24.
  • the estimation device 40 includes a learned first model 26 for obtaining the likelihood of a label for each of a plurality of types of labels, and a learned second model 34 for outputting any label from the label estimation result at each time. Labels are estimated using and.
  • the estimated labels are “flat”, “still”, “stairs ⁇ ”, “stairs ⁇ ”, etc. used as the correct labels of the learning data of the learning device 20.
  • the first estimation unit 42 inputs the road surface data, which is time-series data, into the learned first model 26, estimates the likelihood of the label for each label at each time, and outputs it to the second estimation unit 44. Specifically, the likelihood of each label is estimated using the learned first model 26 for each of the input data obtained from the road surface data by shifting the window having the width of 1500 ms by 100 ms. Obtain the likelihood of the label at each time.
  • the second estimating unit 44 inputs the likelihood of the label at each time for each label estimated by the first estimating unit 42 to the learned second model 34, and corresponds to the likelihood at each time for each label, Estimate either label.
  • step S100 the learning device 20 receives an input of a learning data set including learning data which is time series data.
  • the learning data is road surface data detected by the sensor in time series.
  • step S102 the first learning unit 24 uses the learning data set as an input, sets the batch size, which is a unit of the learning data used in machine learning, as a predetermined size, and uses the learning data of the predetermined batch size in the learning data set. Then, the parameters of the first model for learning 22 are learned by machine learning, and the learned first model 26 is constructed.
  • step S104 the first learning unit 24 assigns the correct answer label to the likelihood of each time for each label of each of the learning data obtained in the learning process, and stores it as the time series likelihood data 28. ..
  • step S106 the second learning unit 32 receives the time-series likelihood data 28 as an input, sets the batch size to a size larger than the predetermined size of the first learning unit 24, and performs machine learning from the label estimation result at each time.
  • the parameters of the learning second model 30 for outputting any label are learned, and the learned second model 34 is constructed.
  • step S200 the estimation device 40 receives an input of road surface data detected by the sensor in time series.
  • step S202 the first estimation unit 42 inputs the road surface data, which is time-series data, into the learned first model 26, estimates the likelihood of the label for each label for each time, and causes the second estimation unit 44 to perform the estimation. Output.
  • step S204 the second estimation unit 44 inputs the likelihood of the label at each time for each label estimated by the first estimation unit 42 to the learned second model 34, and the likelihood at each time for each label. Estimate any label corresponding to.
  • step S206 the estimation device 40 outputs the label estimation result obtained in step S204.
  • the learning device 20 sets the batch size, which is a unit of learning data used in machine learning, as a predetermined size, and determines the likelihood of the label for each label.
  • the first model for obtaining is learned, and the time-series likelihood data, which is the likelihood of each time for each label, is output for each of the learning data.
  • the time-series likelihood data for each of the learning data to which the correct answer label is given is input, and the second model for outputting any label from the change in the likelihood for each label is learned by machine learning. ..
  • the second model for outputting any label from the change in the likelihood for each label is learned by machine learning. ..
  • the estimation device 40 inputs the time-series data to the trained first model for obtaining the likelihood of the label for each of a plurality of types of labels, and estimates the likelihood of the label at each time for each label.
  • the likelihood of the label at each time for each estimated label is input to the trained second model for outputting one of the labels from the estimation result of the label at each time, and the batch size is set to a predetermined size. As a large size, one of the labels corresponding to the likelihood of each label at each time is estimated. This makes it possible to accurately estimate the label indicating the status of the data.
  • the learning device 20 and the estimation device 40 can also be realized by using a computer.
  • a computer stores a program describing the processing content for realizing each function of the learning device 20 and the estimation device 40 in the storage unit of the computer, and causes the CPU of the computer to read and execute the program. It can be realized.
  • the present invention is not limited to this, and the embodiment of the present invention can be applied to data detected at each time of a time series.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)

Abstract

精度よくデータの状況を示すラベルを推定するためのモデルを学習できる。 機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、学習データ集合のうちバッチサイズの学習データを用いて、ラベル毎にラベルの尤度を求めるための第1モデルを学習し、学習データの各々について、ラベル毎の各時間の尤度である時系列尤度データを出力する。正解ラベルを付与した、学習データの各々についての時系列尤度データを入力として、バッチサイズを第1学習部24の所定のサイズより大きいサイズとして、機械学習によって、ラベル毎の尤度の変化からいずれかのラベルを出力するための第2モデルを学習する。

Description

学習装置、方法、及びプログラム
 本発明は、学習装置、方法、及びプログラムに係り、特に、対象の状態を推定するための学習装置、方法、及びプログラムに関する。
 歩道あるいは車道などの路面上を移動する自動車、歩行者、車椅子などの移動体に搭載されたセンサを用いて、移動体が移動する路面の状況(段差、勾配など)を推定する技術が検討されている(例えば、非特許文献1、2参照)。
宮田章裕、荒木伊織、王統順、鈴木天詩、「健常歩行者センサデータを用いたバリア検出の基礎検討」、IPSJ論文誌(2018) 「高速バスに載せたスマホの加速度センサーで路面の凹凸を検知、検証試験を実施」、[online]、[2018年11月6日検索]、インターネット<URL:https://sgforum.impress.co.jp/news/3595>
 上述したような路面の状況の推定は、学習データを用いた機械学習により構築されたモデルを用いて行われることが多い。しかしながら、路面の状況によっては、所望の推定結果が得られず、推定精度が十分でないという問題がある。
 本発明は、上記事情を鑑みて成されたものであり、精度よくデータの状況を示すラベルを推定するためのモデルを学習できる学習装置、方法、及びプログラムを提供することを目的とする。
 上記目的を達成するために、第1の発明に係る学習装置は、時系列データである学習データであって、時間毎に複数種類のいずれかのラベルが正解ラベルとして付与された学習データからなる学習データ集合を入力として、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、前記学習データ集合のうち前記バッチサイズの学習データを用いて、予め定めた機械学習によって、ラベルを推定するための第1モデルを学習し、学習データの各々について、各時間の前記ラベルの推定結果を出力する第1学習部と、正解ラベルを付与した、前記学習データの各々についての各時間の前記ラベルの推定結果を入力として、前記バッチサイズを前記所定のサイズより大きいサイズとして、予め定めた機械学習によって、各時間の前記ラベルの推定結果からいずれかのラベルを出力するための第2モデルを学習する第2学習部と、を含んで構成されている。
 第2の発明に係る学習方法は、第1学習部が、時系列データである学習データであって、時間毎に複数種類のいずれかのラベルが正解ラベルとして付与された学習データからなる学習データ集合を入力として、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、前記学習データ集合のうち前記バッチサイズの学習データを用いて、予め定めた機械学習によって、ラベルを推定するための第1モデルを学習し、学習データの各々について、各時間の前記ラベルの推定結果を出力するステップと、第2学習部が、正解ラベルを付与した、前記学習データの各々についての各時間の前記ラベルの推定結果を入力として、前記バッチサイズを前記所定のサイズより大きいサイズとして、予め定めた機械学習によって、各時間の前記ラベルの推定結果からいずれかのラベルを出力するための第2モデルを学習するステップと、を含んで実行することを特徴とする。
 第3の発明に係るプログラムは、コンピュータを、第1の発明に記載の学習装置の各部として機能させるためのプログラムである。
 本発明の学習装置、方法、及びプログラムによれば、精度よくデータの状況を示すラベルを推定するためのモデルを学習できる、という効果が得られる。
従来の機械学習による移動体が移動する路面の状況の推定結果の一例を示す図である。 本発明の実施の形態に係る学習装置及び推定装置を含む推定システムの構成を示すブロック図である。 本発明の実施の形態に係る学習装置における処理ルーチンを示すフローチャートである。 本発明の実施の形態に係る推定装置における処理ルーチンを示すフローチャートである。
 以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
 まず、本発明の実施の形態における概要を説明する。本発明の実施の形態では、機械学習におけるバッチサイズを段階的にして学習を行い、推定精度を向上させる。
 図1に従来の機械学習による移動体が移動する路面の状況の推定結果の一例を示す。図1は、正解ラベルと、推定クラスの各々の尤度の推定結果とを表すものであり、縦軸に尤度、横軸に時系列の時間をとったグラフである。時系列の時間は100ms単位としている。ここでは、100ms単位は学習時にバッチをずらす単位時間としており、図1のグラフでは1ごとに100msの時間推移があることを表している。以下、本発明の実施の形態において示す「時間」は100msの単位時間を表すものである。移動体が移動する路面の状況の推定クラスは、平坦路を示す「平坦」、移動体が静止状態であることを示す「静止」、上り階段を示す「階段↑」、下り階段を示す「階段↓」である。時系列の各時間には正解ラベルが割り当てられるが、推定結果の尤度では、必ずしも所望のラベルの尤度が最も高くならない場合がある。例えば、時系列の時間1~71の正解ラベルは「階段↑」であるが、(A)に示したラベル「階段↑」の尤度よりも、(B)に示したラベル「平坦」の尤度の方が高く、正しい結果が得られない問題がある。このような推定結果となる一因としては、学習データの正解ラベルの数に偏りがあることが挙げられる。例えば、ラベルを細分化して、上りの2cmの段差を示す「2cmの段差↑」というラベルを用いるとすれば、このようなラベルは学習データにおいて出現頻度が少なくなることが想定される。
 また、機械学習では学習データはバッチサイズ毎にバッチに分割して学習が行われる。一般的には、バッチサイズとして定めたバッチに全てのラベルが含まれないと推定精度が下がってしまうが、バッチサイズが大きすぎると学習精度が下がってしまうという問題がある。そこで、本発明の実施の形態では、バッチサイズが小さい場合の高精度な学習を活かしつつ、バッチサイズを大きくした学習も行う二段階による学習によって、出現数の少ないラベルの推定精度を補正するように学習を行う。例えば、100ms単位をバッチ1回分として1000回に1回出現するラベルがあるとすれば、バッチサイズを1000以上の1024、余裕を見て2048や4096等にする。これにより、学習データに偏りがあったとしても、所望のラベルを推定できるようになる。
 以上の前提を元に本発明の実施の形態について説明する。
<本発明の実施の形態に係る構成>
 次に、本発明の実施の形態に係る構成について説明する。図2に示すように、本発明の実施の形態に係る推定システム1は、学習装置20と、推定装置40とを含んで構成されている。学習装置20、及び推定装置40はそれぞれ、CPUと、RAMと、後述する作用の処理を実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。
 まず、学習装置20について説明する。学習装置20には、時系列データである学習データからなる学習データ集合が入力される。学習データには、推定対象である移動体の状態を検出する複数種類のセンサにより時系列に検出された路面データを用いる。また、学習データには、時間毎に複数種類のいずれかのラベルを正解ラベルとして付与している。ラベルは、「平坦」、「静止」、「階段↑」、「階段↓」等の移動体が移動する路面の状況の種類とする。路面の状況を細分化して、「2cmの段差↑」等のラベルを用いてもよい。本実施の形態では、幅1500msとする窓を100msずつずらして路面データから得られる入力データから、ラベル毎の尤度を求めるためのモデルの学習を行う想定である。正解クラスは窓の中心である750msの時点に対応する路面の状況とする。リアルタイムで学習、及び推定を行う場合には、窓幅を1500msよりも短くしてもよい。センサとしては、加速度センサ、ジャイロセンサ、地磁気センサ、重力センサ、気圧センサ、及び傾きセンサなど種々のセンサを、推定の対象に合わせて適宜、利用することができる。
 学習装置20は、第1学習部24と、第2学習部32とを備える。第1学習部24は、学習用第1モデル22を用いて学習済み第1モデル26を構築する。学習用第1モデル22は、ラベル毎に当該ラベルの尤度を求めるためのモデルである。第2学習部32は、学習用第2モデル30を用いて学習済み第2モデル34を構築する。学習用第1モデル22、学習用第2モデル30としては、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、LSTM(Long short-term memory)、SVM(Support Vector Machine)など種々の機械学習のモデルを用いることができる。
 第1学習部24は、学習データ集合を入力として、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、学習データ集合のうち所定のバッチサイズの学習データを用いて、機械学習によって、学習用第1モデル22のパラメータを学習し、学習済み第1モデル26を構築する。具体的には、第1学習部24の機械学習では、例えば、バッチサイズを64~512、学習回数を500、エポック数(学習回数を1とした学習単位を繰り返す回数)を50等と定めて学習を行えばよい。また、幅1500msとする窓を100msずつずらして学習データから得られる入力データと正解ラベルとから、正解ラベルの尤度が最も高くなるように、学習用第1モデル22のパラメータを学習する。また、第1学習部24は、学習過程で得られた、学習データの各々についてのラベル毎の各時間の尤度に、正解ラベルを付与して、時系列尤度データ28として記憶する。正解ラベルの付与は、例えば、「平坦」、「静止、「階段↑」、「階段↓」のラベルの尤度のそれぞれに対して、時間に対応する正解ラベルを付与することにより行う。例えば図1に示した時間1~71の各ラベルの尤度であれば、「階段↑」を正解ラベルとして付与する。
 第2学習部32は、時系列尤度データ28を入力として、バッチサイズを第1学習部24の所定のサイズより大きいサイズとして、機械学習によって、各時間のラベルの推定結果からいずれかのラベルを出力するための学習用第2モデル30のパラメータを学習し、学習済み第2モデル34を構築する。具体的には、バッチサイズは、第1学習部24で用いたバッチサイズ64~512よりも大きいサイズの1024、2048、又は4096等を用いる。なお、学習回数やエポック数は第1学習部24の機械学習と同様でもよいし、変更してもよい。
 次に、推定装置40について説明する。推定装置40には、路面上を移動する移動体に搭載されたセンサにより時系列に検出された路面データが入力される。路面データにより、時系列に各時間の移動体の状態が検出されているものとする。推定装置40は、複数種類のラベル毎にラベルの尤度を求めるための学習済み第1モデル26、及び各時間のラベルの推定結果からいずれかのラベルを出力するための学習済み第2モデル34、を用いてラベルの推定を行う。推定されるラベルは、上記学習装置20の学習データの正解ラベルとして用いた「平坦」、「静止」、「階段↑」、「階段↓」等である。
 第1推定部42は、時系列データである路面データを、学習済み第1モデル26に入力し、各時刻についてラベル毎のラベルの尤度を推定し、第2推定部44に出力する。具体的には、幅1500msとする窓を100msずつずらして路面データから得られる入力データの各々に対して、学習済み第1モデル26を用いて、ラベル毎の尤度を推定し、ラベル毎の各時間におけるラベルの尤度を求める。
 第2推定部44は、第1推定部42で推定されたラベル毎の各時間におけるラベルの尤度を、学習済み第2モデル34に入力し、ラベル毎の各時間における尤度に対応する、いずれかのラベルを推定する。
<本発明の実施の形態に係る作用>
 次に、本発明の実施の形態に係る推定システム1の作用について説明する。
 まず、図3のフローチャートを参照して学習装置20の作用を説明する。
 ステップS100で、学習装置20は、時系列データである学習データからなる学習データ集合の入力を受け付ける。学習データはセンサにより時系列に検出された路面データである。
 ステップS102で、第1学習部24は、学習データ集合を入力として、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、学習データ集合のうち所定のバッチサイズの学習データを用いて、機械学習によって、学習用第1モデル22のパラメータを学習し、学習済み第1モデル26を構築する。
 ステップS104で、第1学習部24は、学習過程で得られた、学習データの各々についてのラベル毎の各時間の尤度に、正解ラベルを付与して、時系列尤度データ28として記憶する。
 ステップS106で、第2学習部32は、時系列尤度データ28を入力として、バッチサイズを第1学習部24の所定のサイズより大きいサイズとして、機械学習によって、各時間のラベルの推定結果からいずれかのラベルを出力するための学習用第2モデル30のパラメータを学習し、学習済み第2モデル34を構築する。
 次に、図4のフローチャートを参照して推定装置40の作用を説明する。
 ステップS200で、推定装置40は、センサにより時系列に検出された路面データの入力を受け付ける。
 ステップS202で、第1推定部42は、時系列データである路面データを、学習済み第1モデル26に入力し、各時間についてラベル毎のラベルの尤度を推定し、第2推定部44に出力する。
 ステップS204で、第2推定部44は、第1推定部42で推定されたラベル毎の各時間におけるラベルの尤度を、学習済み第2モデル34に入力し、ラベル毎の各時間における尤度に対応する、いずれかのラベルを推定する。
 ステップS206で、推定装置40は、ステップS204で得られたラベルの推定結果を出力する。
 以上、説明したように、本発明の実施の形態の推定システム1では、学習装置20によって、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、ラベル毎にラベルの尤度を求めるための第1モデルを学習し、学習データの各々について、ラベル毎の各時間の尤度である時系列尤度データを出力する。また、正解ラベルを付与した、学習データの各々についての時系列尤度データを入力として、機械学習によって、ラベル毎の尤度の変化からいずれかのラベルを出力するための第2モデルを学習する。これにより、精度よくデータの状況を示すラベルを推定するためのモデルを学習できる。
 また、推定装置40によって、時系列データを、複数種類のラベル毎にラベルの尤度を求めるための学習済み第1モデルに入力し、ラベル毎の各時間におけるラベルの尤度を推定する。また、推定されたラベル毎の各時間におけるラベルの尤度を、各時間のラベルの推定結果からいずれかのラベルを出力するための学習済み第2モデルに入力し、バッチサイズを所定のサイズより大きいサイズとして、ラベル毎の各時間における尤度に対応する、いずれかのラベルを推定する。これにより、精度よくデータの状況を示すラベルを推定することができる。
 また、学習装置20及び推定装置40は、コンピュータを用いて実現することも可能である。そのようなコンピュータは、学習装置20及び推定装置40の各機能を実現する処理内容を記述したプログラムを、該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。
 なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
 例えば、入力として路面データを用いる場合を例に説明したが、これに限定されるものではなく、時系列の時間毎に検出されたデータであれば本発明の実施の形態を適用できる。
1 推定システム
20 学習装置
22 学習用第1モデル
24 第1学習部
26 学習済み第1モデル
28 時系列尤度データ
30 学習用第2モデル
32 第2学習部
34 学習済み第2モデル
40 推定装置
42 第1推定部
44 第2推定部

Claims (4)

  1.  時系列データである学習データであって、時間毎に複数種類のいずれかのラベルが正解ラベルとして付与された学習データからなる学習データ集合を入力として、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、前記学習データ集合のうち前記バッチサイズの学習データを用いて、予め定めた機械学習によって、ラベルを推定するための第1モデルを学習し、学習データの各々について、各時間の前記ラベルの推定結果を出力する第1学習部と、
     正解ラベルを付与した、前記学習データの各々についての各時間の前記ラベルの推定結果を入力として、前記バッチサイズを前記所定のサイズより大きいサイズとして、予め定めた機械学習によって、各時間の前記ラベルの推定結果からいずれかのラベルを出力するための第2モデルを学習する第2学習部と、
     を含む学習装置。
  2.  前記学習データは、対象の状態を検出するセンサによって時系列に検出された検出データとし、前記ラベルを対象が移動する路面の状況の種類とする請求項1に記載の学習装置。
  3.  第1学習部が、時系列データである学習データであって、時間毎に複数種類のいずれかのラベルが正解ラベルとして付与された学習データからなる学習データ集合を入力として、機械学習で用いる学習データの単位であるバッチサイズを所定のサイズとして、前記学習データ集合のうち前記バッチサイズの学習データを用いて、予め定めた機械学習によって、ラベルを推定するための第1モデルを学習し、学習データの各々について、各時間の前記ラベルの推定結果を出力するステップと、
     第2学習部が、正解ラベルを付与した、前記学習データの各々についての各時間の前記ラベルの推定結果を入力として、前記バッチサイズを前記所定のサイズより大きいサイズとして、予め定めた機械学習によって、各時間の前記ラベルの推定結果からいずれかのラベルを出力するための第2モデルを学習するステップと、
     を含む学習方法。
  4.  コンピュータを、請求項1又は請求項2に記載の学習装置の各部として機能させるためのプログラム。
PCT/JP2019/044332 2018-11-16 2019-11-12 学習装置、方法、及びプログラム WO2020100894A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/293,458 US20210406781A1 (en) 2018-11-16 2019-11-12 Training device, method and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018215917A JP7024692B2 (ja) 2018-11-16 2018-11-16 学習装置、方法、及びプログラム
JP2018-215917 2018-11-16

Publications (1)

Publication Number Publication Date
WO2020100894A1 true WO2020100894A1 (ja) 2020-05-22

Family

ID=70731093

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/044332 WO2020100894A1 (ja) 2018-11-16 2019-11-12 学習装置、方法、及びプログラム

Country Status (3)

Country Link
US (1) US20210406781A1 (ja)
JP (1) JP7024692B2 (ja)
WO (1) WO2020100894A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018010475A (ja) * 2016-07-13 2018-01-18 富士通株式会社 機械学習管理プログラム、機械学習管理装置および機械学習管理方法
US20180211164A1 (en) * 2017-01-23 2018-07-26 Fotonation Limited Method of training a neural network
JP2018124126A (ja) * 2017-01-31 2018-08-09 株式会社アイエスピー 移動体の状態を検知するための方法、プログラム、及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018010475A (ja) * 2016-07-13 2018-01-18 富士通株式会社 機械学習管理プログラム、機械学習管理装置および機械学習管理方法
US20180211164A1 (en) * 2017-01-23 2018-07-26 Fotonation Limited Method of training a neural network
JP2018124126A (ja) * 2017-01-31 2018-08-09 株式会社アイエスピー 移動体の状態を検知するための方法、プログラム、及び装置

Also Published As

Publication number Publication date
US20210406781A1 (en) 2021-12-30
JP7024692B2 (ja) 2022-02-24
JP2020086605A (ja) 2020-06-04

Similar Documents

Publication Publication Date Title
CN107247989B (zh) 一种实时的计算机视觉处理方法及装置
US11263531B2 (en) Unsupervised control using learned rewards
US20180300850A1 (en) Artifact reduction for image style transfer
US10073908B2 (en) Functional space-time trajectory clustering
US11610118B2 (en) Distributional reinforcement learning using quantile function neural networks
Du et al. Applying particle swarm optimization algorithm to roundness error evaluation based on minimum zone circle
JP2018041319A (ja) 移動状況学習装置、移動状況認識装置、方法、及びプログラム
CN115239638A (zh) 一种工业缺陷检测方法、装置、设备及可读存储介质
KR20210088656A (ko) 이미지 생성 및 신경망 트레이닝 방법, 장치, 기기 및 매체
WO2022004773A1 (ja) モデル生成装置、回帰装置、モデル生成方法、及びモデル生成プログラム
WO2020100894A1 (ja) 学習装置、方法、及びプログラム
Dadashi et al. Gaussian process framework for pervasive estimation of swimming velocity with body‐worn IMU
US20210397953A1 (en) Deep neural network operation method and apparatus
WO2020100893A1 (ja) 学習装置、推定装置、方法、及びプログラム
WO2017037859A1 (ja) 情報処理装置及び方法
US20100063946A1 (en) Method of performing parallel search optimization
JP2011065553A (ja) 学習制御システム及び学習制御方法
CN115565148B (zh) 道路图像的检测方法、装置、存储介质和电子装置
JP7068583B2 (ja) 学習装置、推定装置、学習方法、推定方法およびプログラム
JP7268731B2 (ja) 学習データ生成装置、学習装置、学習データ生成方法、及び学習データ生成プログラム
JP7276449B2 (ja) 一般化データ生成装置、推定装置、一般化データ生成方法、推定方法、一般化データ生成プログラム、及び推定プログラム
JP7157320B2 (ja) 学習データ生成装置、学習データ生成方法およびプログラム
WO2020230215A1 (ja) マルチタスク学習装置、推定装置、学習方法、及び学習プログラム
US20220101196A1 (en) Device for and computer implemented method of machine learning
JP7048896B2 (ja) 学習データ生成装置、学習データ生成方法およびプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19884105

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19884105

Country of ref document: EP

Kind code of ref document: A1