JP7295282B2 - 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 - Google Patents
適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 Download PDFInfo
- Publication number
- JP7295282B2 JP7295282B2 JP2021576475A JP2021576475A JP7295282B2 JP 7295282 B2 JP7295282 B2 JP 7295282B2 JP 2021576475 A JP2021576475 A JP 2021576475A JP 2021576475 A JP2021576475 A JP 2021576475A JP 7295282 B2 JP7295282 B2 JP 7295282B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- stage
- network
- machine learning
- hyperparameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000013016 learning Effects 0.000 title claims description 371
- 238000010801 machine learning Methods 0.000 title claims description 224
- 230000003044 adaptive effect Effects 0.000 title claims description 108
- 238000000034 method Methods 0.000 title claims description 53
- 238000012549 training Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000006872 improvement Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
- G05D1/0088—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
Description
Claims (14)
- 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車の走行を支援する1又は複数の作業に関連した複数の異なるタイプの学習を実行することが可能なマシンラーニングネットワークをオンデバイス学習及びアップデートさせる方法であって、前記複数の異なるタイプの学習は、ディープラーニング学習基盤のネットワーク、行動予測ネットワーク、又は、リスク探知ネットワークを含み、前記オンデバイス学習及びアップデートは、クラウドサーバに接続せずに実現され、前記自律走行自動車は、走行環境に関する学習を行うためのセンシングデータを獲得するように構成され、前記センシングデータは、前記マシンラーニングネットワークと通信を行うことにより少なくとも1つのセンサ又は複数のセンサの組み合わせにより獲得され、前記自律走行自動車の周辺を撮影したイメージを含み、前記少なくとも1つのセンサがカメラ、レーダ、又は、ライダであり、前記センシングデータの少なくとも一部は前記マシンラーニングネットワークのための学習データであり、前記学習とアップデートは、適応的ハイパーパラメータセットを利用してマルチステージ学習を行って、前記センシングデータに対応したアウトプットデータを生成することにより現在の走行環境において前記自律走行自動車が自律的に走行し続けるようにすることにより達成され、前記自律走行自動車は、前記マシンラーニングネットワークと通信を行うオンデバイス学習装置を含み、前記マシンラーニングネットワークは、物体検出器、分類ネットワーク、及び、セグメンテーションネットワークのうちの少なくとも1つを含む方法において、
(a)自律走行自動車の運行中に新しい学習用データを獲得する状態でオンデバイス学習条件を満たす場合、オンデバイス学習装置が、(i)ベースモデル学習のために予め決定されたハイパーパラメータの基本値を使用して生成された、又は、過去の学習のうち最高の性能を有するマシンラーニングネットワークのハイパーパラメータの最高性能値を使用して生成された基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第n(前記nは2以上の整数である)ステージ学習に区分し、前記新しい学習用データと以前学習に利用された以前学習用データとを利用して前記第1ステージ学習乃至前記第nステージ学習のための第1ステージ学習データ乃至第nステージ学習用データを生成し、(ii)前記基本ハイパーパラメータセットに含まれた、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_h(前記hは2以上の整数である)ハイパーパラメータセット候補を生成し、(iii)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して前記マシンラーニングネットワークをそれぞれ前記第1ステージ学習データを利用して学習させ、(iv)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワークを前記第1ステージ学習済みマシンラーニングネットワークとして選定し、(v)前記第1ステージ学習済みマシンラーニングネットワークの学習に適用された、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータセットを第1適応的ハイパーパラメータセットとして生成する段階;
(b)前記オンデバイス学習装置が、kを2からn-1まで増加させ、(i)第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成し、(ii)前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワークをそれぞれ前記第kステージ学習用データを利用して学習させ、(iii)前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワークを第kステージ学習済みマシンラーニングネットワークとして選定し、(iv)前記第kステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第k適応的ハイパーパラメータセットとして生成する段階;及び
(c)前記オンデバイス学習装置が、(i-1)前記第1適応的ハイパーパラメータセット乃至第n-1適応的ハイパーパラメータセットのそれぞれと、(i-2)前記第1ステージ学習により学習されたマシンラーニングネットワーク乃至第n-1ステージ学習により学習されたマシンラーニングネットワークのそれぞれの性能評価結果とを参照して構築した最適化関数を使用して第n適応的ハイパーパラメータセットを生成し、(ii)前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワークを前記第nステージ学習用データを利用して第nステージ学習させることによって、前記自律走行自動車を現在の走行環境又は新しい走行環境において自律的に走行し続けるために使用される前記現在学習を完了する段階;
を含むことを特徴とする方法。 - (d)前記オンデバイス学習装置は、(i)前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワークをアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセス、及び(ii)前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上した場合、前記マシンラーニングネットワークを現在学習済みマシンラーニングネットワークにアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセスを遂行する段階;
をさらに含むことを特徴とする、請求項1に記載の方法。 - 前記オンデバイス学習装置は、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれを前記第k適応的ハイパーパラメータセットと同一に設定することを特徴とする、請求項1に記載の方法。
- 前記(b)段階で、
前記オンデバイス学習装置は、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持する、請求項1に記載の方法。 - 前記オンデバイス学習装置は、前記第kステージ学習により学習されたマシンラーニングネットワークの性能が前記第k-1ステージ学習により学習されたマシンラーニングネットワークの性能よりも高い場合、前記第kステージ学習を前記第nステージ学習として設定することによって前記現在学習を完了することを特徴とする、請求項1に記載の方法。
- 前記(a)段階で、
前記自律走行自動車に取り付けられたセンサにより獲得されたセンシングデータが獲得されると、前記マシンラーニングネットワークが前記センシングデータを分析して前記自律走行自動車の走行情報に対するアウトプットデータを生成した状態で、
前記オンデバイス学習装置が、前記センシングデータと前記センシングデータのそれぞれに対応するアウトプットデータとを前記データセレクションネットワークに入力することで、前記データセレクションネットワークをもって、前記アウトプットデータを参照して前記マシンラーニングネットワークの学習に使用される特定のセンシングデータを選定させ、選定された特定のセンシングデータを前記新しい学習用データとして格納させることを特徴とする、請求項1に記載の方法。 - 前記(a)段階で、
前記オンデバイス学習装置は、前記マシンラーニングネットワークのベースモデルとして予め決定されたハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択するか、以前学習により生成されたベストハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択することを特徴とする、請求項1に記載の方法。 - 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車の走行を支援する1又は複数の作業に関連した複数の異なるタイプの学習を実行することが可能なマシンラーニングネットワークをオンデバイス学習及びアップデートさせる装置であって、前記複数の異なるタイプの学習は、ディープラーニング学習基盤のネットワーク、行動予測ネットワーク、又は、リスク探知ネットワークを含み、前記オンデバイス学習及びアップデートは、クラウドサーバに接続せずに実現され、前記自律走行自動車は、走行環境に関する学習を行うためのセンシングデータを獲得するように構成され、前記センシングデータは、前記マシンラーニングネットワークと通信を行うことにより少なくとも1つのセンサ又は複数のセンサの組み合わせにより獲得され、前記自律走行自動車の周辺を撮影したイメージを含み、前記少なくとも1つのセンサがカメラ、レーダ、又は、ライダであり、前記センシングデータの少なくとも一部は前記マシンラーニングネットワークのための学習データであり、前記学習とアップデートは、適応的ハイパーパラメータセットを利用してマルチステージ学習を行って、前記センシングデータに対応したアウトプットデータを生成することにより現在の走行環境において前記自律走行自動車が自律的に走行し続けるようにすることにより達成され、前記自律走行自動車は、前記マシンラーニングネットワークと通信を行うオンデバイス学習装置を含み、前記マシンラーニングネットワークは、物体検出器、分類ネットワーク、及び、セグメンテーションネットワークのうちの少なくとも1つを含む装置において、
インストラクションを格納する少なくとも一つのメモリ;及び
前記インストラクションを遂行するように設定された一つ以上のプロセッサを含み、
前記プロセッサが、(I)自律走行自動車の運行中に新しい学習用データを獲得する状態でオンデバイス学習条件を満たす場合、ベースモデル学習のために予め決定されたハイパーパラメータの基本値を使用して生成された、又は、過去の学習のうち最高の性能を有するマシンラーニングネットワークのハイパーパラメータの最高性能値を使用して生成された基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第n(前記nは2以上の整数である)ステージ学習に区分し、前記新しい学習用データと以前学習に利用された以前学習用データとを利用して前記第1ステージ学習乃至前記第nステージ学習のための第1ステージ学習データ乃至第nステージ学習用データを生成し、前記基本ハイパーパラメータセットに含まれた、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_h(前記hは2以上の整数である)ハイパーパラメータセット候補を生成して前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して前記マシンラーニングネットワークをそれぞれ前記第1ステージ学習データを利用して学習させ、前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワークを前記第1ステージ学習済みマシンラーニングネットワークとして選定し、前記第1ステージ学習済みマシンラーニングネットワークの学習に適用された、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータセットを第1適応的ハイパーパラメータセットとして生成するプロセス、(II)kを2からn-1まで増加させ、第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成し、前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワークをそれぞれ前記第kステージ学習用データを利用して学習させ、前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワークを第kステージ学習済みマシンラーニングネットワークとして選定し、前記第kステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第k適応的ハイパーパラメータセットとして生成するプロセス及び(III)前記第1適応的ハイパーパラメータセット乃至第n-1適応的ハイパーパラメータセットのそれぞれと、前記第1ステージ学習により学習されたマシンラーニングネットワーク乃至第n-1ステージ学習により学習されたマシンラーニングネットワークのそれぞれの性能評価結果とを参照して構築した最適化関数を使用して第n適応的ハイパーパラメータセットを生成し、前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワークを前記第nステージ学習用データを利用して第nステージ学習させることによって、前記自律走行自動車を現在の走行環境又は新しい走行環境において自律的に走行し続けるために使用される前記現在学習を完了するプロセスを遂行する学習装置。 - (IV)前記プロセッサは、前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワークをアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセス、及び前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上した場合、前記マシンラーニングネットワークを現在学習済みマシンラーニングネットワークにアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセスをさらに遂行する、請求項8に記載の装置。
- 前記プロセッサは、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれを前記第k適応的ハイパーパラメータセットと同一に設定することを特徴とする、請求項8に記載の装置。
- 前記(II)プロセスで、
前記プロセッサは、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持する、請求項8に記載の装置。 - 前記プロセッサは、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、前記第kステージ学習を前記第nステージ学習として設定することによって前記現在学習を完了することを特徴とする、請求項8に記載の装置。
- 前記(I)プロセスで、
前記自律走行自動車に取り付けられたセンサにより獲得されたセンシングデータが獲得されると、前記マシンラーニングネットワークがディープラーニング基盤に前記センシングデータを分析して前記自律走行自動車の走行情報に対するアウトプットデータを生成した状態で、
前記プロセッサは、前記センシングデータと前記センシングデータのそれぞれに対応するアウトプットデータとを前記データセレクションネットワークに入力することで、前記データセレクションネットワークをもって、前記アウトプットデータを参照して前記マシンラーニングネットワークの学習に使用される特定のセンシングデータを選定させ、選定された特定のセンシングデータを前記新しい学習用データとして格納させることを特徴とする、請求項8に記載の装置。 - 前記(I)プロセスで、
前記プロセッサは、前記マシンラーニングネットワークのベースモデルとして予め決定されたハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択するか、以前学習により生成されたベストハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択することを特徴とする、請求項8に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063020101P | 2020-05-05 | 2020-05-05 | |
US63/020,101 | 2020-05-05 | ||
US17/229,350 US11203361B2 (en) | 2020-05-05 | 2021-04-13 | Method for performing on-device learning of machine learning network on autonomous vehicle by using multi-stage learning with adaptive hyper-parameter sets and device using the same |
US17/229,350 | 2021-04-13 | ||
PCT/KR2021/005616 WO2021225360A1 (en) | 2020-05-05 | 2021-05-04 | Method for performing on-device learning of machine learning network on autonomous vehicle by using multi-stage learning with adaptive hyper-parameter sets and device using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022539696A JP2022539696A (ja) | 2022-09-13 |
JP7295282B2 true JP7295282B2 (ja) | 2023-06-20 |
Family
ID=75787010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021576475A Active JP7295282B2 (ja) | 2020-05-05 | 2021-05-04 | 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11203361B2 (ja) |
EP (1) | EP3910563A1 (ja) |
JP (1) | JP7295282B2 (ja) |
KR (1) | KR20210155824A (ja) |
CN (1) | CN114175068A (ja) |
WO (1) | WO2021225360A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6644231B1 (ja) * | 2019-04-26 | 2020-02-12 | Awl株式会社 | 画像分析装置、及び画像分析システム |
US11760376B2 (en) * | 2020-12-29 | 2023-09-19 | Ford Global Technologies, Llc | Machine learning updating with sensor data |
WO2023214708A1 (ko) * | 2022-05-06 | 2023-11-09 | 삼성전자 주식회사 | 영상 처리 장치 및 그 동작 방법 |
KR102532282B1 (ko) * | 2022-09-05 | 2023-05-11 | 세종대학교산학협력단 | 파라미터 통합 최적화 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018005739A (ja) | 2016-07-06 | 2018-01-11 | 株式会社デンソー | ニューラルネットワークの強化学習方法及び強化学習装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8612107B2 (en) * | 2008-06-10 | 2013-12-17 | The Regents Of The University Of Michigan | Method, control apparatus and powertrain system controller for real-time, self-learning control based on individual operating style |
US10140522B2 (en) * | 2015-12-16 | 2018-11-27 | Intel Corporation | Fully convolutional pyramid networks for pedestrian detection |
US10650045B2 (en) * | 2016-02-05 | 2020-05-12 | Sas Institute Inc. | Staged training of neural networks for improved time series prediction performance |
JP7050006B2 (ja) * | 2017-06-28 | 2022-04-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 移動体制御装置、移動体制御方法、及び学習方法 |
US10520940B2 (en) * | 2017-08-14 | 2019-12-31 | GM Global Technology Operations LLC | Autonomous operation using deep spatio-temporal learning |
US20190101914A1 (en) * | 2017-10-02 | 2019-04-04 | Allstate Insurance Company | Data Processing System with Machine Learning Engine for Providing Driving Data Analysis and Vehicle Control Functions |
TWI651664B (zh) * | 2017-11-15 | 2019-02-21 | 財團法人資訊工業策進會 | 模型生成伺服器及其模型生成方法 |
US10762396B2 (en) * | 2017-12-05 | 2020-09-01 | Utac, Llc | Multiple stage image based object detection and recognition |
KR20190068255A (ko) * | 2017-12-08 | 2019-06-18 | 삼성전자주식회사 | 고정 소수점 뉴럴 네트워크를 생성하는 방법 및 장치 |
KR20200015048A (ko) * | 2018-08-02 | 2020-02-12 | 삼성전자주식회사 | 메타-학습에 기반하여 기계학습의 모델을 선정하는 방법 및 장치 |
-
2021
- 2021-04-13 US US17/229,350 patent/US11203361B2/en active Active
- 2021-05-03 EP EP21171875.4A patent/EP3910563A1/en active Pending
- 2021-05-04 CN CN202180004461.4A patent/CN114175068A/zh active Pending
- 2021-05-04 WO PCT/KR2021/005616 patent/WO2021225360A1/en active Application Filing
- 2021-05-04 JP JP2021576475A patent/JP7295282B2/ja active Active
- 2021-05-04 KR KR1020217041062A patent/KR20210155824A/ko unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018005739A (ja) | 2016-07-06 | 2018-01-11 | 株式会社デンソー | ニューラルネットワークの強化学習方法及び強化学習装置 |
Non-Patent Citations (2)
Title |
---|
Ahmad El Sallab et al.,Meta learning Framework for Automated Driving,arXiv,米国,Cornell University,2017年06月11日,https://arxiv.org/pdf/1706.04038.pdf |
Martin Wistuba et al.,Learning hyperparameter optimization initializations,2015 IEEE International Conference on Data Science and Advanced Analytics,米国,IEEE,2015年10月19日,https://ieeexplore.ieee.org/document/7344817 |
Also Published As
Publication number | Publication date |
---|---|
US11203361B2 (en) | 2021-12-21 |
CN114175068A (zh) | 2022-03-11 |
JP2022539696A (ja) | 2022-09-13 |
EP3910563A1 (en) | 2021-11-17 |
WO2021225360A1 (en) | 2021-11-11 |
KR20210155824A (ko) | 2021-12-23 |
US20210347379A1 (en) | 2021-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7295282B2 (ja) | 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 | |
US11663441B2 (en) | Action selection neural network training using imitation learning in latent space | |
KR102532749B1 (ko) | 약한 지도 학습에 기초한 뉴럴 네트워크의 계층적 학습 방법 및 장치 | |
US11593611B2 (en) | Neural network cooperation | |
CN111373417B (zh) | 与基于度量学习的数据分类相关的设备及其方法 | |
US20220004935A1 (en) | Ensemble learning for deep feature defect detection | |
US20180129742A1 (en) | Natural language object tracking | |
US20210150345A1 (en) | Conditional Computation For Continual Learning | |
EP3616130A1 (en) | Using simulation and domain adaptation for robotic control | |
KR20200128938A (ko) | 모델 학습 방법 및 장치 | |
CN113795851A (zh) | 具有针对使用对抗训练的表示学习的推理的大规模生成神经网络模型 | |
US20230244924A1 (en) | System and method for robust pseudo-label generation for semi-supervised object detection | |
CN112633463A (zh) | 用于建模序列数据中长期依赖性的双重递归神经网络架构 | |
CN112465147A (zh) | 机器学习的随机数据增强 | |
EP3627403A1 (en) | Training of a one-shot learning classifier | |
US20220253698A1 (en) | Neural network-based memory system with variable recirculation of queries using memory content | |
US20240070449A1 (en) | Systems and methods for expert guided semi-supervision with contrastive loss for machine learning models | |
EP3764284A1 (en) | Adapting a base classifier to novel classes | |
US20200293864A1 (en) | Data-aware layer decomposition for neural network compression | |
CN115482513A (zh) | 使预训练的机器学习系统适配于目标数据的设备和方法 | |
US20210374549A1 (en) | Meta-learned, evolution strategy black box optimization classifiers | |
US20240062058A1 (en) | Systems and methods for expert guided semi-supervision with label propagation for machine learning models | |
US11908193B2 (en) | Obtaining custom artificial neural network architectures | |
US20240096067A1 (en) | Systems and methods for multi-teacher group-distillation for long-tail classification | |
Alkhashab | Data-Efficient Learning using Modular Meta-Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7295282 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |