JP7295282B2 - 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 - Google Patents

適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 Download PDF

Info

Publication number
JP7295282B2
JP7295282B2 JP2021576475A JP2021576475A JP7295282B2 JP 7295282 B2 JP7295282 B2 JP 7295282B2 JP 2021576475 A JP2021576475 A JP 2021576475A JP 2021576475 A JP2021576475 A JP 2021576475A JP 7295282 B2 JP7295282 B2 JP 7295282B2
Authority
JP
Japan
Prior art keywords
learning
stage
network
machine learning
hyperparameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021576475A
Other languages
English (en)
Other versions
JP2022539696A (ja
Inventor
泓模 諸
鎔重 金
東奎 劉
成顔 權
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stradvision Inc
Original Assignee
Stradvision Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stradvision Inc filed Critical Stradvision Inc
Publication of JP2022539696A publication Critical patent/JP2022539696A/ja
Application granted granted Critical
Publication of JP7295282B2 publication Critical patent/JP7295282B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/0088Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade

Description

本発明は2020年5月5日に出願された米国特許出願第63/020,101号及び2021年4月13日に出願された米国特許出願第17/229,350号に対する優先権を主張し、これらの出願は本願に参照として組み込まれる。
本発明は自律走行自動車のマシンラーニングネットワークをオンデバイス学習する方法及びそれを利用した装置に関し、より詳細には、自律走行自動車に取り付けられるマシンラーニングネットワークがエンベディッド(Embedded)されたシステム上で適応的ハイパーパラメータセットを利用したマルチステージ学習を通じてオンデバイス学習する方法及びそれを利用したオンデバイス学習装置に関する。
自律走行自動車に適用されているマシンラーニングネットワークを、予め学習していない新しい走行環境に適応させるためには、自律走行自動車が走行しながらセンサ、一例として、カメラ、ライダ、レーダなどを通じて獲得した情報を利用して前記マシンラーニングネットワークを再学習する過程が必要となる。
自律走行自動車から獲得されるデータを使用して学習に利用するための原本正解(ground truth)を生成するためのアノテーションを遂行する際、これを自律走行自動車自体で遂行することは困難であるため、マシンラーニングネットワークのベースモデルを生成するか、以前学習に使用された学習用データの一部及び自律走行自動車からリアルタイムに獲得されるデータのうち学習に使用するデータを統合した学習用データセットを構成して自律走行自動車のマシンラーニングネットワークを学習させる方法が提示されている。
特に、従来の方法では、OTA(over the air)技術を活用して自律走行自動車においてマシンラーニングネットワークの学習に必要なデータをクラウド(Cloud)に伝送し、サーバサイドからクラウドを通じて伝送されたデータを利用してマシンラーニングネットワークを学習させた後、学習を通じてアップデートされたモデルのみを再び自律走行車両に伝送するオンデバイス学習用技術が注目されている。
しかし、このようなOTA技術を活用する従来のオンデバイス学習方法はアップデートの周期が遅く、クラウドサーバとのOTA連結が不可能な状況では使用することができないという限界がある。
従って、クラウドサーバとOTA連結する過程なく、限定されたコンピューティングパワーを有する自律走行車両内にエンベディッドされたシステムを利用してマシンラーニングネットワークを学習させることができる技術が要求される実情である。
本発明は、前述した問題点を全て解決することをその目的とする。
また、本発明は自律走行自動車に取り付けられるエンベディッドシステム上において、オンデバイスからなるマルチステージ学習を通じて自律走行車両のコンピューティングパワーによってマシンラーニングネットワークの性能を向上させることを他の目的とする。
また、本発明はオンデバイス学習を通じてマシンラーニングネットワークの性能を向上させるために、固定的なハイパーパラメータの代わりにマルチステージ学習を通じて生成された適応的ハイパーパラメータセットを適用して学習することを他の目的とする。
また、本発明はクラウドサーバのOTA連結を通じてマシンラーニングネットワークのベストモデルを学習するために必要とする時間よりも短い周期内に現在のモデルよりも性能の向上したマシンラーニングネットワークをアップデートすることを他の目的とする。
前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための本発明の特徴的な構成は以下の通りである。
本発明の一態様によると、適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法において、(a)自律走行自動車の運行中に新しい学習用データを獲得する状態でオンデバイス学習条件を満たす場合、オンデバイス学習装置が、(i)基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第n(前記nは2以上の整数である)ステージ学習に区分し、前記新しい学習用データと以前学習に利用された以前学習用データとを利用して前記第1ステージ学習乃至前記第nステージ学習のための第1ステージ学習データ乃至第nステージ学習用データを生成し、(ii)前記基本ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_h(前記hは2以上の整数である)ハイパーパラメータセット候補を生成し、(iii)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して前記マシンラーニングネットワークをそれぞれ前記第1ステージ学習データを利用して学習させ、(iv)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワークを前記第1ステージ学習済みマシンラーニングネットワークとして選定し、(v)前記第1ステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第1適応的ハイパーパラメータセットとして生成する段階;(b)前記オンデバイス学習装置が、kを2からn-1まで増加させ、(i)第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成し、(ii)前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワークをそれぞれ前記第kステージ学習用データを利用して学習させ、(iii)前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワークを第kステージ学習済みマシンラーニングネットワークとして選定し、(iv)前記第kステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第k適応的ハイパーパラメータセットとして生成する段階;及び(c)前記オンデバイス学習装置が、(i-1)前記第1適応的ハイパーパラメータセット乃至第n-1適応的ハイパーパラメータセットのそれぞれと、(i-2)前記第1ステージ学習により学習されたマシンラーニングネットワーク乃至第n-1ステージ学習により学習されたマシンラーニングネットワークのそれぞれの性能評価結果とを参照して構築した最適化関数を使用して第n適応的ハイパーパラメータセットを生成し、(ii)前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワークを前記第nステージ学習用データを利用して第nステージ学習させることによって前記現在学習を完了する段階;を含むことを特徴とする方法が提供される。
一例として、(d)前記オンデバイス学習装置は、(i)前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワークをアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセス、及び(ii)前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上した場合、前記マシンラーニングネットワークを現在学習済みマシンラーニングネットワークにアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセスを遂行する段階をさらに含むことを特徴とする方法が提供される。
一例として、前記オンデバイス学習装置は、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれを前記第k適応的ハイパーパラメータセットと同一に設定することを特徴とする方法が提供される。
一例として、前記オンデバイス学習装置は、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持する方法が提供される。
一例として、前記オンデバイス学習装置は、前記第kステージ学習により学習されたマシンラーニングネットワークの性能が前記第k-1ステージ学習により学習されたマシンラーニングネットワークの性能よりも高い場合、前記第kステージ学習を前記第nステージ学習として設定することによって前記現在学習を完了することを特徴とする方法が提供される。
一例として、前記(a)段階で、前記自律走行自動車に取り付けられたセンサにより獲得されたセンシングデータが獲得されると、前記マシンラーニングネットワークが前記センシングデータを分析して前記自律走行自動車の走行情報に対するアウトプットデータを生成した状態で、前記オンデバイス学習装置が、前記センシングデータと前記センシングデータのそれぞれに対応するアウトプットデータとを前記データセレクションネットワークに入力することで、前記データセレクションネットワークをもって、前記アウトプットデータを参照して前記マシンラーニングネットワークの学習に使用される特定のセンシングデータを選定させ、選定された特定のセンシングデータを前記新しい学習用データとして格納させることを特徴とする方法が提供される。
一例として、前記ハイパーパラメータは、学習アルゴリズム設定、ミニバッチサイズ、マキシマムステージ、及び前記各ステージ別マキシマムエポックのうち少なくとも一つを含むことを特徴とする方法が提供される。
一例として、前記(a)段階で、前記オンデバイス学習装置は、前記マシンラーニングネットワークのベースモデルとして予め決定されたハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択するか、以前学習により生成されたベストハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択することを特徴とする方法が提供される。
本発明の一態様によると、適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる装置において、インストラクションを格納する少なくとも一つのメモリ遂行及び前記インストラクションを遂行するように設定された一つ以上のプロセッサを含み、前記プロセッサが、(I)自律走行自動車の運行中に新しい学習用データを獲得する状態でオンデバイス学習条件を満たす場合、基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第n(前記nは2以上の整数である)ステージ学習に区分し、前記新しい学習用データと以前学習に利用された以前学習用データとを利用して前記第1ステージ学習乃至前記第nステージ学習のための第1ステージ学習データ乃至第nステージ学習用データを生成し、前記基本ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_h(前記hは2以上の整数である)ハイパーパラメータセット候補を生成して前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して前記マシンラーニングネットワークをそれぞれ前記第1ステージ学習データを利用して学習させ、(iv)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワークを前記第1ステージ学習済みマシンラーニングネットワークとして選定し、(v)前記第1ステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第1適応的ハイパーパラメータセットとして生成するプロセス、(II)kを2からn-1まで増加させ、第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成し、前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワークをそれぞれ前記第kステージ学習用データを利用して学習させ、前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワークを第kステージ学習済みマシンラーニングネットワークとして選定し、前記第kステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第k適応的ハイパーパラメータセットとして生成するプロセス及び(III)前記第1適応的ハイパーパラメータセット乃至第n-1適応的ハイパーパラメータセットのそれぞれと、前記第1ステージ学習により学習されたマシンラーニングネットワーク乃至第n-1ステージ学習により学習されたマシンラーニングネットワークのそれぞれの性能評価結果とを参照して構築した最適化関数を使用して第n適応的ハイパーパラメータセットを生成し、前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワークを前記第nステージ学習用データを利用して第nステージ学習させることによって前記現在学習を完了するプロセスを遂行する学習装置が提供される。
一例として、(IV)前記プロセッサは、前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワークをアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセス、及び前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上した場合、前記マシンラーニングネットワークを現在学習済みマシンラーニングネットワークにアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセスをさらに遂行する装置を提供する。
一例として、前記プロセッサは、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれを前記第k適応的ハイパーパラメータセットと同一に設定することを特徴とする装置を提供する。
一例として、前記(II)プロセスで、前記プロセッサは、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持する装置を提供する。
一例として、前記プロセッサは、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、前記第kステージ学習を前記第nステージ学習として設定することによって前記現在学習を完了することを特徴とする装置を提供する。
一例として、前記(I)プロセスで、前記自律走行自動車に取り付けられたセンサにより獲得されたセンシングデータが獲得されると、前記マシンラーニングネットワークがディープラーニング基盤に前記センシングデータを分析して前記自律走行自動車の走行情報に対するアウトプットデータを生成した状態で、前記プロセッサは、前記センシングデータと前記センシングデータのそれぞれに対応するアウトプットデータとを前記データセレクションネットワークに入力することで、前記データセレクションネットワークをもって、前記アウトプットデータを参照して前記マシンラーニングネットワークの学習に使用される特定のセンシングデータを選定させ、選定された特定のセンシングデータを前記新しい学習用データとして格納させることを特徴とする装置を提供する。
一例として、前記ハイパーパラメータは、学習アルゴリズム設定、ミニバッチサイズ、マキシマムステージ、及び前記各ステージ別マキシマムエポックのうち少なくとも一つを含むことを特徴とする装置を提供する。
一例として、前記(I)段階で、前記プロセッサは、前記マシンラーニングネットワークのベースモデルとして予め決定されたハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択するか、以前学習により生成されたベストハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択することを特徴とする装置を提供する。
その他にも、本発明の方法を実行するためのコンピュータプログラムを格納するためのコンピュータ読取り可能な記録媒体がさらに提供される。
本発明は自律走行自動車に取り付けられるエンベディッドシステム上において、オンデバイスからなるマルチステージ学習を通じて自律走行車両のコンピューティングパワーによってマシンラーニングネットワークの性能を向上させることができるという他の効果を有する。
また、本発明はオンデバイス学習を通じてマシンラーニングネットワークの性能を向上させるために、固定的なハイパーパラメータの代わりにマルチステージ学習を通じて生成された適応的ハイパーパラメータセットを適用して学習することができるという他の効果を有する。
また、本発明はクラウドサーバのOTA連結を通じてマシンラーニングネットワークのベストモデルを学習するために必要とする時間よりも短い周期内に現在のモデルよりも性能の向上したマシンラーニングネットワークをアップデートすることができるという他の効果を有する。
本発明の実施例の説明に利用されるために添付された以下の図面は、本発明の実施例のうち単に一部であるに過ぎず、本発明の属する技術分野において通常の知識を有する者(以下「通常の技術者」)にとっては、発明的作業が行われずにこれらの図面に基づいて他の各図面が得られ得る。
図1は本発明の一実施例において、適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させるオンデバイス学習装置を簡略に示した図面である。 図2は本発明の一実施例において、適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法を簡略に示した図面である。 図3は本発明の一実施例において、ハイパーパラメータセットの構成を簡略に示した図面である。 図4は本発明の一実施例によってそれぞれのステージ学習を通じて適応的ハイパーパラメータセットを生成し、生成された適応的ハイパーパラメータセットを活用してマシンラーニングネットワークをマルチステージ学習させる方法を簡略に示した図面である。
後述する本発明に関する詳細な説明は、本発明の各目的、各技術的解法、及び各長所を明らかにするために本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、通常の技術者が本発明を実施することができるように十分詳細に説明される。
また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴各付加物、構成要素又は段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は実例として提供され、本発明を限定することを意図したものではない。
さらに、本発明は、本明細書に示された実施例のすべての可能な組合せを網羅する。本発明の多様な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、一実施例に関連して本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な側面にわたって同一であるか、又は類似の機能を指す。
以下、本発明の属する技術分野において通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の好ましい実施例について、添付された図面を参照して詳細に説明することにする。
図1は本発明の一実施例において、適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させるオンデバイス学習装置1000を簡略に示した図面である。
図1を参照すると、オンデバイス学習装置1000は適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させるための各インストラクションが格納されたメモリ1001とメモリ1001に格納された各インストラクションとによって適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させるための動作を遂行するプロセッサ1002とを含むことができる。
具体的には、オンデバイス学習装置1000は、典型的にコンピューティング装置(例えば、コンピュータプロセッサ、メモリ、ストレージ、入力装置及び出力装置、その他既存のコンピューティング装置の構成要素を含むことができる装置;ルータ、スイッチなどのような電子通信装置;ネットワーク接続ストレージ(NAS)及びストレージ領域ネットワーク(SAN)のような電子情報ストレージシステム)及びコンピュータソフトウェア(即ち、コンピューティング装置をもって特定の方式で機能させる各インストラクション)の組合せを利用して所望のシステム性能を達成するものであり得る。
また、コンピューティング装置のプロセッサはMPU(Micro Processing Unit)またはCPU(Central Processing Unit)、キャッシュメモリ(Cache Memory)、データバス(Data Bus)などのハードウェア構成を含むことができる。また、コンピューティング装置はオペレーティングシステム、特定の目的を遂行するアプリケーションのソフトウェア構成をさらに含むことができる。
しかし、コンピューティング装置が本発明を実施するためのミディアム、プロセッサ及びメモリが統合された形態である統合プロセッサを含む場合を排除するわけではない。
このように構成された本発明の一実施例において、オンデバイス学習装置1000を参照して適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法を図2乃至図4を参照して説明すると次の通りである。
図2を参照すると、自律走行自動車の運行中に、前記自律走行自動車に取り付けられた各種のセンサを通じてセンシングされるセンシングデータが獲得されると、自律走行自動車のマシンラーニングネットワークはディープラーニング基盤にセンシングデータを分析して自律走行自動車の走行に関する情報を含むアウトプットデータ獲得し、獲得されたアウトプットデータを参照して自律走行自動車が走行することができるようにすることができる。
この際、前記センサは、カメラ、レーダ(radar)、ライダ(lidar)などを含むことができ、様々なセンサを融合した形態であり得る。また、前記センシングデータはセンサの特定の視野角範囲に該当する領域の環境情報を含むか、センサの周辺全体の環境情報を含むことができる。そして、センシングデータは自動車の周辺を撮影したビデオまたはイメージ、自動車の各種のセンサからセンシングされる走行情報であるが、本発明がこれに限定されるわけではなく、自律走行自動車の走行中にセンシングされる全ての種類のデータを含むことができる。
また、前記マシンラーニングネットワーク500はディープラーニング学習基盤のネットワークなどを含むことができ、撮影された走行イメージを分析して自律走行自動車の走行環境に伴う物体情報、車線情報などの走行環境情報を出力する物体検出器(object detector)、分類ネットワーク(classification network)及びセグメンテーションネットワーク(segmentation network)などを含むことができ、その他にも走行環境に対する分析を基盤に自律走行自動車の走行を支援する様々な作業、一例として行動予測(behavior prediction)及びリスク探知(risk detection)などを遂行する様々なネットワークを含むことができる。
このような自律走行自動車の運行中に、オンデバイス学習装置1000は、前記センシングデータと前記センシングデータのそれぞれに対応するマシンラーニングネットワーク500のアウトプットデータとを参照して自律走行自動車が繰り返して走行する環境または新たに走行する環境に適応するように前記マシンラーニングネットワーク500の性能を改善するための学習に有用な特定のセンシングデータを選定し、選定された特定のセンシングデータを新しい学習用データベース410に格納することができる。
一例として、前記マシンラーニングネットワーク500が走行環境に関する物体を探索し、前記物体のクラスを分類するためのCNN(convolutional neural network)基盤の物体検出器の場合、前記センシングデータから検出されたそれぞれの物体に対する検出確率分布情報を参照して前記マシンラーニングネットワーク500の学習に使用する特定のセンシングデータを選定することができる。
具体的に、前記センシングデータから検出された前記物体のそれぞれの検出確率が予め設定された確率よりも低い場合、該当センシングデータを前記マシンラーニングネットワーク500が分類し難いデータであるハードサンプルに分類した後、これを新しい学習用データとして選定して新しい学習用データベース410に格納することができる。しかし、前記マシンラーニングネットワーク500の性能を向上させるためのセンシングデータを選択する方法はこれに限定されるわけではなく、学習に有用な特定のセンシングデータを選定する様々な方法が適用され得る。この際、予め設定された確率は前記マシンラーニングネットワーク500により検出された物体の分類結果を比較するために予め決定された確率であり得る。
一方、前記ではオンデバイス学習装置1000がマシンラーニングネットワーク500の学習に有用な特徴センシングデータを選定したが、これとは異なり、オンデバイス学習装置1000は前記センシングデータと前記センシングデータのそれぞれに対応する前記マシンラーニングネットワーク500の前記アウトプットデータとをディープラーニング基盤のデータセレクションネットワーク300に入力することで、前記データセレクションネットワーク300をもって、前記アウトプットデータを参照して前記マシンラーニングネットワーク500の学習に有用な特定のセンシング情報を選定させることができる。
次に、前記のような方法により自律走行自動車の運行中に獲得されるセンシングデータのうちマシンラーニングネットワークの学習に有用な特定のセンシング情報である新しい学習用データを収集する状態で、少なくとも一つ以上のオンデバイス学習コンディション、一例として、予め設定された時間条件、予め設定された学習データの個数条件、予め設定された自律走行自動車の運行状態条件などを満たす場合、オンデバイス学習装置1000は前記マシンラーニングネットワーク500の基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第nステージ学習に区分することができる。この際、前記nは2以上の整数である。
一例として、オンデバイス学習装置1000はハイパーパラメータセレクションネットワーク200をもって前記マシンラーニングネットワーク500の前記基本ハイパーパラメータセットを参照して前記現在学習を前記第1ステージ学習乃至前記第nステージ学習に区分させることができる。
一方、図3を参照すると、ハイパーパラメータセット30には1個以上のハイパーパラメータが含まれ得る。一例として、ハイパーパラメータセット30は学習アルゴリズムのパラメータ(L)、ミニバッチのサイズ(B)、最大ステージの数(D)、及びステージ別マキシマムエポック(epoch)(E)を含むことができるが、本発明がこれに限定されるわけではなく、学習性能を向上させるための様々なハイパーパラメータの組合せが含まれ得る。また、前記学習アルゴリズムのパラメータ(L)はSGD、Adam、AdaGrad、RMSPropなどのような学習アルゴリズムのオプティマイザ(optimizer)種類を選択するカテゴリーと、学習レート、重み減衰(weight decay)、 モメンタム(momentum)、ダムピング(damping)などの付加パラメータを含むカテゴリーを含むことができる。
この際、オンデバイス学習装置1000またはオンデバイス学習装置1000の前記ハイパーパラメータセレクションネットワーク200は、前記マシンラーニングネットワーク500のベースモデル学習のために予め決定されたハイパーパラメータの基本値を使用して次の数式のように基本ハイパーパラメータセットを生成することができる。この際、前記ベースモデルは工場初期化時点の前記マシンラーニングネットワーク500であり得、前記基本値は前記基本ハイパーパラメータセットに含まれたそれぞれのハイパーパラメータの値である。
init={Lpre,Bpre,Dpre,Epre
また、オンデバイス学習装置1000またはオンデバイス学習装置1000のハイパーパラメータセレクションネットワーク200は、前記マシンラーニングネットワーク500の過去の学習のうち最高の性能を有する前記マシンラーニングネットワーク500のハイパーパラメータの最高性能値を使用して次の数式のように基本ハイパーパラメータセットを生成することができる。この際、前記最高性能値は前記最高の性能を有するマシンラーニングネットワークに適用されたそれぞれのハイパーパラメータの値である。
init={Lopt,Bopt,Dopt,Eopt
この際、Lにおける前記付加パラメータの基本値は一般的に0に近い小さい数であり得、Lのオプティマイザ、B、D、Eは学習に利用されるデータセットの大きさとオンデバイス学習装置1000のコンピュータ能力とを考慮して選択され得る。
また、図2を参照すると、前記オンデバイス学習装置1000は前記新しい学習用データベース410及び以前学習用データベース420に格納された前記新しい学習用データ及び以前学習用データをサンプリングして前記現在学習のための学習用データセットを生成し、これを第1ステージ学習用データ乃至第nステージ学習用データとして指定させるか、前記基本ハイパーパラメータセットによってそれぞれのステージ学習に使用する複数の学習用データセットを生成し、これを前記第1ステージ学習用データ乃至前記第nステージ学習用データとして指定させることができる。また、オンデバイス学習装置1000はネットワークトレーナ100をもって前記のような方法で前記第1ステージ学習用データ乃至前記第nステージ学習用データとして指定させることができる。
この際、前記学習用データセットをサンプリングすることは前記現在学習の進行過程のうちある時点に行われることであり得、または場合によってそれぞれのステージ学習毎に数回にわたってサンプリングが進行され得るが、本発明が学習用データセットをサンプリングする時点及び方法はこれに限定されるわけではない。
また、前記以前学習用データは前記マシンラーニングネットワーク500のベースモデルの学習または以前学習に使用されたデータとして原本正解がラベリングされたラベルドデータ(labeled data)であり得、前記新しい学習用データは原本正解がラベリングされていないアンラベルドデータ(unlabeled data)であり得る。この際、別途に構成されたオートラベリングネットワークを通じてクラスラベリングを遂行するか、マニュアルラベリングなど様々な方法を通じて前記新しい学習用データのアノテーションを進行することができる。また、以前学習用ラベルドデータと新しい学習用アンラベルドデータとを利用した準指導学習(semi-supervised learning)を遂行することができる。
次に、オンデバイス学習装置1000は、基本ハイパーパラメータセットを参照して前記基本ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_hハイパーパラメータセット候補を生成することができる。この際、前記hは2以上の整数である。また、オンデバイスラーニングデバイス1000はハイパーパラメータセレクションネットワーク200をもって前記基本ハイパーパラメータセットを参照して前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補を生成させることができる。
一例として、前記オンデバイス学習装置1000または前記オンデバイス学習装置1000の前記ハイパーパラメータセレクションネットワーク200は、前記マシンラーニングネットワーク500のベースモデルとして予め決定されたハイパーパラメータの基本値を使用して次の数式のように基本ハイパーパラメータセットを生成することができる。
init={Lpre,Bpre,Dpre,Epre}={0.1pre,5pre,5pre,10pre
この際、前記オンデバイス学習装置1000または前記オンデバイス学習装置1000の前記ハイパーパラメータセレクションネットワーク200は、前記それぞれのハイパーパラメータの基本値のそれぞれを基準に予め設定された範囲内の第1候補値を決定することができる。即ち、それぞれのハイパーパラメータの第1候補値はL1={0.12,0.11,0.09,0.08}、B1={7,6,4,3}、D1={8,7,6,4,3,2}、E={6,8,12,14}のようで構成され得、それぞれのハイパーパラメータ毎に異なる範囲が予め設定され得る。そして前記オンデバイス学習装置1000または前記オンデバイス学習装置1000の前記ハイパーパラメータセレクションネットワーク200は前記それぞれのハイパーパラメータの第1候補値のうち一つの値をそれぞれ組合せて前記ハイパーパラメータセット候補を生成することができる。一例として、前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補は、H1_1can={0.12,7,8,6}乃至H1_hcan={0.08,3,2,14}のような組合せで生成され得る。
これとは異なり、前記オンデバイス学習装置1000または前記オンデバイス学習装置1000の前記ハイパーパラメータセレクションネットワーク200は前記第1候補値を利用して組合せることができる全てのハイパーパラメータセット候補のうちランダムにh個を選定して前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補を生成することができる。
次に、オンデバイス学習装置1000は、前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれによってそれぞれ前記第1ステージ学習データを利用して前記マシンラーニングネットワークを学習させることができる。
一例として、前記オンデバイス学習装置1000は、前記ハイパーパラメータセレクションネットワーク200をもって、前記基本ハイパーパラメータセット、前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補をネットワークトレーナ100に伝達させる。そして、前記オンデバイス学習装置1000は前記ネットワークトレーナ100をもって、前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれによって前記第1学習用データを利用して前記マシンラーニングネットワーク500をそれぞれ学習させることができる。
また、前記オンデバイス学習装置1000は前記ハイパーパラメータセレクションネットワーク200をもって、前記基本ハイパーパラメータセット、前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを順次にネットワークトレーナ100に伝達させ、前記ネットワークトレーナ100をもって順次に伝達される前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれによって前記第1学習用データを利用して前記マシンラーニングネットワーク500をそれぞれ学習させることができる。
即ち、前記オンデバイス学習装置1000は、前記ハイパーパラメータセレクションネットワーク200をもって前記基本ハイパーパラメータセットを前記ネットワークトレーナ100に伝送させ、前記ネットワークトレーナ100をもって前記基本ハイパーパラメータセットによって前記第1学習用データを利用して前記マシンラーニングネットワーク500を学習させることができる。そして、前記オンデバイス学習装置1000は、前記ハイパーパラメータセレクションネットワーク200をもって前記第1_1ハイパーパラメータセットを前記ネットワークトレーナ100に伝送させ、前記ネットワークトレーナ100をもって前記第1_1ハイパーパラメータセットによって前記第1ステージ学習用データを利用して前記マシンラーニングネットワーク500を学習させることができる。以後、前記オンデバイス学習装置1000は同一の方法で、前記ハイパーパラメータセレクションネットワーク200をもって第1_2ハイパーパラメータセット乃至前記第1_hハイパーパラメータセットのそれぞれを順次に前記ネットワークトレーナ100に伝送させ、前記ネットワークトレーナ100をもって順次に伝送される第1_2ハイパーパラメータセット乃至前記第1_hハイパーパラメータセットのそれぞれによって前記第1学習用データを利用して前記マシンラーニングネットワーク500をそれぞれ学習させることができる。
次に、オンデバイス学習装置1000は、前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワーク500のそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワーク500を前記第1ステージ学習済みマシンラーニングネットワーク500として選定し、前記第1ステージ学習済みマシンラーニングネットワーク500の学習に適用されたハイパーパラメータセット30を第1適応的ハイパーパラメータセットとして生成することができる。
一例として、オンデバイス学習装置1000は前記ネットワークトレーナ100をもって検証データを利用して前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワーク500のそれぞれを交差検証して獲得した性能評価結果を前記ハイパーパラメータセレクションネットワーク200に伝送させることができる。そして、オンデバイス学習装置1000は前記ハイパーパラメータセレクションネットワーク200をもって交差検証された性能評価結果を参照して、最も高い性能を有する前記マシンラーニングネットワーク500を前記第1ステージ学習済みマシンラーニングネットワーク500として選定させ、前記第1ステージ学習を通じて学習されたマシンラーニングネットワーク500の学習に使用されたハイパーパラメータセット30を第1適応的ハイパーパラメータセットとして生成させることができる。
これで、オンデバイス学習装置1000は前記第1ステージ学習を完了することで前記第1適応的ハイパーパラメータセットを生成し、前記第1適応的ハイパーパラメータセットを使用して次のステージ学習を進行することができる。
次に、前記第1ステージ学習が完了した状態で、前記オンデバイス学習装置1000は、kを2からn-1まで増加させ、第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成することができる。この際、前記適応的値は前記適応的ハイパーパラメータセットに含まれたそれぞれのハイパーパラメータの値である。
次に、オンデバイス学習装置1000は、前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワーク500をそれぞれ前記第kステージ学習用データを利用して学習させることができる。
次に、オンデバイス学習装置1000は、前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワーク500のそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワーク500を第kステージ学習済みマシンラーニングネットワーク500として選定し、前記第kステージ学習済みマシンラーニングネットワーク500の学習に適用されたハイパーパラメータセット30を第k適応的ハイパーパラメータセットとして選定することができる。
この際、前記オンデバイス学習装置1000は、前記オンデバイス学習装置1000または他の装置を通じて前述した方法を繰り返して前記第1ステージ学習乃至前記第n-1ステージ学習を順次に進行することで、前記第1適応的ハイパーパラメータセット乃至前記第n-1適応的ハイパーパラメータセットを生成することができ、これを遂行する具体的な方法は前述した通りであるため、重複する説明は省略する。
次に、前記第nステージ学習を遂行する具体的な方法は図4を参照して説明することができる。図4を参照すると、前記第nステージ学習S41-Nを除いた残りのステージ学習S41-1、S41-K、S41-N-1が全て完了した状態で、前記オンデバイス学習装置1000は、前記第1適応的ハイパーパラメータセット乃至前記第n-1適応的ハイパーパラメータセットのそれぞれと、前記第1ステージ学習S41-1により学習されたマシンラーニングネットワーク500乃至前記第n-1ステージ学習S41-N-1により学習されたマシンラーニングネットワーク500のそれぞれの性能評価結果とを参照して構築した最適化関数を使用して前記第n適応的ハイパーパラメータセットを生成することができる。
一例として、前記オンデバイス学習装置1000は、前記ハイパーパラメータセレクションネットワーク200をもって前記第1ステージ学習S41-1乃至前記第n-1ステージ学習S41-N-1の学習を参照して前記以前学習により学習されたマシンラーニングネットワーク500の性能を上回る性能結果をアウトプットするために必要と予測される第n適応的ハイパーパラメータセットを生成させることができる。
具体的に、前記オンデバイス学習装置1000は前記ハイパーパラメータセレクションネットワーク200をもって、前記第1適応的ハイパーパラメータセット乃至前記第n-1適応的ハイパーパラメータセットとそれぞれの前記第1適応的ハイパーパラメータセット乃至前記第n-1適応的ハイパーパラメータセットとを使用して学習したそれぞれのマシンラーニングネットワーク500の性能評価結果のそれぞれを参照して最適化関数を構築することで、前記第n-1ステージ学習S41-N-1を通じて学習された前記マシンラーニングネットワーク500の性能を向上させることができる前記第n適応的ハイパーパラメータセットを予測させることができる。
この際、前記最適化関数は、前記以前学習を通じて学習されたマシンラーニングネットワーク500または現在学習の前記第1ステージ学習乃至前記第n-1ステージ学習を通じて学習されたマシンラーニングネットワーク500の性能を上回る結果を出すことができる前記適応的ハイパーパラメータセットを生成するために、確率的推定をする一つ以上の代理モデル(Surrogate model)及び獲得関数(Acquisition Function)を活用することができ、前記最適化関数の演算を通じて生成されたそれぞれのハイパーパラメータの最適の値を使用して前記第n適応的ハイパーパラメータセットを生成することができる。この際、前記最適の値は前記最適化関数の演算を通じて生成されたそれぞれのハイパーパラメータの値である。
次に、オンデバイス学習装置1000は、前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワーク500を前記第nステージ学習用データを利用して第nステージ学習させることによって前記現在学習を完了することができる。
一例として、前記オンデバイス学習装置1000は、前記ネットワークトレーナ100をもって、前記第n適応的ハイパーパラメータセットによって前記第n-1ステージ学習を通じて学習されたマシンラーニングネットワーク500を前記第nステージ学習用データを利用して学習させることによって前記マルチステージ学習40に含まれた全てのステージ学習を終え、前記現在学習を完了させることができる。
次に、前記オンデバイス学習装置1000は、前記現在学習が完了した状態で前記マシンラーニングネットワーク500の性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワーク500をアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワーク500を利用して前記自律走行自動車が運行されるようにすることができる。この際、前記閾値はマシンラーニングネットワーク500の性能レベルを比較するために予め決定された値であり得る。
一例として、前記オンデバイス学習装置1000は前記ネットワークトレーナ100をもって、前記現在学習が完了した前記マシンラーニングネットワーク500の性能が前記以前学習が完了した前記マシンラーニングネットワーク500の性能よりも向上していないと判断した場合、現在学習が完了した前記マシンラーニングネットワーク500を自律走行自動車の前記マシンラーニングネットワーク500にアップデートしないことによって、次回の前記オンデバイス学習条件を満たすまで前記以前学習を通じて学習されたマシンラーニングネットワーク500を利用して前記自律走行自動車が運行されるようにすることができる。
また、前記オンデバイス学習装置1000は、前記現在学習が完了した状態で前記マシンラーニングネットワーク500の性能が一定の閾値以上向上した場合、前記マシンラーニングネットワーク500を現在学習済みマシンラーニングネットワーク500にアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワーク500を利用して前記自律走行自動車が運行されるようにすることができる。
一例として、前記オンデバイス学習装置1000は前記ネットワークトレーナ100をもって、前記現在学習が完了した前記マシンラーニングネットワーク500の性能が前記以前学習が完了した前記マシンラーニングネットワーク500の性能よりも向上した場合、前記現在学習が完了したマシンラーニングネットワーク500を自律走行自動車の前記マシンラーニングネットワーク500にアップデートすることで、前記次回のオンデバイス学習条件を満たすまで前記自律走行自動車が前記現在学習を通じてアップデートされたマシンラーニングネットワーク500を使用して運行されるようにすることができる。この際、自律走行自動車の前記マシンラーニングネットワーク500をアップデートする方法は、前記現在学習が完了したマシンラーニングネットワーク500自体を伝送して自律走行自動車のマシンラーニングネットワーク500に替わるように交替する方式を通じてアップデートするか、前記現在学習が完了した前記マシンラーニングネットワーク500からアップデートされたラーニングパラメータを伝送して前記自律走行自動車のマシンラーニングネットワーク500に適用されたラーニングパラメータをアップデートすることによって自律走行自動車のマシンラーニングネットワーク500がアップデートされるようにすることができるが、本発明はこれに限定されるわけではない。
また、前記オンデバイス学習装置1000または前記オンデバイス学習装置1000のハイパーパラメータセレクションネットワーク200は、各ステージ学習を通じてそれぞれの前記適応的ハイパーパラメータセットを生成する過程で、前記第kステージ学習を通じて学習されたマシンラーニングネットワーク500の性能が前記第k-1ステージ学習を通じて学習されたマシンラーニングネットワーク500の性能よりも高い場合、前記第k適応的ハイパーパラメータセットを前記第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれとして生成することができる。
また、前記オンデバイス学習装置または前記オンデバイス学習装置1000のハイパーパラメータセレクションネットワーク200は、前記第kステージ学習を通じて学習されたマシンラーニングネットワーク500の性能が前記第k-1ステージ学習を通じて学習されたマシンラーニングネットワーク500の性能よりも高いと判断する場合、前記第kステージ学習を前記第nステージ学習S41-Nとして設定することによって前記現在学習を完了することができる。以後、前記オンデバイス学習装置または前記オンデバイス学習装置1000のハイパーパラメータセレクションネットワーク200は前記マシンラーニングネットワーク500を前記第nステージ学習を通じて学習されたマシンラーニングネットワーク500にアップデートすることで、前記次回のオンデバイス学習条件を満たすまで前記自律走行自動車が前記現在学習を通じてアップデートされたマシンラーニングネットワーク500を使用して運行されるようにすることができる。
即ち、このようにすることによって、既存のマシンラーニングネットワーク500の性能を上回るマシンラーニングネットワーク500が確保されると、残りのステージ学習を遂行することなく現在学習を完了することができ、残りのステージ学習を通じて適応的ハイパーパラメータセットを生成することに追加的に消耗されるコンピューティングリソースを減少し、前記性能の向上したマシンラーニングネットワーク500を自律走行車両の運行に早くアップデートすることができる。
また、前記オンデバイス学習装置1000は、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持することができる。これは次の通り表れ得る。
st+1=Hst
一例として、前記オンデバイス学習装置1000は前記ハイパーパラメータセレクションネットワーク200をもって、それぞれのステージ学習を通じてそれぞれの適応的ハイパーパラメータセットを生成するために、前記適応的ハイパーパラメータセットに含まれたそれぞれのハイパーパラメータのうち一部または全部を同一に維持することができる。例えば、前記オンデバイス学習装置1000は前記ハイパーパラメータセレクションネットワーク200をもって、前記適応的ハイパーパラメータセットに含まれたハイパーパラメータのうち一つの前記ミニバッチのサイズの適応的値が前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのうち一部または全部に同一に維持されるように選択することができる。
また、以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独で又は組合せて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、CD-ROM、DVDのような光記録媒体、フロプティカル・ディスク(Floptical Disk)のような磁気-光メディア(Magneto-Optical Media)、及びROM、RAM、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別途に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。
以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、かかる記載から多様な修正及び変形が行われ得る。
従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

Claims (14)

  1. 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車の走行を支援する1又は複数の作業に関連した複数の異なるタイプの学習を実行することが可能なマシンラーニングネットワークをオンデバイス学習及びアップデートさせる方法であって前記複数の異なるタイプの学習は、ディープラーニング学習基盤のネットワーク、行動予測ネットワーク、又は、リスク探知ネットワークを含み、前記オンデバイス学習及びアップデートは、クラウドサーバに接続せずに実現され、前記自律走行自動車は、走行環境に関する学習を行うためのセンシングデータを獲得するように構成され、前記センシングデータは、前記マシンラーニングネットワークと通信を行うことにより少なくとも1つのセンサ又は複数のセンサの組み合わせにより獲得され、前記自律走行自動車の周辺を撮影したイメージを含み、前記少なくとも1つのセンサがカメラ、レーダ、又は、ライダであり、前記センシングデータの少なくとも一部は前記マシンラーニングネットワークのための学習データであり、前記学習とアップデートは、適応的ハイパーパラメータセットを利用してマルチステージ学習を行って、前記センシングデータに対応したアウトプットデータを生成することにより現在の走行環境において前記自律走行自動車が自律的に走行し続けるようにすることにより達成され、前記自律走行自動車は、前記マシンラーニングネットワークと通信を行うオンデバイス学習装置を含み、前記マシンラーニングネットワークは、物体検出器、分類ネットワーク、及び、セグメンテーションネットワークのうちの少なくとも1つを含む方法において、
    (a)自律走行自動車の運行中に新しい学習用データを獲得する状態でオンデバイス学習条件を満たす場合、オンデバイス学習装置が、(i)ベースモデル学習のために予め決定されたハイパーパラメータの基本値を使用して生成された、又は、過去の学習のうち最高の性能を有するマシンラーニングネットワークのハイパーパラメータの最高性能値を使用して生成された基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第n(前記nは2以上の整数である)ステージ学習に区分し、前記新しい学習用データと以前学習に利用された以前学習用データとを利用して前記第1ステージ学習乃至前記第nステージ学習のための第1ステージ学習データ乃至第nステージ学習用データを生成し、(ii)前記基本ハイパーパラメータセットに含まれた、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_h(前記hは2以上の整数である)ハイパーパラメータセット候補を生成し、(iii)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して前記マシンラーニングネットワークをそれぞれ前記第1ステージ学習データを利用して学習させ、(iv)前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワークを前記第1ステージ学習済みマシンラーニングネットワークとして選定し、(v)前記第1ステージ学習済みマシンラーニングネットワークの学習に適用された、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータセットを第1適応的ハイパーパラメータセットとして生成する段階;
    (b)前記オンデバイス学習装置が、kを2からn-1まで増加させ、(i)第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成し、(ii)前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワークをそれぞれ前記第kステージ学習用データを利用して学習させ、(iii)前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワークを第kステージ学習済みマシンラーニングネットワークとして選定し、(iv)前記第kステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第k適応的ハイパーパラメータセットとして生成する段階;及び
    (c)前記オンデバイス学習装置が、(i-1)前記第1適応的ハイパーパラメータセット乃至第n-1適応的ハイパーパラメータセットのそれぞれと、(i-2)前記第1ステージ学習により学習されたマシンラーニングネットワーク乃至第n-1ステージ学習により学習されたマシンラーニングネットワークのそれぞれの性能評価結果とを参照して構築した最適化関数を使用して第n適応的ハイパーパラメータセットを生成し、(ii)前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワークを前記第nステージ学習用データを利用して第nステージ学習させることによって、前記自律走行自動車を現在の走行環境又は新しい走行環境において自律的に走行し続けるために使用される前記現在学習を完了する段階;
    を含むことを特徴とする方法。
  2. (d)前記オンデバイス学習装置は、(i)前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワークをアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセス、及び(ii)前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上した場合、前記マシンラーニングネットワークを現在学習済みマシンラーニングネットワークにアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセスを遂行する段階;
    をさらに含むことを特徴とする、請求項1に記載の方法。
  3. 前記オンデバイス学習装置は、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれを前記第k適応的ハイパーパラメータセットと同一に設定することを特徴とする、請求項1に記載の方法。
  4. 前記(b)段階で、
    前記オンデバイス学習装置は、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持する、請求項1に記載の方法。
  5. 前記オンデバイス学習装置は、前記第kステージ学習により学習されたマシンラーニングネットワークの性能が前記第k-1ステージ学習により学習されたマシンラーニングネットワークの性能よりも高い場合、前記第kステージ学習を前記第nステージ学習として設定することによって前記現在学習を完了することを特徴とする、請求項1に記載の方法。
  6. 前記(a)段階で、
    前記自律走行自動車に取り付けられたセンサにより獲得されたセンシングデータが獲得されると、前記マシンラーニングネットワークが前記センシングデータを分析して前記自律走行自動車の走行情報に対するアウトプットデータを生成した状態で、
    前記オンデバイス学習装置が、前記センシングデータと前記センシングデータのそれぞれに対応するアウトプットデータとを前記データセレクションネットワークに入力することで、前記データセレクションネットワークをもって、前記アウトプットデータを参照して前記マシンラーニングネットワークの学習に使用される特定のセンシングデータを選定させ、選定された特定のセンシングデータを前記新しい学習用データとして格納させることを特徴とする、請求項1に記載の方法。
  7. 前記(a)段階で、
    前記オンデバイス学習装置は、前記マシンラーニングネットワークのベースモデルとして予め決定されたハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択するか、以前学習により生成されたベストハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択することを特徴とする、請求項1に記載の方法。
  8. 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車の走行を支援する1又は複数の作業に関連した複数の異なるタイプの学習を実行することが可能なマシンラーニングネットワークをオンデバイス学習及びアップデートさせる装置であって前記複数の異なるタイプの学習は、ディープラーニング学習基盤のネットワーク、行動予測ネットワーク、又は、リスク探知ネットワークを含み、前記オンデバイス学習及びアップデートは、クラウドサーバに接続せずに実現され、前記自律走行自動車は、走行環境に関する学習を行うためのセンシングデータを獲得するように構成され、前記センシングデータは、前記マシンラーニングネットワークと通信を行うことにより少なくとも1つのセンサ又は複数のセンサの組み合わせにより獲得され、前記自律走行自動車の周辺を撮影したイメージを含み、前記少なくとも1つのセンサがカメラ、レーダ、又は、ライダであり、前記センシングデータの少なくとも一部は前記マシンラーニングネットワークのための学習データであり、前記学習とアップデートは、適応的ハイパーパラメータセットを利用してマルチステージ学習を行って、前記センシングデータに対応したアウトプットデータを生成することにより現在の走行環境において前記自律走行自動車が自律的に走行し続けるようにすることにより達成され、前記自律走行自動車は、前記マシンラーニングネットワークと通信を行うオンデバイス学習装置を含み、前記マシンラーニングネットワークは、物体検出器、分類ネットワーク、及び、セグメンテーションネットワークのうちの少なくとも1つを含む装置において、
    インストラクションを格納する少なくとも一つのメモリ;及び
    前記インストラクションを遂行するように設定された一つ以上のプロセッサを含み、
    前記プロセッサが、(I)自律走行自動車の運行中に新しい学習用データを獲得する状態でオンデバイス学習条件を満たす場合、ベースモデル学習のために予め決定されたハイパーパラメータの基本値を使用して生成された、又は、過去の学習のうち最高の性能を有するマシンラーニングネットワークのハイパーパラメータの最高性能値を使用して生成された基本ハイパーパラメータセットを参照して現在学習を第1ステージ学習乃至第n(前記nは2以上の整数である)ステージ学習に区分し、前記新しい学習用データと以前学習に利用された以前学習用データとを利用して前記第1ステージ学習乃至前記第nステージ学習のための第1ステージ学習データ乃至第nステージ学習用データを生成し、前記基本ハイパーパラメータセットに含まれた、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータのそれぞれの基本値を基準に予め設定された範囲内の第1候補値のそれぞれを組合せて第1_1ハイパーパラメータセット候補乃至第1_h(前記hは2以上の整数である)ハイパーパラメータセット候補を生成して前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して前記マシンラーニングネットワークをそれぞれ前記第1ステージ学習データを利用して学習させ前記基本ハイパーパラメータセット及び前記第1_1ハイパーパラメータセット候補乃至前記第1_hハイパーパラメータセット候補のそれぞれを適用して学習された前記マシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記マシンラーニングネットワークを前記第1ステージ学習済みマシンラーニングネットワークとして選定し前記第1ステージ学習済みマシンラーニングネットワークの学習に適用された、学習アルゴリズム設定(L)、ミニバッチサイズ(B)、マキシマムステージ(D)、及び前記各ステージ別マキシマムエポック(E)のうち少なくとも一つを含むハイパーパラメータセットを第1適応的ハイパーパラメータセットとして生成するプロセス、(II)kを2からn-1まで増加させ、第k-1適応的ハイパーパラメータセットに含まれたハイパーパラメータのそれぞれの第k-1適応値を基準に前記予め設定された範囲内の第k候補値のそれぞれを組合せて第k_1ハイパーパラメータセット候補乃至第k_hハイパーパラメータセット候補を生成し、前記第k-1ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセットのそれぞれを適用して第k-1ステージ学習済みマシンラーニングネットワークをそれぞれ前記第kステージ学習用データを利用して学習させ、前記第k-1適応的ハイパーパラメータセット及び前記第k_1ハイパーパラメータセット候補乃至前記第k_hハイパーパラメータセット候補のそれぞれを適用して学習された前記第k-1ステージ学習済みマシンラーニングネットワークのそれぞれの性能を評価して性能の最も高い前記第k-1ステージ学習済みマシンラーニングネットワークを第kステージ学習済みマシンラーニングネットワークとして選定し、前記第kステージ学習済みマシンラーニングネットワークの学習に適用されたハイパーパラメータセットを第k適応的ハイパーパラメータセットとして生成するプロセス及び(III)前記第1適応的ハイパーパラメータセット乃至第n-1適応的ハイパーパラメータセットのそれぞれと、前記第1ステージ学習により学習されたマシンラーニングネットワーク乃至第n-1ステージ学習により学習されたマシンラーニングネットワークのそれぞれの性能評価結果とを参照して構築した最適化関数を使用して第n適応的ハイパーパラメータセットを生成し、前記第n適応的ハイパーパラメータセットを適用して前記第n-1ステージ学習済みマシンラーニングネットワークを前記第nステージ学習用データを利用して第nステージ学習させることによって、前記自律走行自動車を現在の走行環境又は新しい走行環境において自律的に走行し続けるために使用される前記現在学習を完了するプロセスを遂行する学習装置。
  9. (IV)前記プロセッサは、前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上していない場合、前記マシンラーニングネットワークをアップデートすることなく、次回のオンデバイス学習条件を満たすまで前記マシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセス、及び前記現在学習が完了した状態で前記マシンラーニングネットワークの性能が一定の閾値以上向上した場合、前記マシンラーニングネットワークを現在学習済みマシンラーニングネットワークにアップデートし、前記次回のオンデバイス学習条件を満たすまで前記現在学習済みマシンラーニングネットワークを利用して前記自律走行自動車が運行されるようにするプロセスをさらに遂行する、請求項に記載の装置。
  10. 前記プロセッサは、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、第k+1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットのそれぞれを前記第k適応的ハイパーパラメータセットと同一に設定することを特徴とする、請求項に記載の装置。
  11. 前記(II)プロセスで、
    前記プロセッサは、前記第1適応的ハイパーパラメータセット乃至前記第n適応的ハイパーパラメータセットに含まれた少なくとも一つのハイパーパラメータの適応値を同一に維持する、請求項に記載の装置。
  12. 前記プロセッサは、前記第kステージ学習済みマシンラーニングネットワークの性能が前記第k-1ステージ学習済みマシンラーニングネットワークの性能よりも高い場合、前記第kステージ学習を前記第nステージ学習として設定することによって前記現在学習を完了することを特徴とする、請求項に記載の装置。
  13. 前記(I)プロセスで、
    前記自律走行自動車に取り付けられたセンサにより獲得されたセンシングデータが獲得されると、前記マシンラーニングネットワークがディープラーニング基盤に前記センシングデータを分析して前記自律走行自動車の走行情報に対するアウトプットデータを生成した状態で、
    前記プロセッサは、前記センシングデータと前記センシングデータのそれぞれに対応するアウトプットデータとを前記データセレクションネットワークに入力することで、前記データセレクションネットワークをもって、前記アウトプットデータを参照して前記マシンラーニングネットワークの学習に使用される特定のセンシングデータを選定させ、選定された特定のセンシングデータを前記新しい学習用データとして格納させることを特徴とする、請求項に記載の装置。
  14. 前記(I)プロセスで、
    前記プロセッサは、前記マシンラーニングネットワークのベースモデルとして予め決定されたハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択するか、以前学習により生成されたベストハイパーパラメータセットを前記基本ハイパーパラメータセットとして選択することを特徴とする、請求項に記載の装置。
JP2021576475A 2020-05-05 2021-05-04 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置 Active JP7295282B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063020101P 2020-05-05 2020-05-05
US63/020,101 2020-05-05
US17/229,350 US11203361B2 (en) 2020-05-05 2021-04-13 Method for performing on-device learning of machine learning network on autonomous vehicle by using multi-stage learning with adaptive hyper-parameter sets and device using the same
US17/229,350 2021-04-13
PCT/KR2021/005616 WO2021225360A1 (en) 2020-05-05 2021-05-04 Method for performing on-device learning of machine learning network on autonomous vehicle by using multi-stage learning with adaptive hyper-parameter sets and device using the same

Publications (2)

Publication Number Publication Date
JP2022539696A JP2022539696A (ja) 2022-09-13
JP7295282B2 true JP7295282B2 (ja) 2023-06-20

Family

ID=75787010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576475A Active JP7295282B2 (ja) 2020-05-05 2021-05-04 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置

Country Status (6)

Country Link
US (1) US11203361B2 (ja)
EP (1) EP3910563A1 (ja)
JP (1) JP7295282B2 (ja)
KR (1) KR20210155824A (ja)
CN (1) CN114175068A (ja)
WO (1) WO2021225360A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6644231B1 (ja) * 2019-04-26 2020-02-12 Awl株式会社 画像分析装置、及び画像分析システム
US11760376B2 (en) * 2020-12-29 2023-09-19 Ford Global Technologies, Llc Machine learning updating with sensor data
WO2023214708A1 (ko) * 2022-05-06 2023-11-09 삼성전자 주식회사 영상 처리 장치 및 그 동작 방법
KR102532282B1 (ko) * 2022-09-05 2023-05-11 세종대학교산학협력단 파라미터 통합 최적화 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005739A (ja) 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8612107B2 (en) * 2008-06-10 2013-12-17 The Regents Of The University Of Michigan Method, control apparatus and powertrain system controller for real-time, self-learning control based on individual operating style
US10140522B2 (en) * 2015-12-16 2018-11-27 Intel Corporation Fully convolutional pyramid networks for pedestrian detection
US10650045B2 (en) * 2016-02-05 2020-05-12 Sas Institute Inc. Staged training of neural networks for improved time series prediction performance
JP7050006B2 (ja) * 2017-06-28 2022-04-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 移動体制御装置、移動体制御方法、及び学習方法
US10520940B2 (en) * 2017-08-14 2019-12-31 GM Global Technology Operations LLC Autonomous operation using deep spatio-temporal learning
US20190101914A1 (en) * 2017-10-02 2019-04-04 Allstate Insurance Company Data Processing System with Machine Learning Engine for Providing Driving Data Analysis and Vehicle Control Functions
TWI651664B (zh) * 2017-11-15 2019-02-21 財團法人資訊工業策進會 模型生成伺服器及其模型生成方法
US10762396B2 (en) * 2017-12-05 2020-09-01 Utac, Llc Multiple stage image based object detection and recognition
KR20190068255A (ko) * 2017-12-08 2019-06-18 삼성전자주식회사 고정 소수점 뉴럴 네트워크를 생성하는 방법 및 장치
KR20200015048A (ko) * 2018-08-02 2020-02-12 삼성전자주식회사 메타-학습에 기반하여 기계학습의 모델을 선정하는 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005739A (ja) 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Ahmad El Sallab et al.,Meta learning Framework for Automated Driving,arXiv,米国,Cornell University,2017年06月11日,https://arxiv.org/pdf/1706.04038.pdf
Martin Wistuba et al.,Learning hyperparameter optimization initializations,2015 IEEE International Conference on Data Science and Advanced Analytics,米国,IEEE,2015年10月19日,https://ieeexplore.ieee.org/document/7344817

Also Published As

Publication number Publication date
US11203361B2 (en) 2021-12-21
CN114175068A (zh) 2022-03-11
JP2022539696A (ja) 2022-09-13
EP3910563A1 (en) 2021-11-17
WO2021225360A1 (en) 2021-11-11
KR20210155824A (ko) 2021-12-23
US20210347379A1 (en) 2021-11-11

Similar Documents

Publication Publication Date Title
JP7295282B2 (ja) 適応的ハイパーパラメータセットを利用したマルチステージ学習を通じて自律走行自動車のマシンラーニングネットワークをオンデバイス学習させる方法及びこれを利用したオンデバイス学習装置
US11663441B2 (en) Action selection neural network training using imitation learning in latent space
KR102532749B1 (ko) 약한 지도 학습에 기초한 뉴럴 네트워크의 계층적 학습 방법 및 장치
US11593611B2 (en) Neural network cooperation
CN111373417B (zh) 与基于度量学习的数据分类相关的设备及其方法
US20220004935A1 (en) Ensemble learning for deep feature defect detection
US20180129742A1 (en) Natural language object tracking
US20210150345A1 (en) Conditional Computation For Continual Learning
EP3616130A1 (en) Using simulation and domain adaptation for robotic control
KR20200128938A (ko) 모델 학습 방법 및 장치
CN113795851A (zh) 具有针对使用对抗训练的表示学习的推理的大规模生成神经网络模型
US20230244924A1 (en) System and method for robust pseudo-label generation for semi-supervised object detection
CN112633463A (zh) 用于建模序列数据中长期依赖性的双重递归神经网络架构
CN112465147A (zh) 机器学习的随机数据增强
EP3627403A1 (en) Training of a one-shot learning classifier
US20220253698A1 (en) Neural network-based memory system with variable recirculation of queries using memory content
US20240070449A1 (en) Systems and methods for expert guided semi-supervision with contrastive loss for machine learning models
EP3764284A1 (en) Adapting a base classifier to novel classes
US20200293864A1 (en) Data-aware layer decomposition for neural network compression
CN115482513A (zh) 使预训练的机器学习系统适配于目标数据的设备和方法
US20210374549A1 (en) Meta-learned, evolution strategy black box optimization classifiers
US20240062058A1 (en) Systems and methods for expert guided semi-supervision with label propagation for machine learning models
US11908193B2 (en) Obtaining custom artificial neural network architectures
US20240096067A1 (en) Systems and methods for multi-teacher group-distillation for long-tail classification
Alkhashab Data-Efficient Learning using Modular Meta-Learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230608

R150 Certificate of patent or registration of utility model

Ref document number: 7295282

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150