JP2021514499A

JP2021514499A - ターゲットオブジェクト処理方法、装置、電子機器及び記憶媒体

Info

Publication number: JP2021514499A
Application number: JP2020533136A
Authority: JP
Inventors: シーシンハン; ユーグオ; ホンウェイチン; ユージャオ
Original assignee: ベイジンセンスタイムテクノロジーデベロップメントカンパニー，リミテッド
Priority date: 2019-01-31
Filing date: 2019-08-19
Publication date: 2021-06-10
Anticipated expiration: 2039-08-19
Also published as: WO2020155609A1; CN109766954B; US20200311476A1; CN109766954A; KR20200096556A; JP7064593B2; TW202030648A; SG11202005886RA; TWI772668B; US11403489B2

Abstract

本開示はターゲットオブジェクト処理方法、装置、電子機器及び記憶媒体に関する。前記方法は、第１データを第１処理モジュールに入力して、予測されたデータラベリング結果を得るステップと、前記データラベリング結果を第２処理モジュールに入力して、前記データラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るステップと、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するステップと、を含む。

Description

（関連出願の相互参照）
本願は、出願番号が２０１９１００９８７３５．５で、出願日が２０１９年１月３１日である中国特許出願に基づいて提出され、且つこの中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。

本開示は、コンピュータビジョン技術に関し、特に、ターゲットオブジェクト処理方法、装置、電子機器及び記憶媒体に関する。

関連技術において、クラウドでモデル訓練を行うことで訓練データを取得するようになっているが、得られた訓練データは実際の適用シーンのデータとの間に相違性が存在し、更に、異なる適用シーンの検出要求が異なっているので、クラウドでモデル訓練を行うことで得られた訓練データは全ての適用シーンに適合するというわけでない。

なお、適用シーン毎にデータを取得して訓練するのは、実施不可能であるか、コストが高すぎることである。

本開示は、ターゲットオブジェクト処理の技術的解決手段を提供する。

本開示の第１態様によれば、エッジデバイス側に適用され、第１データのラベリングのための第１処理モジュールと第２データのシーンへの順応のための第２処理モジュールを前記エッジデバイス側に配置する方法であって、
前記第１データを前記第１処理モジュールに入力して、予測されたデータラベリング結果を得るステップと、
前記データラベリング結果を前記第２処理モジュールに入力して、前記データラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るステップと、
ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するステップと、を含むターゲットオブジェクト処理方法を提供する。

可能な一実施形態では、前記方法は、
前記シーンが現在の第１シーンであり、前記データラベリング結果に基づいて第１シーンの自己適応の増分学習を行って、前記第１シーンへ順応したニューラルネットワークを得た後、前記シーンが前記第１シーンから第２シーンに変換されたことを監視するステップと、
前記第２処理モジュール中のパラメータのパラメータリセットをトリガするステップと、
前記データラベリング結果に基づいて前記第２シーンの自己適応の増分学習を行って、前記第２シーンへ順応したニューラルネットワークを得るステップと、を更に含む。

可能な一実施形態では、前記ニューラルネットワークを得るステップの前に、前記方法は、
前記第２処理モジュール中のパラメータが更新される場合に、制限条件に基づいて前記パラメータ更新を制約するステップを更に含む。

可能な一実施形態では、第１データを前記第１処理モジュールに入力して、予測されたデータラベリング結果を得る前記ステップは、
前記第１処理モジュールによるシーンデータの予測に基づいて、予測規則を得るステップと、
前記予測規則に基づいて前記第１データをラベリングして、予測されたデータラベリング結果を得るステップと、を含む。

可能な一実施形態では、前記予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力に由来するものであり、及び／又は、
前記予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力及び中間層の第２出力に由来するものである。

可能な一実施形態では、前記方法は、前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るステップを更に含み、
前記ニューラルネットワークを取得するステップの前に、前記方法は、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行うステップを更に含む。

可能な一実施形態では、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行う前記ステップは、
前記１フレーム又は複数フレームの第１データに対して前記第１処理モジュールが取得した１つ又は複数のデータラベリング結果を前記第２処理モジュールに出力するステップと、
１つ又は複数のデータラベリング結果に基づいて前記第２処理モジュールを訓練して前記第２処理モジュール中のパラメータを更新するステップと、
予め設定されたポリシーによって前記サンプリングパラメータの数値を増加するステップと、を含む。

可能な一実施形態では、前記方法は、前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るステップを更に含み、
前記ニューラルネットワークを取得するステップの前に、前記方法は、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が小さく相違する場合に、予め設定されたポリシーによって前記サンプリングパラメータの数値を減少するステップを更に含む。

可能な一実施形態では、前記方法は、前記第１データを前記第１処理モジュールに入力する前に、前記第１データ中の一部のデータをオンラインテスト集合とするステップを更に含み、
前記ニューラルネットワークを取得するステップの前に、前記方法は、
前記オンラインテスト集合中の第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記第２処理モジュール中のパラメータをリセットするステップを更に含む。

可能な一実施形態では、前記方法は、前記ニューラルネットワークが得られた後、
複数の領域のエッジデバイスを監視して、アイドル状態の第１エッジデバイスを取得するステップと、
第１エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するステップと、を更に含む。

可能な一実施形態では、前記方法は、前記ニューラルネットワークが得られた後、
複数の領域のエッジデバイスを監視して、複数のエッジデバイス処理能力を取得するステップと、
前記複数のエッジデバイスのそれぞれに対応するエッジデバイス処理能力及び現在リソース消費に基づいて、前記複数のエッジデバイスから前記エッジデバイス処理能力が最も高い第２エッジデバイスを選定するステップと、
前記第２エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するステップと、を更に含む。

本開示の第２態様によれば、エッジデバイス側に配置される装置であって、
入力された第１データに基づいて、予測されたデータラベリング結果を得るように構成される第１処理モジュールと、
入力されたデータラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るように構成される第２処理モジュールと、
ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するように構成される第３処理モジュールと、を含むターゲットオブジェクト処理装置を提供する。

可能な一実施形態では、前記装置は、
前記シーンが現在の第１シーンであり、前記データラベリング結果に基づいて第１シーンの自己適応の増分学習を行って、前記第１シーンへ順応したニューラルネットワークを得た後、前記シーンが前記第１シーンから第２シーンに変換されたことを監視するように構成される監視モジュールと、
前記第２処理モジュール中のパラメータのパラメータリセットをトリガするように構成されるリセットトリガモジュールと、を更に含み、
前記第２処理モジュールは、更に、前記データラベリング結果に基づいて前記第２シーンの自己適応の増分学習を行って、前記第２シーンへ順応したニューラルネットワークを得るように構成される。

可能な一実施形態では、前記装置は、
パラメータが更新される場合に、制限条件に基づいて前記パラメータ更新を制約するように構成されるパラメータ更新モジュールを更に含む。

可能な一実施形態では、前記第１処理モジュールは、更に、
シーンデータについての予測に基づいて、予測規則を得、
前記予測規則に基づいて前記第１データをラベリングして、予測されたデータラベリング結果を得るように構成される。

可能な一実施形態では、前記装置は、
前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るように構成される第４処理モジュールを更に含み、
前記装置は、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行うように構成される第５処理モジュールを更に含む。

可能な一実施形態では、前記第５処理モジュールは、更に、
前記１フレーム又は複数フレームの第１データに対して前記第１処理モジュールが取得した１つ又は複数のデータラベリング結果を前記第２処理モジュールに出力し、
１つ又は複数のデータラベリング結果に基づいて前記第２処理モジュールを訓練して前記第２処理モジュール中のパラメータを更新し、
予め設定されたポリシーによって前記サンプリングパラメータの数値を増加するように構成される。

可能な一実施形態では、前記装置は、
前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るように構成される第６処理モジュールを更に含み、
前記装置は、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が小さく相違する場合に、予め設定されたポリシーによって前記サンプリングパラメータの数値を減少するように構成される第７処理モジュールを更に含む。

可能な一実施形態では、前記装置は、
前記第１データを前記第１処理モジュールに入力する前に、前記第１データ中の一部のデータをオンラインテスト集合とするように構成される第８処理モジュールを更に含み、
前記装置は、
前記オンラインテスト集合中の第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記第２処理モジュール中のパラメータをリセットするように構成される第９処理モジュールを更に含む。

可能な一実施形態では、前記装置は、
前記ニューラルネットワークが得られた後、複数の領域のエッジデバイスを監視して、アイドル状態の第１エッジデバイスを取得するように構成される第１デバイス監視モジュールと、
第１エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するように構成される第１訓練処理モジュールと、を更に含む。

可能な一実施形態では、前記装置は、
前記ニューラルネットワークが得られた後、複数の領域のエッジデバイスを監視して、複数のエッジデバイス処理能力を取得するように構成される第２デバイス監視モジュールと、
前記複数のエッジデバイスのそれぞれに対応するエッジデバイス処理能力及び現在リソース消費に基づいて、前記複数のエッジデバイスから前記エッジデバイス処理能力が最も高い第２エッジデバイスを選定するように構成されるデバイス選定処理モジュールと、
前記第２エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するように構成される第２訓練処理モジュールと、を更に含む。

本開示の第３態様によれば、
プロセッサと、
プロセッサ実行可能コマンドを記憶するためのメモリと、を含み、
前記プロセッサが上記のいずれか一項に記載の方法を実行するように構成される電子機器を提供する。

本開示の第４態様によれば、実行可能なコマンドが記憶されているコンピュータ記憶媒体であって、前記実行可能なコマンドがプロセッサにより実行される時に上記のいずれか一項に記載の方法を実現するコンピュータ記憶媒体を提供する。

本開示では、第１データのラベリングのための第１処理モジュールと第２データのシーンへの順応のための第２処理モジュールをエッジデバイス側に配置し、前記第１データを前記第１処理モジュールに入力して予測されたデータラベリング結果を得、前記データラベリング結果を前記第２処理モジュールに入力して前記データラベリング結果に基づいてシーン自己適応の増分学習を行って、第２データのシーンへ順応したニューラルネットワークを得、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従ってターゲットオブジェクト対応シーンへの処理を実現する。本開示のシーン自己適応の増分学習を採用して第２データのシーンへ順応したニューラルネットワークが得られた後、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従ってターゲットオブジェクト対応シーンへの処理を実現してよく（例えば、ターゲットオブジェクトが顔又は人体である時に、人体又は顔の画像検出処理を実現する）、得られた訓練データは実際の適用シーンのデータとの相違が大きくなく、適用シーンの処理要求を満足すると共に、コストを低くすることができる。

以上の一般説明と以下の詳細説明は解釈するための例示的なものに過ぎず、本開示を制限しないことを理解すべきである。

以下の図面と関連付けられた例示的な実施例に対する詳細な説明によれば、本開示の他の特徴および態様は明確になる。

例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート１である。例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート２である。例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート３である。例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート４である。例示的な一実施例によるターゲットオブジェクト処理装置のブロック図１である。例示的な一実施例によるターゲットオブジェクト処理装置のブロック図２である。例示的な一実施例による電子機器８００のブロック図である。例示的な一実施例による電子機器９００のブロック図である。

図面は明細書に組み込まれて明細書の一部を構成し、これらの図面は本開示に合致する実施例を示し、明細書と共に本開示の技術的手段を説明するために用いられる。

以下に図面を参照しながら本開示の様々な例示的実施例、特徴および態様を詳細に説明する。図面における同じ符号は同じまたは類似する機能の要素を表す。図面において実施例の様々な態様を示したが、特に断らない限り、比例に従って図面を作る必要がない。

ここの用語「例示的」とは、「例、実施例として用いられることまたは説明的なもの」を意味する。ここで「例示的」に説明したいかなる実施例も他の実施例より優れたものと理解すべきではない。

本明細書の用語の「及び／又は」は、関連対象の関連関係を記述するためのものに過ぎず、３種の関係が存在可能であることを示し、例えば、Ａ及び／又はＢは、Ａが単独して存在し、ＡとＢが同時に存在し、Ｂが単独して存在するという３種の場合を示してもよい。また、本明細書の用語の「少なくとも１種」は多種のうちのいずれか１種又は多種のうちの少なくとも２種の任意の組合を示し、例えば、Ａ、Ｂ、Ｃのうちの少なくとも１種を含むということは、Ａ、Ｂ及びＣから構成される集合から選択されるいずれか１つ又は複数の要素を含むことを示してもよい。

また、本開示をより効果的に説明するために、以下の具体的な実施形態において様々な具体的詳細を示す。当業者であれば、何らかの具体的詳細がなくなるにも関わらず、本開示は同様に実施できるということを理解すべきである。いくつかの実施例では、本開示の趣旨を強調するよう、当業者に既知の方法、手段、要素および回路に対する詳細な説明を省略する。

関連技術において、増分学習とは、新しいデータを加え続けて訓練する過程でモデルの新しいデータでのより好ましい効果を図るモデル訓練手法である。増分学習方法は、一般的には２種（又は多種）の異なるデータ集合上で訓練する。２種のデータ集合を例とすれば、まずデータ集合Ａ上で訓練し、次にデータ集合Ｂを用いて訓練し、その注目点はデータ集合Ｂ上で好ましい予測効果を遂げると共に、データ集合Ａ上で基本的に変化しない予測効果を保持することである。

データ集合Ｂ上で訓練する過程で、モデルパラメータのデータ集合Ａでの重要程度を予測することによって、この部分のパラメータのデータ集合Ｂでの訓練の時の勾配重みを制御する。実際にはモデルのデータ集合Ｂ（エッジデバイス側の適用シーン）での効果がより好ましいことが期待されるが、データＡ（クラウドオンラインテスト集合）での効果が注目されない。

データによって進む機械学習は、一般的にはデータが近似する入力を処理、訓練する時に効果が優れるが、入力され、訓練されるデータが大きく相違する時に、その特徴が一般の特徴に対して空間関係的にひどく変化したので、一般のモデルは好ましい効果を遂げられないことがある。適用シーン毎にデータを収集し訓練するのは実施不可能であるか、コストが高いことであり、本開示の以下の各実施例を採用すれば、シーン自己適応の増分学習が実現され、このシーン自己適応の増分学習方法を採用すれば、エッジデバイスに内蔵されたオンラインモデル（Ｓモデルという）に加えて、精度が高いが速度が実用性を満たさないオフラインモデル（Ｔモデルという）が設計されている。エッジデバイスを適用シーンに配置した後、Ｔモデルによって応用シーンのデータを予測してデータをラベリングし、Ｓモデルをこの適用シーンに適応させてより優れる処理性能を取得するように、エッジデバイス上でＳモデルを増分訓練する。他には、できる限り少ない反復回数でＳモデルの性能を最大程度で向上させるように、異なる学習ポリシーを設計してよい。シーンが変換される場合に、モデル初期の性能を保証するようにＳモデルをリセットしてから、新しい適用シーンでモデルの処理性能を訓練、向上する。

図１は例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート１であり、このターゲットオブジェクト処理方法は、ターゲットオブジェクト処理装置に用いられるものであって、第１データのラベリングのための第１処理モジュールと第２データのシーンへの順応のための第２処理モジュールがエッジデバイス側に配置される。例えば、ターゲットオブジェクト処理装置は、ユーザ側装置（ＵｓｅｒＥｑｕｉｐｍｅｎｔ：ＵＥ）、携帯機器、セル方式の携帯無線電話、無線電話、携帯情報端末（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ：ＰＤＡ）、携帯型デバイス、計算装置、車載装置、ウエアラブル装置等の端末装置又はサーバ又は他の処理装置により実行してもよい。ある可能な実施形態では、このターゲットオブジェクトの処理はプロセッサによってメモリに記憶されたコンピュータ読取可能コマンドを呼び出して実現されてもよい。図１に示すように、このプロセスは、
第１データを第１処理モジュールに入力して、予測されたデータラベリング結果を得るステップＳ１１と、
データラベリング結果を第２処理モジュールに入力して、データラベリング結果に基づいてシーン自己適応の増分学習を行って、第２データのシーンへ順応したニューラルネットワークを得るステップＳ１２と、
ターゲットオブジェクトを含むデータ及びこのニューラルネットワークによって、ターゲットオブジェクト対応シーンへの処理を実現するステップＳ１３と、を含む。

本開示では、第１処理モジュールと第２処理モジュールは演算モデルに基づいて得られてよい。例えば、第１処理モジュールはＴモデルであってよく、第２処理モジュールはＳモデルであってよい。第１データはターゲットオブジェクトから取得された生データであり、例えば、画像検出に適用するシーンにおいて、第１データは、人体画像データ及び顔画像データを含んでもよく、人体画像データと顔画像データの中のいずれか一方のみを含んでもよい。ここで、Ｔモデルはオフラインモデルであってよく、Ｓモデルはオンラインモデルであってよい。第２データはシーンへの順応のためのシーンデータである。

本開示を適用するシーンは、目標検出、目標認識、実例分割、超解像、強化学習等のシーンを含む。監視シーンでの目標検出を例とすれば、現在、知能化撮影装置は全てエッジデバイス上で顔又は人体の検出を行うようになっている。計算能力に限界があるので、大きいモデルが利用不可能である。異なるエリアの監視シーンには大きい相違点があり、デバイス上の汎用モデルは各種シーンでも好適な性能を図ることを実現できない。しかし、ターゲットオブジェクトを取得するための取得装置（例えば、撮影装置）の位置を一定にした後、そのシーンが一定になる（背景が比較単一になる）。目標認識、実例分割、超解像、強化学習等のシーンにおいて、具体的な実施形態が相違するが、シーンへ順応しにくい問題がいずれにも存在し、即ち、シーン毎にモデルを訓練すればコストが高過ぎ、一方、取得装置（例えば、撮影装置）の位置が一定になった後、ターゲットオブジェクトに対する処理タスク（例えば、目標検出）が簡単になり、本開示の上記図１の処理手順を採用すれば、エッジデバイスのアイドル時間での計算能力を用いて、モデルを特定シーンに応じて増分訓練して、特定シーンでのタスク処理能力（例えば、目標検出の検出率）を効果的に高めることができる。

選択可能な実施形態では、目標検出シーンにおいて、第１データは、人体画像データ又は顔画像データを含む。人体画像データ又は顔画像データのラベリングのためのＴモデル及び第２データのシーンへの順応のためのＳモデルをエッジデバイス（例えば、エッジノード）側に配置し、人体画像データ又は顔画像データをＴモデルに入力し、予測されたデータラベリング結果を得る。データラベリング結果をＳモデルに入力して、データラベリング結果に基づいてシーン自己適応の増分学習を行って、第２データのシーンへ順応したニューラルネットワークを得、例えば、目標検出のシーンにおいて、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って人体画像又は顔画像の検出を実現してよい。

本開示は、データを人工でラベリングすることに頼らないので、オンライン増分学習が可能になる。Ｔモデル及びＳモデルのエッジデバイス側及びクラウドでのオンライン反復が可能になり、製品が納品された後様々な適用シーンに適応可能であり、性能が高くなり、また、Ｔモデル及びＳモデルのエッジデバイス側での反復を可能にしたことを例とすれば、インターネットが不要であるので、情報漏洩が発生しにくいので、ユーザのプライバシーが保護される。製品を安全保護、携帯電話、自動運転等の適用シーンに用いれば、オンライン増分学習によってモデルの個別化自己適応更新、モデルの再訓練を実現することができる。

一例において、監視シーンでの目標検出にとっては、現在、知能化撮影装置は全てエッジデバイス上で顔、人体の検出を行うようになっている。エッジデバイスの処理能力（計算能力）に限界があるので、大きいモデルが利用不可能である。また、異なるエリアの監視シーンには大きい相違点があり、エッジデバイス上の汎用モデルは各種監視シーンでも好適な性能を図ることを実現できない。エッジデバイスが固定された後、そのシーンが一定になり、相対的単一なものになる。以上に鑑みて、Ｔモデルは精度がＳモデルより高いが、サンプルデータが多いため、大きいモデルとなり、処理速度が相対的遅く、Ｓモデルは精度が高くないが、処理速度が速いので、ＴモデルとＳモデルを組み合わせてサンプルデータの訓練学習を行うことで、所望の処理要求に応えられるようになる。ＴモデルとＳモデルをエッジデバイス側に配置すれば、エッジデバイス側をクラウドに接続しなくても画像データの検出処理を独立して完了することができる。クラウドに接続せず、エッジデバイス側で全過程を完了できるので、ユーザのプライバシーデータが保護される。Ｔモデルによって適用シーンのデータを予測してデータをラベリングすることで、人工によるデータラベリングに頼らなくなり、データラベリング結果をＳモデルのデータ訓練、例えばエッジデバイス側での増分訓練に用いることで、シーン自己適応の増分学習を実現し、Ｓモデルを適用シーンに適応させ、モデル性能を高める目的を達成した。第２データのシーンへ順応したニューラルネットワークが得られ、例えば、目標検出の適用シーンにおいて、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って画像データの検出を実現することができ、得られた訓練データは実際の適用シーンのデータとの相違性が大きくなく、適用シーンの検出要求を満たすと共に、コストを低くすることができる。適用シーン毎にデータを取得し訓練する必要がなく、全ての適用シーンに適合する。

図２は例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート２であり、このターゲットオブジェクト処理方法はターゲットオブジェクト処理装置に用いられるものであり、例えば、ターゲットオブジェクト処理装置はユーザ側装置（ＵＥ）、携帯機器、端末、セル方式の携帯無線電話、無線電話、携帯情報端末（ＰＤＡ）、携帯型デバイス、計算装置、車載装置、ウエアラブル装置等の端末装置又はサーバ又は他の処理装置により実行してもよい。ある可能な実施形態では、このターゲットオブジェクト処理はプロセッサによってメモリに記憶されたコンピュータ読取可能コマンドを呼び出して実現されてもよい。第１データのラベリングのための第１処理モジュールと第２データのシーンへの順応のための第２処理モジュールを前記エッジデバイス側に配置するステップは、図２に示すように、
第１データを第１処理モジュールに入力して、予測されたデータラベリング結果を得るステップＳ２１と、
シーンが現在の第１シーンであり、前記データラベリング結果に基づいて第１シーンの自己適応の増分学習を行って、第１シーンへ順応したニューラルネットワークを得、ターゲットオブジェクトを含むデータ及びこのニューラルネットワークによって、ターゲットオブジェクトに対応する第１シーンへの処理を実現するステップＳ２２と、
シーンが第１シーンから第２シーンに変換されたことが監視される場合、第２処理モジュール中のパラメータのパラメータリセットをトリガするステップＳ２３と、
データラベリング結果に基づいて第２シーンの自己適応の増分学習を行って、第２シーンへ順応したニューラルネットワークを得、ターゲットオブジェクトを含むデータ及びこのニューラルネットワークによって、ターゲットオブジェクトに対応する第２シーンへの処理を実現するステップＳ２４と、を含む。

本開示では、第１処理モジュール及び第２処理モジュールは、演算モデルに基づいて得られてよい。例えば、第１処理モジュールはＴモデルであってよく、第２処理モジュールはＳモデルであってよい。目標検出シーンにおいて、第１データは、人体画像データ及び顔画像データを含んでもよく、人体画像データ及び顔画像データの中のいずれか一方のみを含んでもよい。ここで、Ｔモデルはオフラインモデルであってよく、Ｓモデルはオンラインモデルであってよい。Ｔモデル及びＳモデルは、２つの異なる規模のネットワークモデルであってもよい。Ｔモデルとしては、強い予測能力を有するように、大きいネットワーク構造を用いてよく、Ｓモデルは適用シーンの製品に使用される実際モデルとなる。新しく導入されるデータについては、先にＴモデルで予測し、得られた予測結果をラベリング結果とし、小さいモデルの訓練学習に用いる。シーンが変換される場合に、Ｓモデルをリセットすることで、モデルの初期性能を保証した上で、新しい適用シーンでモデルの処理性能を訓練、向上する。

Ｓモデルを制限することで、Ｓモデルの初期性能を保証でき、その後で新しい適用シーンで訓練してモデルの処理性能を高める。選択可能な実施形態では、前記第２処理モジュール中のパラメータが更新される場合に、制限条件に基づいて前記パラメータ更新を制約する。例えば、重み行列によって実現してよく、その目的は、第２処理モジュール（Ｓモデル）が変化する過程で一部の初期状態（配置された直後のもの）を保留して、パラメータが固定化した特徴を保留して、現在シーンへの多過ぎる注目による過剰適合等の問題の回避に寄与することである。

選択可能な実施形態では、第１データを前記第１処理モジュールに入力して、予測されたデータラベリング結果を得る前記ステップは、前記第１処理モジュールによる前記シーンデータの予測に基づいて、予測規則を得るステップと、前記予測規則に基づいて前記第１データをラベリングして、予測されたデータラベリング結果を得るステップと、を含む。

選択可能な実施形態では、第１処理モジュールによって得られた予測データラベリング結果は、以下の少なくとも２つのところからのものであってよい。第１処理モジュールは、ラベリングソースと理解可能である。

１．第１処理モジュールの出力結果を第２処理モジュールの入力とする場合に、予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力に由来するものである。

２．第１処理モジュールの出力結果及び中間層の出力結果を第２処理モジュールの入力とする場合に、予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力及び中間層の第２出力に由来するものである。

図３は例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート３であり、このターゲットオブジェクト処理方法はターゲットオブジェクト処理装置に用いられるものであり、例えば、ターゲットオブジェクト処理装置は、ユーザ側装置（ＵＥ）、携帯機器、セル方式の携帯無線電話、無線電話、携帯情報端末（ＰＤＡ）、携帯型デバイス、計算装置、車載装置、ウエアラブル装置等の端末装置又はサーバ又は他の処理装置により実行してもよい。ある可能な実施形態では、このターゲットオブジェクト処理はプロセッサによってメモリに記憶されたコンピュータ読取可能コマンドを呼び出して実現されてもよい。図３に示すように、このプロセスは、以下のステップを含む。

ステップＳ３１において、第１データを第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得る。

例えば、前記サンプリングパラメータがサンプリング周波数である。

ステップＳ３２において、前記処理される第１データについては、第１処理モジュールと第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データを取得する。

大きく相違する標準はユーザの要求又は設計要求に応じて設定し、又は調整することが可能であるのを説明する必要がある。

ステップＳ３３において、前記１フレーム又は複数フレームの第１データに対して第１処理モジュールが取得した１つ又は複数のデータラベリング結果を第２処理モジュールに出力する。

ステップＳ３４において、１つ又は複数のデータラベリング結果に基づいて第２処理モジュールを訓練して第２処理モジュール中のパラメータを更新し、予め設定されたポリシーによって前記サンプリングパラメータの数値を増加する。

上記ステップＳ３１〜Ｓ３４によって、前記エッジデバイス側で前記シーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るのは、選択可能な実施形態である。

別の選択可能な実施形態では、サンプリングパラメータ（例えば、サンプリング周波数）に基づいて前記第１データを選択して、処理される第１データを得る。処理される第１データについては、第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が小さく相違する場合に、予め設定されたポリシーによってサンプリングパラメータの数値を減少する。

選択可能な一実施形態では、前記方法は、第１データを第１処理モジュールに入力する前に、第１データ中の一部のデータをオンラインテスト集合として、オンラインテスト集合中の第１データについて、第１処理モジュールと第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、第２処理モジュール中のパラメータをリセットするステップを更に含む。

選択可能な一実施形態では、前記方法は、シーン自己適応の増分学習を行ってニューラルネットワークを得た後、このニューラルネットワークを用いてある適用シーンを処理する場合に、複数の領域のエッジデバイスを監視して、アイドル状態の第１エッジデバイスを取得し、第１エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するステップを更に含む。

選択可能な別の実施形態では、前記方法は、シーン自己適応の増分学習を行ってニューラルネットワークを得た後、このニューラルネットワークを用いてある適用シーンを処理する場合に、複数の領域のエッジデバイスを監視して、複数のエッジデバイス処理能力を取得し、前記複数のエッジデバイスのそれぞれに対応する自分の処理能力及び現在リソース消費に基づいて、前記複数のエッジデバイスから処理能力が高い第２エッジデバイスを選定ステップと、第２エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するステップと、を更に含む。

上記の２つの選択可能な実施形態を用いれば、特定のシーンに応じてモデルに増分訓練を実施することができ、特定シーンでのターゲットオブジェクト検出の検出率が効果的に高められ、エッジデバイスの処理能力が強くなり、自己適応増分訓練の処理速度及び処理効率も高くなる。

図４は例示的な一実施例によるターゲットオブジェクト処理方法のフローチャート４である、このターゲットオブジェクト処理方法はターゲットオブジェクト処理装置に用いられるものであり、例えば、ターゲットオブジェクト処理装置は、ユーザ側装置（ＵＥ）、携帯機器、セル方式の携帯無線電話、無線電話、携帯情報端末（ＰＤＡ）、携帯型デバイス、計算装置、車載装置、ウエアラブル装置等の端末装置又はサーバ又は他の処理装置により実行してもよい。ある可能な実施形態では、このターゲットオブジェクト処理はプロセッサによってメモリに記憶されたコンピュータ読取可能コマンドを呼び出して実現されてもよい。図４に示すように、このプロセスは、以下のステップを含む。

一例において、第１処理モジュールをＴモデルとし、第２処理モジュールをＳモデルとし、ＳモデルとＴモデルをエッジデバイス側に配置し、エッジデバイス側を具体的な適用シーン、例えば目標検出シーンに配置し、サンプルデータを訓練することによってシーンデータの自己適応の増分学習を実現する。例えば、テスト集合（例えば、オンラインテスト集合）から定期的に新しいデータを選択し、予め設定されたサンプリング周波数ｆを取得し、このサンプリング周波数ｆで新しいデータ中の一部の画像（図４で破線矢印で示す）を選択し、一部の選択された画像データをそれぞれエッジデバイス側に配置されたＳモデルとＴモデルに送信して予測する。モデル蒸留評価器によって２つのモデル（ＳモデルとＴモデル）の相違を比較する。ＴモデルとＳモデルの出力した予測結果が大きく相違する場合に、予測結果が大きく相違する画像データに対してエッジデバイス側での訓練を行い、即ち、Ｔモデルの出力したこのフレームの画像のラベリング結果によってＳモデルを訓練し且つパラメータを更新し、更に予め設定されたポリシーによってサンプリング周波数ｆを増加する。例えば、Ｓモデルの現在パラメータをθ＊とし、損失関数は、クラウドの損失関数以外に、式（１）によって計算して得られた制約モデルがある。

（１）

この制約モデルを採用すれば、クラウド訓練結果を多く忘れることがなく、式（１）において、λは固定化重みの重要性を示し、λをゼロにしてモデルの固定化を放棄してもよい。２つのモデル（ＳモデルとＴモデル）が出力した予測結果が小さく相違する場合に、このサンプリング周波数ｆを小さくし、又は維持する。訓練写真が経時的に蓄積されることで、Ｓモデルはより好ましく適用シーンに適応するようになり、即ち、Ｔモデルの出力をＳモデルのデータ訓練学習に用いて、シーン自己適応の増分学習が実現され、それによってシーンデータへ順応した検出結果を得ることができ、この検出結果に基づいてターゲットオブジェクトの検出が実現される。

また、予め設定された方式で、一部の選択された画像データをオンラインテスト集合（図４で太い実線矢印で示す）として、テスト評価器によって２つのモデル（ＳモデルとＴモデル）の相違を比較する。ＳモデルとＴモデルによる同一オンラインテスト集合の予測結果が大きく相違する場合に、元のＳモデルのパラメータθを改めてロードして、モデル性能を保証するようにしてもよい。適用シーンを変更する必要がある場合に、このシステムの新しいシーンでの効果が元のシーンに影響されないように、元のＳモデルのパラメータθを改めてロードしてもよい。

本開示で言及される上記各方法の実施例は、原理と論理に違反しない限り、相互に組み合わせて、組合せ後の実施例を形成することができることが理解され、紙数に限りがあるので、本開示では詳細な説明を省略する。

具体的な実施形態の上記方法において、各ステップの記述順序は厳しい実行順序であるというわけではなく、実施プロセスの何の制限にもならなく、各ステップの具体的な実行順序はその機能と可能な内在的論理に依存することが当業者に理解される。

また、本開示はターゲットオブジェクト処理装置、電子機器、コンピュータ読取可能記憶媒体、プログラムを更に提供し、それらはいずれも本開示で提供されるいずれか１種のターゲットオブジェクト処理方法を実現することに利用可能であり、対応する技術的解決手段及び説明については方法部分の対応の記載を参照してもよく、ここで詳細な説明を省略する。

図５は例示的な一実施例によるターゲットオブジェクト処理装置のブロック図１であり、図５に示すように、本開示の実施例のターゲットオブジェクト処理装置は、エッジデバイス側に配置されるものであって、入力された第１データに基づいて、予測されたデータラベリング結果を得るように構成される第１処理モジュール２０１と、入力されたデータラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るように構成される第２処理モジュール２０２と、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するように構成される第３処理モジュール２０３と、含む。

図６は例示的な一実施例によるターゲットオブジェクト処理装置のブロック図２であり、図６に示すように、本開示の実施例のターゲットオブジェクト処理装置は、エッジデバイス側に配置されるものであって、入力された第１データに基づいて、予測されたデータラベリング結果を得るように構成される第１処理モジュール２０１と、入力されたデータラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るように構成される第２処理モジュール２０２と、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するように構成される第３処理モジュール２０３と、前記シーンが現在の第１シーンであり、前記データラベリング結果に基づいて第１シーンの自己適応の増分学習を行って、前記第１シーンへ順応したニューラルネットワークを得た後、シーンが前記第１シーンから第２シーンに変換されたことを監視するように構成される監視モジュール２０４と、前記第２処理モジュール２０２中のパラメータのパラメータリセットをトリガするように構成されるリセットトリガモジュール２０５と、を含み、第２処理モジュール２０２は、更に、前記データラベリング結果に基づいて前記第２シーンの自己適応の増分学習を行って、前記第２シーンへ順応したニューラルネットワークを得るように構成される。

可能な一実施形態では、この装置は、パラメータが更新される場合に、制限条件に基づいて前記パラメータ更新を制約するように構成されるパラメータ更新モジュール２０６（図６に図示されていない）を更に含む。

可能な一実施形態では、第１処理モジュール２０１は、更に、シーンデータについての予測に基づいて、予測規則を得、前記予測規則に基づいて前記第１データをラベリングして、予測されたデータラベリング結果を得るように構成される。

可能な一実施形態では、予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力に由来するものであり、及び／又は、予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力及び中間層の第２出力に由来するものである。

可能な一実施形態では、この装置は、前記第１データを第１処理モジュール２０１に入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るように構成される第４処理モジュール２０７（図６に図示されていない）を更に含む。この装置は、前記処理される第１データについては、第１処理モジュール２０１と第２処理モジュール２０２がそれぞれ出力した予測結果が大きく相違する場合に、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行うように構成される第５処理モジュール２０８（図６に図示されていない）を更に含む。

可能な一実施形態では、第５処理モジュール２０８は、更に、前記１フレーム又は複数フレームの第１データに対して第１処理モジュール２０１が取得した１つ又は複数のデータラベリング結果を第２処理モジュール２０２に出力し、１つ又は複数のデータラベリング結果に基づいて前記第２処理モジュール２０２を訓練して第２処理モジュール２０２中のパラメータを更新し、予め設定されたポリシーによって前記サンプリングパラメータの数値を増加するように構成される。

可能な一実施形態では、この装置は、前記第１データを第１処理モジュール２０１に入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るように構成される第６処理モジュール２０９（図６に図示されていない）を更に含む。この装置は、前記処理される第１データについては、第１処理モジュール２０１と第２処理モジュール２０２がそれぞれ出力した予測結果が小さく相違する場合に、予め設定されたポリシーによって前記サンプリングパラメータの数値を減少するように構成される第７処理モジュール２１０（図６に図示されていない）を更に含む。

可能な一実施形態では、この装置は、前記第１データを第１処理モジュール２０１に入力する前に、前記第１データ中の一部のデータをオンラインテスト集合とするように構成される第８処理モジュール２１１（図６に図示されていない）を更に含む。この装置は、オンラインテスト集合中の第１データについて、第１処理モジュール２０１と第２処理モジュール２０２がそれぞれ出力した予測結果が大きく相違する場合に、第２処理モジュール２０２中のパラメータをリセットするように構成される第９処理モジュール２１２（図６に図示されていない）を更に含む。

可能な一実施形態では、この装置は、前記ニューラルネットワークが得られた後、複数の領域のエッジデバイスを監視して、アイドル状態の第１エッジデバイスを取得するように構成される第１デバイス監視モジュール２１３（図６に図示されていない）と、第１エッジデバイスに対応するエッジデバイス処理能力に従って、第２処理モジュール２０２に第２データのシーンへの順応の自己適応増分訓練を実行するように構成される第１訓練処理モジュール２１４（図６に図示されていない）と、を更に含む。

可能な一実施形態では、この装置は、前記ニューラルネットワークが得られた後、複数の領域のエッジデバイスを監視して、複数のエッジデバイス処理能力を取得するように構成される第２デバイス監視モジュール２１５（図６に図示されていない）と、前記複数のエッジデバイスのそれぞれに対応する自分の処理能力及び現在リソース消費に基づいて、前記複数のエッジデバイスから処理能力が高い第２エッジデバイスを選定するように構成されるデバイス選定処理モジュール２１６（図６に図示されていない）と、第２エッジデバイスに対応するエッジデバイス処理能力に従って、第２処理モジュール２０２に第２データのシーンへの順応の自己適応増分訓練を実行するように構成される第２訓練処理モジュール２１７（図６に図示されていない）と、を更に含む。

いくつかの実施例では、本開示の実施例で提供された装置に備えた機能又はモジュールは、上記方法実施例に記載の方法を実行するために用いられ、その具体的な実施形態については上記方法実施例の説明を参照してもよく、簡単化するために、ここで重複説明は割愛する。

本開示の実施例は、更に、コンピュータプログラムコマンドが記憶されているコンピュータ読取可能記憶媒体であって、前記コンピュータプログラムコマンドがプロセッサにより実行される時に上記方法を実現するコンピュータ読取可能記憶媒体を提供する。コンピュータ読取可能記憶媒体は、不揮発性コンピュータ読取可能記憶媒体であってよい。

本開示の実施例は、更に、プロセッサと、プロセッサ実行可能コマンドを記憶するためのメモリと、を含み、前記プロセッサが上記方法を実行するように構成される電子機器を提供する。

ここで、電子機器は、端末、サーバ又は他の形態のデバイスとして提供されてよい。

図７は例示的な一実施例に基づいて示した電子機器８００のブロック図である。例えば、装置８００は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット装置、医療機器、フィットネス器具、パーソナル・デジタル・アシスタントなどの端末であってよい。

図７を参照すると、電子機器８００は処理コンポーネント８０２、メモリ８０４、電源コンポーネント８０６、マルチメディアコンポーネント８０８、オーディオコンポーネント８１０、入力／出力（Ｉ／Ｏ，Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インタフェース８１２、センサコンポーネント８１４、および通信コンポーネント８１６の一つ以上を含むことができる。

処理コンポーネント８０２は通常、電子機器８００の全体的な動作、例えば表示、電話の呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント８０２は、上記方法の全てまたは一部のステップを完了するために、一つ以上のプロセッサ８２０を含んで命令を実行することができる。また、処理コンポーネント８０２は、他のコンポーネントとの対話のために、一つ以上のモジュールを含むことができる。例えば、処理コンポーネント８０２は、マルチメディアコンポーネント８０８との対話のために、マルチメディアモジュールを含むことができる。

メモリ８０４は電子機器８００での動作をサポートするために様々なタイプのデータを記憶するように構成される。これらのデータの例は電子機器８００において運用するためのあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ８０４は、例えば静的ランダムアクセスメモリ（ＳＲＡＭ：ＳｔａｔｉｃＲａｎｄｏｍ−ＡｃｃｅｓｓＭｅｍｏｒｙ）、電気的消去可能プログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ：Ｅｌｅｃｔｒｉｃａｌｌｙ−ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭ：ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ：Ｐｒｏｇｒａｍｍａｂｌｅｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）、読み取り専用メモリ（ＲＯＭ：ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどの様々なタイプの揮発性または非揮発性記憶機器またはそれらの組み合わせによって実現できる。

電源コンポーネント８０６は電子機器８００の各コンポーネントに電力を供給する。電源コンポーネント８０６は電源管理システム、一つ以上の電源、および電子機器８００のための電力生成、管理および配分に関連する他のコンポーネントを含むことができる。

マルチメディアコンポーネント８０８は前記電子機器８００とユーザとの間で出力インタフェースを提供する画面を含む。いくつかの実施例では、画面は液晶ディスプレイ（ＬＣＤ：ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）およびタッチパネル（ＴＰ：ＴｏｕｃｈＰａｎｅｌ）を含むことができる。画面がタッチパネルを含む場合、ユーザからの入力信号を受信するために、タッチ画面として実現してもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャを検知するために、一つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関連する持続時間および圧力を検出することもできる。いくつかの実施例では、マルチメディアコンポーネント８０８は前面カメラおよび／または後面カメラを含む。電子機器８００が動作モード、例えば撮影モードまたは撮像モードになる場合、前面カメラおよび／または後面カメラは外部のマルチメディアデータを受信することができる。各前面カメラおよび後面カメラは固定された光学レンズ系または焦点距離および光学ズーム能力を有するものであってもよい。

オーディオコンポーネント８１０はオーディオ信号を出力および／または入力するように構成される。例えば、オーディオコンポーネント８１０は、電子機器８００が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成されたマイク（（ｍｉｃｒｏｐｈｏｎｅ：ＭＩＣ）を含む。受信されたオーディオ信号はさらにメモリ８０４に記憶されるか、または通信コンポーネント８１６によって送信されてもよい。いくつかの実施例では、オーディオコンポーネント８１０はさらに、オーディオ信号を出力するためのスピーカーを含む。

Ｉ／Ｏインタフェース８１２は処理コンポーネント８０２と周辺インタフェースモジュールとの間でインタフェースを提供し、上記周辺インタフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含むことができるが、これらに限定されない。

センサコンポーネント８１４は電子機器８００に各面での状態評価を提供するための一つ以上のセンサを含む。例えば、センサコンポーネント８１４は電子機器８００のオン／オフ状態、コンポーネントの相対的位置決め、例えば前記コンポーネントが電子機器８００の表示装置およびキーパッドであることを検出でき、センサコンポーネント８１４はさらに、電子機器８００または電子機器８００のあるコンポーネントの位置の変化、ユーザと電子機器８００との接触の有無、電子機器８００の方位または加減速および電子機器８００の温度変化を検出できる。センサコンポーネント８１４は、いかなる物理的接触もない場合に近傍の物体の存在を検出するために用いられるように構成された近接センサを含む。センサコンポーネント８１４はさらに、相補型金属酸化物半導体（ＣＭＯＳ：ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）又は電荷結合素子（ＣＣＤ：Ｃｈａｒｇｅ−ｃｏｕｐｌｅｄＤｅｖｉｃｅ）イメージセンサのような、イメージングアプリケーションにおいて使用するための光センサを含むことができる。いくつかの実施例では、該センサコンポーネント８１４はさらに、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサを含むことができる。

通信コンポーネント８１６は電子機器８００と他の機器との間の有線または無線通信を実現するように配置される。電子機器８００は通信規格に基づく無線ネットワーク、例えばＷｉＦｉ、２Ｇまたは３Ｇ、またはそれらの組み合わせにアクセスできる。一例示的実施例では、通信コンポーネント８１６は放送チャネルによって外部の放送管理システムの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント８１６はさらに、近距離通信を促進させるために、近距離無線通信（ＮＦＣ：ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）モジュールを含む。例えば、ＮＦＣモジュールでは無線周波数識別（ＲＦＩＤ：ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩｄｅｎｔｉｆｉｃａｔｉｏｎ）技術、赤外線データ協会（ＩｒＤＡ：ＩｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ）技術、超広帯域（ＵＷＢ：ＵｌｔｒａＷｉｄｅＢａｎｄ）技術、ブルートゥース（ＢＴ：ＢｌｕｅＴｏｏｔｈ）技術および他の技術によって実現できる。

例示的な実施例では、電子機器８００は一つ以上の特定用途向け集積回路（ＡＳＩＣ：ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、デジタル信号プロセッサ（ＤＳＰ：ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、デジタル信号処理デバイス（ＤＳＰＤ：ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＤｅｖｉｃｅ）、プログラマブルロジックデバイス（ＰＬＤ：ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現し、上記方法を実行するために用いることができる。

例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ８０４が提供され、上記コンピュータプログラム命令は電子機器８００のプロセッサ８２０によって実行して上記方法を完了することができる。

図８は例示的な一実施例に基づいて示した電子機器９００のブロック図である。例えば、電子機器９００はサーバとして提供できる。図８を参照すると、電子機器９００は、さらに一つ以上のプロセッサを含む処理コンポーネント９２２、および、処理コンポーネント９２２によって実行可能な命令、例えばアプリケーションプログラムを記憶するための、メモリ９３２を代表とするメモリ資源を含む。メモリ９３２に記憶されたアプリケーションプログラムはそれぞれが１グループの命令に対応する一つ以上のモジュールを含むことができる。また、処理コンポーネント９２２は命令を実行し、それによって上記方法を実行するように構成される。

電子機器９００はさらに、電子機器９００の電源管理を実行するように構成された電源コンポーネント９２６、電子機器９００をネットワークにアクセスするように構成された有線または無線ネットワークインタフェース９５０、および入出力（Ｉ／Ｏ）インタフェース９５８を含むことができる。電子機器９００はメモリ９３２に記憶されたオペレーティングシステム、例えばＷｉｎｄｏｗｓＳｅｒｖｅｒＴＭ、ＭａｃＯＳＸＴＭ、ＵｎｉｘＴＭ、ＬｉｎｕｘＴＭ、ＦｒｅｅＢＳＤＴＭまたは類似するものに基づいて動作できる。

例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ９３２が提供され、上記コンピュータプログラム命令は電子機器９００の処理コンポーネント９２２によって実行して上記方法を完了することができる。

本開示はシステム、方法および／またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品はプロセッサに本開示の各態様を実現させるためのコンピュータ読み取り可能プログラム命令がロードされているコンピュータ読み取り可能記憶媒体を含むことができる。

コンピュータ読み取り可能記憶媒体は命令実行機器により使用される命令を保存および記憶可能な有形機器であってもよい。コンピュータ読み取り可能記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能記憶媒体のさらに具体的な例（非包括的リスト）としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ：ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、読み取り専用メモリ（ＲＯＭ：ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、静的ランダムアクセスメモリ（ＳＲＡＭ：ＳｔａｔｉｃＲａｎｄｏｍ−ＡｃｃｅｓｓＭｅｍｏｒｙ）、携帯型コンパクトディスク読み取り専用メモリ（ＣＤ−ＲＯＭ：ＣｏｍｐａｃｔＤｉｓｃ−ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、デジタル多用途ディスク（ＤＶＤ：ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）、メモリスティック、フロッピーディスク、機械的符号化装置、例えば命令が記憶されているせん孔カードまたはスロット内突起構造、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ読み取り可能記憶媒体は瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波（例えば、光ファイバーケーブルを通過するパルス光）、または電線を経由して伝送される電気信号と解釈されるものではない。

ここで記述したコンピュータ読み取り可能プログラム命令はコンピュータ読み取り可能記憶媒体から各計算／処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび／または無線ネットワークによって外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび／またはエッジサーバを含むことができる。各計算／処理機器内のネットワークアダプタカードまたはネットワークインタフェースはネットワークからコンピュータ読み取り可能プログラム命令を受信し、該コンピュータ読み取り可能プログラム命令を転送し、各計算／処理機器内のコンピュータ読み取り可能記憶媒体に記憶する。

本開示の動作を実行するためのコンピュータプログラム命令はアセンブラ命令、命令セットアーキテクチャ（ＩＳＡ：ＩｎｓｔｒｕｃｔｉｏｎＳｅｔＡｒｃｈｉｔｅｃｔｕｒｅ）命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはＳｍａｌｌｔａｌｋ、Ｃ＋＋などのターゲットオブジェクト指向プログラミング言語、および「Ｃ」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含む一つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ読み取り可能プログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）または広域ネットワーク（ＷＡＮ：ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、（例えばインターネットサービスプロバイダを利用してインターネットを経由して）外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ読み取り可能プログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ：Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）またはプログラマブル論理アレイ（ＰＬＡ：ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＡｒｒａｙ）などの電子回路をパーソナライズすることで、該電子回路はコンピュータ読み取り可能プログラム命令を実行し、それにより本開示の各態様を実現できるようになる。

なお、ここで本開示の実施例に係る方法、装置（システム）およびコンピュータプログラム製品のフローチャートおよび／またはブロック図を参照しながら本開示の各態様を説明しが、フローチャートおよび／またはブロック図の各ブロックおよびフローチャートおよび／またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ読み取り可能プログラム命令によって実現できることを理解すべきである。

これらのコンピュータ読み取り可能プログラム命令は、機械を製造するために、共通コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供されてもよく、それにより、これらの命令はコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行され、フローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作を実現する手段を創出する。また、これらのコンピュータ読み取り可能プログラム命令は、コンピュータ読み取り可能記憶媒体に記憶し、それによってコンピュータ、プログラマブルデータ処理装置および／または他の機器を特定の方式で動作させるようにしてもよく、それにより、中に保存された命令を有するコンピュータ読み取り可能記憶媒体は、フローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作の各態様を実現する命令を含む製品を備える。

コンピュータ読み取り可能プログラムはコンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードすることにより、コンピュータ実施プロセスを生成するように、コンピュータ、他のプログラマブルデータ処理装置または他の機器において一連の動作ステップを実行させるようにしてもよく、それにより、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令はフローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作を実現する。

図面のうちフローチャートおよびブロック図は本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは一つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための一つ以上の実行可能命令を含む。いくつかの置換としての実現形態では、ブロックに表記される機能は図面に付したものと異なる順序で実現してもよい。例えば、二つの連続的なブロックは実質的に同時に実行してもよく、また、係る機能によって、それらは逆な順序で実行してもよい場合がある。なお、ブロック図および／またはフローチャートにおける各ブロック、およびブロック図および／またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことに注意すべきである。

以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に選ばれた用語は、各実施例の原理、実際の適用または市場における技術への技術的改善を好適に解釈するか、または他の当業者に本文に披露された各実施例を理解させるためのものである。

本開示の実施例の技術的解決手段において、第１データを第１処理モジュールに入力して予測されたデータラベリング結果を得、前記データラベリング結果を第２処理モジュールに入力して前記データラベリング結果に基づいてシーン自己適応の増分学習を行って、第２データのシーンへ順応したニューラルネットワークを得、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って前記ターゲットオブジェクトに対応するシーンへの処理を実現し、それによって、ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従ってターゲットオブジェクト対応シーンへの処理を実現し、得られた訓練データは実際の適用シーンのデータとの相違が大きくなく、適用シーンの処理要求を満足すると共に、コストを低くすることができる。

Claims

エッジデバイス側に適用され、第１データのラベリングのための第１処理モジュールと第２データのシーンへの順応のための第２処理モジュールを前記エッジデバイス側に配置する方法であって、
前記第１データを前記第１処理モジュールに入力して、予測されたデータラベリング結果を得るステップと、
前記データラベリング結果を前記第２処理モジュールに入力して、前記データラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るステップと、
ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するステップと、を含むターゲットオブジェクト処理方法。
前記シーンが現在の第１シーンであり、前記データラベリング結果に基づいて第１シーンの自己適応の増分学習を行って、前記第１シーンへ順応したニューラルネットワークを得た後、前記シーンが前記第１シーンから第２シーンに変換されたことを監視するステップと、
前記第２処理モジュール中のパラメータのパラメータリセットをトリガするステップと、
前記データラベリング結果に基づいて前記第２シーンの自己適応の増分学習を行って、前記第２シーンへ順応したニューラルネットワークを得るステップと、を更に含む請求項１に記載の方法。
前記ニューラルネットワークを得るステップの前に、
前記第２処理モジュール中のパラメータが更新される場合に、制限条件に基づいて前記パラメータ更新を制約するステップを更に含む請求項１又は２に記載の方法。
第１データを前記第１処理モジュールに入力して、予測されたデータラベリング結果を得る前記ステップは、
前記第１処理モジュールによるシーンデータの予測に基づいて、予測規則を得るステップと、
前記予測規則に基づいて前記第１データをラベリングして、予測されたデータラベリング結果を得るステップと、を含む請求項１に記載の方法。
前記予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力に由来するものであり、及び／又は、
前記予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力及び中間層の第２出力に由来するものである請求項１〜４のいずれか一項に記載の方法。
前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るステップを更に含み、
前記ニューラルネットワークを取得するステップの前に、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行うステップを更に含む請求項１に記載の方法。
前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行う前記ステップは、
前記１フレーム又は複数フレームの第１データに対して前記第１処理モジュールが取得した１つ又は複数のデータラベリング結果を前記第２処理モジュールに出力するステップと、
１つ又は複数のデータラベリング結果に基づいて前記第２処理モジュールを訓練して前記第２処理モジュール中のパラメータを更新するステップと、
予め設定されたポリシーによって前記サンプリングパラメータの数値を増加するステップと、を含む請求項６に記載の方法。
前記第１データを第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るステップを更に含み、
前記ニューラルネットワークを取得するステップの前に、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が小さく相違する場合に、予め設定されたポリシーによって前記サンプリングパラメータの数値を減少するステップを更に含む請求項１に記載の方法。
前記第１データを第１処理モジュールに入力する前に、前記第１データ中の一部のデータをオンラインテスト集合とするステップを更に含み、
前記ニューラルネットワークを取得するステップの前に、
前記オンラインテスト集合中の第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記第２処理モジュール中のパラメータをリセットするステップを更に含む請求項１に記載の方法。
前記ニューラルネットワークが得られた後、
複数の領域のエッジデバイスを監視して、アイドル状態の第１エッジデバイスを取得するステップと、
前記第１エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するステップと、を更に含む請求項１〜９のいずれか一項に記載の方法。
前記ニューラルネットワークが得られた後、
複数の領域のエッジデバイスを監視して、複数のエッジデバイス処理能力を取得するステップと、
前記複数のエッジデバイスのそれぞれに対応するエッジデバイス処理能力及び現在リソース消費に基づいて、前記複数のエッジデバイスから前記エッジデバイス処理能力が最も高い第２エッジデバイスを選定するステップと、
前記第２エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するステップと、を更に含む請求項１〜９のいずれか一項に記載の方法。
エッジデバイス側に配置される装置であって、
入力された第１データに基づいて、予測されたデータラベリング結果を得るように構成される第１処理モジュールと、
入力されたデータラベリング結果に基づいてシーン自己適応の増分学習を行って、前記第２データのシーンへ順応したニューラルネットワークを得るように構成される第２処理モジュールと、
ターゲットオブジェクトを含むデータ及び前記ニューラルネットワークに従って、前記ターゲットオブジェクトに対応するシーンへの処理を実現するように構成される第３処理モジュールと、を含むターゲットオブジェクト処理装置。
前記シーンが現在の第１シーンであり、前記データラベリング結果に基づいて第１シーンの自己適応の増分学習を行って、前記第１シーンへ順応したニューラルネットワークを得た後、前記シーンが前記第１シーンから第２シーンに変換されたことを監視するように構成される監視モジュールと、
前記第２処理モジュール中のパラメータのパラメータリセットをトリガするように構成されるリセットトリガモジュールと、を更に含み、
前記第２処理モジュールは、更に、前記データラベリング結果に基づいて前記第２シーンの自己適応の増分学習を行って、前記第２シーンへ順応したニューラルネットワークを得るように構成される請求項１２に記載の装置。
パラメータが更新される場合に、制限条件に基づいて前記パラメータ更新を制約するように構成されるパラメータ更新モジュールを更に含む請求項１２又は１３に記載の装置。
前記第１処理モジュールは、更に、
シーンデータについての予測に基づいて、予測規則を得、
前記予測規則に基づいて前記第１データをラベリングして、予測されたデータラベリング結果を得るように構成される請求項１２に記載の装置。
前記予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力に由来するものであり、及び／又は、
前記予測されたデータラベリング結果が、前記第１処理モジュールを構成するデータサンプル訓練ネットワーク出力層の第１出力及び中間層の第２出力に由来するものである請求項１２〜１５のいずれか一項に記載の装置。
前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るように構成される第４処理モジュールを更に含み、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記処理される第１データのうち、予測結果が大きく相違する１フレーム又は複数フレームの第１データに対して前記エッジデバイス側で前記シーン自己適応の増分学習を行うように構成される第５処理モジュールを更に含む請求項１２に記載の装置。
前記第５処理モジュールは、更に、
前記１フレーム又は複数フレームの第１データに対して前記第１処理モジュールが取得した１つ又は複数のデータラベリング結果を前記第２処理モジュールに出力し、
１つ又は複数のデータラベリング結果に基づいて前記第２処理モジュールを訓練して前記第２処理モジュール中のパラメータを更新し、
予め設定されたポリシーによって前記サンプリングパラメータの数値を増加するように構成される請求項１７に記載の装置。
前記第１データを前記第１処理モジュールに入力する前に、サンプリングパラメータに基づいて前記第１データを選択して、処理される第１データを得るように構成される第６処理モジュールを更に含み、
前記処理される第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が小さく相違する場合に、予め設定されたポリシーによって前記サンプリングパラメータの数値を減少するように構成される第７処理モジュールを更に含む請求項１２に記載の装置。
前記第１データを前記第１処理モジュールに入力する前に、前記第１データ中の一部のデータをオンラインテスト集合とするように構成される第８処理モジュールを更に含み、
前記オンラインテスト集合中の第１データについては、前記第１処理モジュールと前記第２処理モジュールがそれぞれ出力した予測結果が大きく相違する場合に、前記第２処理モジュール中のパラメータをリセットするように構成される第９処理モジュールを更に含む請求項１２に記載の装置。
前記ニューラルネットワークが得られた後、複数の領域のエッジデバイスを監視して、アイドル状態の第１エッジデバイスを取得するように構成される第１デバイス監視モジュールと、
第１エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するように構成される第１訓練処理モジュールと、を更に含む請求項１２〜２０のいずれか一項に記載の装置。
前記ニューラルネットワークが得られた後、複数の領域のエッジデバイスを監視して、複数のエッジデバイス処理能力を取得するように構成される第２デバイス監視モジュールと、
前記複数のエッジデバイスのそれぞれに対応するエッジデバイス処理能力及び現在リソース消費に基づいて、前記複数のエッジデバイスから前記エッジデバイス処理能力が最も高い第２エッジデバイスを選定するように構成されるデバイス選定処理モジュールと、
第２エッジデバイスに対応するエッジデバイス処理能力に従って、前記第２処理モジュールに第２データのシーンへの順応の自己適応増分訓練を実行するように構成される第２訓練処理モジュールと、を更に含む請求項１２〜２０のいずれか一項に記載の装置。
プロセッサと、
プロセッサ実行可能コマンドを記憶するためのメモリと、を含み、
前記プロセッサが請求項１〜１１のいずれか一項に記載の方法を実行するように構成される電子機器。
実行可能なコマンドが記憶されているコンピュータ記憶媒体であって、前記実行可能なコマンドがプロセッサにより実行される時に請求項１〜１１のいずれか一項に記載の方法を実現するコンピュータ記憶媒体。