JP2021507397A

JP2021507397A - 画像処理方法、訓練方法、装置、機器、媒体及びプログラム

Info

Publication number: JP2021507397A
Application number: JP2020533824A
Authority: JP
Inventors: イーウェイ; ホンウェイチン
Original assignee: ベイジンセンスタイムテクノロジーデベロップメントカンパニー，リミテッド
Priority date: 2018-04-25
Filing date: 2018-11-21
Publication date: 2021-02-22
Also published as: KR20200087807A; SG11201912721YA; WO2019205604A1; US20200104642A1; KR102478000B1; CN108830288A; US11334763B2

Abstract

本願の実施形態は画像処理方法、訓練方法、装置、機器、媒体及びプログラム、画像処理方法を開示し、画像処理方法は、被処理画像をニューラルネットワークに入力する工程と、前記ニューラルネットワークを介して前記被処理画像の離散的特徴データを形成する工程と、を備え、前記ニューラルネットワークは、ガイド情報に基づいて訓練されたものであり、且つ訓練中に、生徒ニューラルネットワークとされ、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの前記画像サンプルに対して形成した離散的特徴データとの間の差異を含む。本願の提供する技術案は、ニューラルネットワークの規模を小さくし、ニューラルネットワークの動作速度を向上させる上で、ニューラルネットワークの出力結果の正確性を向上させることに有利であり、つまりニューラルネットワークの性能の向上に有利である。

Description

（関連出願の相互参照）
本願は、２０１８年４月２５日に中国特許局に提出された、出願番号ＣＮ２０１８１０３８０４５３．Ｘ、発明の名称「画像処理方法、ニューラルネットワークの訓練方法、装置、機器及び媒体」の中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。

本願は、コンピュータビジョン技術に関し、特に、画像処理方法、画像処理装置、ニューラルネットワークの訓練方法、ニューラルネットワークの訓練装置、電子機器、コンピュータ読み取り可能記憶媒体及びコンピュータプログラムに関する。

ニューラルネットワーク（例えば、畳み込みニューラルネットワーク等）は、数多くのコンピュータビジョンタスクにおいて、広く適用されている。

現在、いくつかのニューラルネットワークは、その膨大な計算量やパラメータ量等の要素により、そのままスマートホンやデジタルカメラ等の電子機器に適用できない。圧縮技術は、一般的に、ニューラルネットワークの規模を小さくし、ニューラルネットワークの動作速度を向上させることができるが、ニューラルネットワークの正確性を悪くする場合が多い。

如何にニューラルネットワークの規模を小さくし、ニューラルネットワークの動作速度を向上させる上で、ニューラルネットワークの一定の正確性を保証するかは、注目される技術問題である。

本願の実施形態は、画像処理及びニューラルネットワークの訓練の技術案を提供する。

本願の実施形態における１つの態様によれば、被処理画像をニューラルネットワークに入力する工程と、前記ニューラルネットワークを介して前記被処理画像の離散的特徴データを形成する工程と、を備え、前記ニューラルネットワークは、ガイド情報に基づいて訓練されたものであり、且つ訓練中に、生徒ニューラルネットワークとされ、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの前記画像サンプルに対して形成した離散的特徴データとの間の差異を含む画像処理方法を提供する。

本願の一実施形態において、前記ニューラルネットワークは、大きさが２Ｍを超えないニューラルネットワークを含む。

本願のまた１つの実施形態において、前記ニューラルネットワークを介して前記被処理画像の離散的特徴データを形成する前記工程は、前記ニューラルネットワークを介して前記被処理画像の浮動小数点特徴データを形成して前記被処理画像の離散的特徴データに量子化する工程を含む。

本願のもう１つの実施形態において、前記ニューラルネットワークを介して前記被処理画像の浮動小数点特徴データを形成する前記工程は、前記ニューラルネットワークを介して前記被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して、前記被処理画像の浮動小数点特徴データを形成する工程を含む。

本願のもう１つの実施形態において、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換する前記工程は、前記浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換する工程、及び／又は、前記浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する工程を含む。

本願のもう１つの実施形態において、前記方法は、前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して相応のビジョンタスク処理を行う工程を更に備える。

本願のもう１つの実施形態において、前記ガイド情報は、生徒ニューラルネットワークの画像サンプルに対して出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を更に含む。

本願のもう１つの実施形態において、前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して相応のビジョンタスク処理を行う前記工程は、前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して分類処理を行う工程、又は、前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して物体検出処理を行う工程を更に含む。

本願のもう１つの実施形態において、前記ガイド情報は、前記生徒ニューラルネットワークの画像サンプルに対して出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異、又は、前記生徒ニューラルネットワークの画像サンプルに対して出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異を更に含む。

本願のもう１つの実施形態において、前記ニューラルネットワークの訓練過程は、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する工程と、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成する工程と、ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程と、を含み、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含む。

本願のもう１つの実施形態において、前記ニューラルネットワークの訓練過程は、前記生徒ニューラルネットワークを介して、前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程を更に含み、前記ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程を含む。

本願のもう１つの実施形態において、前記教師ニューラルネットワークは、入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにするための量子化補助ユニットと、を含む。

本願のもう１つの実施形態において、前記教師ニューラルネットワークの訓練過程は、画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力する工程と、うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して前記離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程と、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行う工程と、を含む。

本願のもう１つの実施形態において、前記浮動小数点教師ニューラルネットワークの訓練過程は、画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力する工程と、被訓練の浮動小数点教師ニューラルネットワークを介して前記画像サンプルの浮動小数点特徴データを抽出して、前記浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程と、前記ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、前記被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行う工程と、を含む。

本願の実施形態における別の態様によれば、被訓練のニューラルネットワークが訓練中に、生徒ニューラルネットワークとされるニューラルネットワークの訓練方法であって、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する工程と、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成する工程と、ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程と、を備え、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含むニューラルネットワークの訓練方法を提供する。

本願の一実施形態において、前記ニューラルネットワークが生徒ニューラルネットワークとされる訓練過程は、前記生徒ニューラルネットワークを介して、前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程を含み、前記ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程を含む。

本願のまた１つの実施形態において、前記教師ニューラルネットワークは、入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにするための量子化補助ユニットと、を含む。

本願の実施形態におけるまた１つの態様によれば、被処理画像をニューラルネットワークに入力するための入力画像モジュールと、前記被処理画像の離散的特徴データを形成するためのニューラルネットワークと、を含み、前記ニューラルネットワークは、ガイド情報に基づいて訓練されたものであり、且つ訓練中に、生徒ニューラルネットワークとされ、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの前記画像サンプルに対して形成した離散的特徴データとの間の差異を含む画像処理装置を提供する。

本願のまた１つの実施形態において、前記ニューラルネットワークは、更に、前記被処理画像の浮動小数点特徴データを形成して前記被処理画像の離散的特徴データに量子化する工程に用いられる。

本願のもう１つの実施形態において、前記ニューラルネットワークは、前記被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して、前記被処理画像の浮動小数点特徴データを形成する。

本願のもう１つの実施形態において、前記ニューラルネットワークは、前記浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換し、及び／又は、前記浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する。

本願のもう１つの実施形態において、前記ニューラルネットワークは、更に、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して相応のビジョンタスク処理を行う工程に用いられる。

本願のもう１つの実施形態において、前記ニューラルネットワークは、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して分類処理を行い、又は、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して物体検出処理を行う。

本願のもう１つの実施形態において、前記装置は、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力して、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成するための入力画像サンプルモジュールと、ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行うための監視モジュールと、を更に含み、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含む。

本願のもう１つの実施形態において、前記生徒ニューラルネットワークが前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる場合、前記監視モジュールは、更に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程に用いられる。

本願のもう１つの実施形態において、前記装置は、前記教師ニューラルネットワークを訓練するための教師訓練モジュールを更に含み、前記教師訓練モジュールは、画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力して、うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して前記離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うための第１ユニットと、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行うための第１監視ユニットと、を含む。

本願のもう１つの実施形態において、前記教師訓練モジュールは、画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力して、被訓練の浮動小数点教師ニューラルネットワークを介して前記画像サンプルの浮動小数点特徴データを抽出して、前記浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うための第２ユニットと、前記ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、前記被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行うための第２監視ユニットと、を更に含む。

本願の実施形態におけるもう１つの態様によれば、被訓練のニューラルネットワークが生徒ニューラルネットワークとされるニューラルネットワークの訓練装置において、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力して、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成するための入力画像サンプルモジュールと、ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行うための監視モジュールと、を含み、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含むニューラルネットワークの訓練装置を提供する。

本願の一実施形態において、前記生徒ニューラルネットワークが前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる場合、前記監視モジュールは、更に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程に用いられる。

本願の実施形態におけるもう１つの態様によれば、コンピュータプログラムを記憶するためのメモリと、前記メモリに記憶されるコンピュータプログラムを実行することに用いられ、且つ前記コンピュータプログラムが実行される場合、本願の何れの方法の実施形態を実現するプロセッサと、を含む電子機器を提供する。

本願の実施形態におけるまた１つの態様によれば、コンピュータプログラムが記憶されるコンピュータ読み取り可能記憶媒体において、前記コンピュータプログラムがプロセッサにより実行される場合、本願の何れの方法の実施形態を実現するコンピュータ読み取り可能記憶媒体を提供する。

本願の実施形態におけるまた１つの態様によれば、コンピュータ命令を含むコンピュータプログラムにおいて、前記コンピュータ命令が機器のプロセッサにおいて動作される場合、本願の何れの方法の実施形態を実現するコンピュータプログラムを提供する。

本願の提供する画像処理方法、画像処理装置、ニューラルネットワーク訓練方法、ニューラルネットワーク訓練装置、電子機器、コンピュータ読み取り可能記憶媒体及びコンピュータプログラムに基づいて、ニューラルネットワークの訓練中、被訓練のニューラルネットワークを生徒ニューラルネットワークとして、ガイド情報が教師ニューラルネットワークの形成した離散的特徴データと生徒ニューラルネットワークの形成した離散的特徴データとの間の差異を含むようにすることで、教師ニューラルネットワーク及び生徒ニューラルネットワークのそれぞれの形成した離散的特徴データのマッチング確率の向上に有利であり、教師ニューラルネットワークの知識を生徒ニューラルネットワークに遷移させることに有利である。本願は、生徒ニューラルネットワークのネットワークパラメータが必ず固定小数点ネットワークパラメータであると制限しないので、本願のニューラルネットワークは、特定の命令セット及び特定の機器により制限されないことができる。これにより、本願の提供する技術案は、ニューラルネットワークの規模を小さくし、ニューラルネットワークの動作速度を向上させる上で、ニューラルネットワークの出力結果の正確性を向上させることに有利であり、つまりニューラルネットワークの性能の向上に有利であることが判明される。また、本願の提供する技術案は、ニューラルネットワークの適用範囲の向上にも有利である。

以下、図面及び実施形態を通じて本願の技術的手段をさらに詳しく説明する。

本願の画像処理方法の１つの実施例のフローチャートである。本願の画像処理方法の別の実施例のフローチャートである。本願の画像処理方法のまた別の実施例のフローチャートである。本願の画像処理方法のまた１つの実施例のフローチャートである。本願のニューラルネットワークの訓練方法の１つの実施例のフローチャートである。本願のニューラルネットワークの訓練方法の別の実施例のフローチャートである。本願のニューラルネットワークの訓練方法のまた別の実施例のフローチャートである。本願の教師ニューラルネットワークの訓練方法の１つの実施例のフローチャートである。本願の浮動小数点教師ニューラルネットワークの訓練方法の１つの実施例のフローチャートである。本願の画像処理装置の１つの実施例の構造模式図である。本願のニューラルネットワークの訓練装置の１つの実施例の構造模式図である。本願の実施例を実現する例示的な機器のブロック図である。

明細書の一部を構成する図面は、本願の実施形態を説明し、その説明と共に本願の原理を解釈することに用いられる。

図面を参照し、以下の詳細な説明により本願をより明瞭に理解することができる。

ここで、図面を参照しながら本願の様々な例示的な実施例を詳細に説明する。なお、特に断らない限り、これらの実施例で記述した部材及び操作の相対的配置、数式及び値は本願の範囲を限定するものではないことに注意すべきである。

同時に、説明の便宜上、図面に示した各部分の寸法は実際の比例関係に従って描いたものではないことを理解すべきである。

以下の少なくとも一つの例示的な実施例に対する説明は実際に説明的なものに過ぎず、本願及びその適用または使用へのなんらの制限にもならない。

関連分野の当業者に既知の技術、方法及び機器については、詳細に説明しない場合があるが、場合によって、前記技術、方法及び機器は明細書の一部と見なすべきである。

なお、類似する符号及び英文字は以下の図面において類似項目を表し、従って、ある一項が一つの図面において定義されれば、以降の図面においてそれをさらに説明する必要がないことに注意すべきである。

本願の実施例は端末装置、コンピュータシステム及びサーバなどの電子機器に適用可能であり、それは他の様々な共通または専用計算システム環境または構成と共に動作可能である。端末装置、コンピュータシステム及びサーバなどの電子機器との併用に適する公知の端末装置、計算システム、環境及び／または構成の例は、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、ファットクライアント、手持ちまたはラップトップデバイス、マイクロプロセッサに基づくシステム、セットトップボックス、プログラマブル消費者用電子機器、ネットワークパソコン、小型コンピュータシステム、大型コンピュータシステム及び前記の任意のシステムを含む分散型クラウドコンピューティング技術環境などを含むが、これらに限定されない。

端末装置、コンピュータシステム及びサーバなどの電子機器はコンピュータシステムにより実行されるコンピュータシステム実行可能コマンド（例えば、プログラムモジュール）の一般的な言語環境において記述できる。通常、プログラムモジュールはルーチン、プログラム、目的プログラム、コンポーネント、ロジック、データ構造などを含んでよく、それらは特定のタスクを実行するかまたは特定の抽象データ型を実現する。コンピュータシステム／サーバは分散型クラウドコンピューティング環境において実施でき、分散型クラウドコンピューティング環境において、タスクは通信ネットワークにわたってリンクされた遠隔処理機器により実行される。分散型クラウドコンピューティング環境において、プログラムモジュールは記憶機器を含むローカルまたは遠隔計算システムの記憶媒体に存在してよい。

＜例示的実施例＞
図１は、本願の画像処理方法の１つの実施例のフローチャートである。図１に示すように、前記実施例の方法は、操作Ｓ１００及び操作Ｓ１１０を備える。以下、図１における各操作のそれぞれについて詳しく説明する。

Ｓ１００において、被処理画像をニューラルネットワークに入力する。

１つの選択可能な一例において、本願における被処理画像は、静的状態であるピクチャ又は写真等の画像であってもよいし、例えば、撮像装置で撮像されたビデオにおけるビデオフレーム等のような、動的状態であるビデオにおけるビデオフレームであってもよい。前記被処理画像は、被処理原画像の一部（つまり被処理原画像から切り出された、被処理原画像の一部の内容を含む画像ブロック）であってもよいし、完全な被処理原画像を含んでもよい。もちろん、前記被処理画像は、被処理原画像の所定の処理が行われた画像の一部であってもよいし、被処理原画像の所定の処理が行われた画像の全内容を含んでもよい。本願は、被処理画像の表現形態を制限しない。

１つの選択可能な一例において、本願における被処理画像の大きさは、一般的に、ニューラルネットワークの入力画像に対する大きさ要求に関連し、例えば、２５６×２５６等であってよい。所定の大きさを有する被処理画像を取得するために、本願は、被処理画像に対して相応の比率の拡縮処理を行ってよい。本願は、被処理画像の大きさ及び拡縮処理の実現形態を制限しない。

１つの選択可能な一例において、本願におけるニューラルネットワークは、大きさが２Ｍを超えないニューラルネットワークであってよい。つまり、前記ニューラルネットワークの記憶空間は２Ｍを超えなくてよい。従来の数十メガ、ひいては数百メガの大きさのニューラルネットワークに比べると、本願におけるニューラルネットワークは、極めて小さいニューラルネットワークと呼ばれてもよい。

１つの選択可能な一例において、本願のニューラルネットワークは、畳み込み層、非線形Ｒｅｌｕ層、プーリング層及び全接続層等を含んでもよいが、それらに限定されない。前記ニューラルネットワークは、ディープニューラルネットワークであってよく、それに含まれる層数が多いほど、ネットワークが深い。本願のニューラルネットワークは、畳み込みニューラルネットワークであってよい。本願のニューラルネットワークのネットワーク構造は、実際のビジョンタスクの要求に応じて、柔軟的に設計されてよく、本願の実施例により制限されない。例えば、本願のニューラルネットワークのネットワーク構造としては、ＡＬｅｘＮｅｔ、デプスレジデュアルネットワーク（ＤｅｅｐＲｅｓｉｄｕａｌＮｅｔｗｏｒｋ、ＲｅｓＮｅｔ）又はＶＧＧｎｅｔ（ＶｉｓｕａｌＧｅｏｍｅｔｒｙＧｒｏｕｐＮｅｔｗｏｒｋ、視覚幾何学グループネットワーク）等のニューラルネットワークに用いられるネットワーク構造を採用してよいが、それらに限定されない。

１つの選択可能な一例において、本願におけるニューラルネットワークは、知識遷移の形態に基づいて訓練されたものである。つまり、本願におけるニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。また、前記ニューラルネットワークの訓練中に、用いられるガイド情報は、一般的に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含む。つまり、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データは、生徒ニューラルネットワークを訓練する監視信号とされている。ニューラルネットワークの訓練に用いられる損失関数は、Ｌ２損失関数等を含んでよい。前記ニューラルネットワークの訓練過程については、下記図５〜図７についての記述を参照してよいので、ここで繰り返して説明しない。また説明すべきなのは、本願における離散的特徴データは、固定小数点特徴データと呼ばれてもよい。本願において、特徴データは、少なくとも１つの特徴ベクトル、少なくとも１つの特徴マップ又は他の形態を含んでよい。

１つの選択可能な一例において、本願における教師ニューラルネットワークのネットワークパラメータは、必ずしも固定小数点ネットワークパラメータである必要はなく、つまり、浮動小数点ネットワークパラメータであってもよく、教師ニューラルネットワークは、浮動小数点演算を行うことができるが、教師ニューラルネットワークの最終的に形成する特徴データは離散的特徴データであり、即ち、教師ニューラルネットワークの画像に対して抽出した浮動小数点特徴データが量子化処理された後で、離散的特徴データを形成する。これにより、本願の教師ニューラルネットワークは、量子化教師ニューラルネットワークと呼ばれてもよいことが判明される。量子化教師ニューラルネットワークによって生徒ニューラルネットワークを訓練することで、量子化教師ニューラルネットワークの知識を生徒ニューラルネットワークに遷移させることができ、且つ生徒ニューラルネットワークのネットワークパラメータも必ずしも固定小数点ネットワークパラメータである必要はなく、つまり、浮動小数点ネットワークパラメータであってもよく、生徒ニューラルネットワークは、浮動小数点演算を行うことができるので、うまく訓練された後で、特定の命令セット及び特定の機器に制限されないことができ、ニューラルネットワークの適用範囲の向上に有利である。

１つの選択可能な一例において、前記操作Ｓ１００は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像モジュール１０００により実行されてもよい。

Ｓ１１０において、ニューラルネットワークを介して被処理画像の離散的特徴データを形成する。

１つの選択可能な一例において、本願におけるニューラルネットワークは、まず被処理画像の浮動小数点特徴データを形成し、その後、前記浮動小数点特徴データを離散的特徴データに量子化し、量子化された離散的特徴データはニューラルネットワークの形成した被処理画像の離散的特徴データである。本願におけるニューラルネットワークが被処理画像の浮動小数点特徴データを形成する１つの選択可能な一例としては、ニューラルネットワークは、被処理画像に対して、浮動小数点特徴データを抽出して、浮動小数点特徴データ（下記で初期浮動小数点特徴データと称する）を取得し、一般的には、前記初期浮動小数点特徴データが予め浮動小数点特徴データに対して規定された所定の要求を満たしていないので、取得した初期浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換することができ、所定の要求を満たしている前記浮動小数点特徴データはニューラルネットワークの形成した被処理画像の浮動小数点特徴データである。

１つの選択可能な一例において、本願におけるニューラルネットワークが浮動小数点特徴データを離散的特徴データに量子化する形態としては、特徴データにおける浮動小数点数を相応の固定小数点数に転換させることを含んでよく、例えば、特徴データにおける［ｋ−０．５、ｋ＋０．５］の区間にある浮動小数点数を全てｋに転換させ、ｋは整数である。本願は、ニューラルネットワークが浮動小数点特徴データを離散的特徴データに量子化する実現形態を制限しない。

１つの選択可能な一例において、本願における所定の要求は、実際の要求に応じて柔軟的に設計されてよく、例えば、チャンネル数に対する要求及び特徴データの大きさに対する要求等の少なくとも１つを含んでよい。選択的に、所定の要求は、特徴データが所定のチャンネル数を有すべきであることを規定し、且つ特徴データが所定の大きさを有すべきであることを規定してよく、即ち、特徴データの長さ及び幅は要求を満たすべきである。

１つの選択可能な一例において、本願のニューラルネットワークの形成した初期浮動小数点特徴データのチャンネル数は、実際の要求に応じて設置されてよく、例えば、ＶＧＧ（ＶｉｓｕａｌＧｅｏｍｅｔｒｙＧｒｏｕｐ、視覚幾何学グループ）ニューラルネットワークのチャンネル数の３２分の１であってよく、転換された離散的特徴データのチャンネル数はＶＧＧニューラルネットワークのチャンネル数であってよい。本願は、畳み込み層等の技術によって、初期浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換することができる。本願は、初期浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換する実現形態を制限しない。

１つの選択可能な一例において、本願は、アップサンプリング等の技術によって、初期浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換することができる。アップサンプリングは、逆畳み込み層によって実現されてよい。本願は、初期浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する実現形態を制限しない。

１つの選択可能な一例において、本願のニューラルネットワークは、被処理画像の離散的特徴データを形成することのみならず、被処理画像の離散的特徴データに基づいて被処理画像に対して相応のビジョンタスク処理を行うことにも用いられる。本願におけるビジョンタスク処理は、実際の要求に応じて柔軟的に設けられてよく、例えば、分類処理又は物体検出処理等であってよい。つまり、本願におけるニューラルネットワークは、その形成した被処理画像の離散的特徴データに基づいて、被処理画像に対して分類処理を行って、被処理画像の属するカテゴリ（例えば、猫又は犬又は人又は車両等のカテゴリ）を確定することができる。本願におけるニューラルネットワークは、その形成した被処理画像の離散的特徴データに基づいて、被処理画像に対して物体検出処理を行って、被処理画像における検出枠の位置やカテゴリ（例えば、検出枠の対角線における２つの頂点の座標及び検出枠のカテゴリ）を確定することができる。本願における検出枠は、外接枠等と呼ばれてもよい。本願は、ビジョンタスク処理の表現形態を制限しない。

１つの選択可能な一例において、本願のニューラルネットワークが被処理画像に対して相応のビジョンタスク処理を行う場合、本願のニューラルネットワークの訓練に用いられるガイド情報は、一般的に、ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を含む。つまり、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データが生徒ニューラルネットワークを訓練する監視信号とされていると共に、画像サンプルのタグ付け情報も同様に生徒ニューラルネットワークを訓練する監視信号とされている。

１つの選択可能な一例において、本願のニューラルネットワークが被処理画像の離散的特徴データを形成することのみならず、被処理画像の離散的特徴データに基づいて、被処理画像に対して分類処理を行うことに用いられる場合、ニューラルネットワークの訓練中、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データ及び画像サンプルの分類タグ付け情報の何れも、生徒ニューラルネットワークを訓練する監視信号とされている。つまり、生徒ニューラルネットワークの出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異、及び教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異の何れも、訓練生徒ニューラルネットワークのガイド情報とされている。

１つの選択可能な一例において、本願のニューラルネットワークが被処理画像の離散的特徴データを形成することのみならず、被処理画像の離散的特徴データに基づいて、被処理画像に対して物体検出処理を行うことに用いられる場合、ニューラルネットワークの訓練中、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データ及び画像サンプルの検出枠タグ付け情報の何れも、生徒ニューラルネットワークを訓練する監視信号とされている。つまり、生徒ニューラルネットワークの出力した物体検出処理結果（例えば、検出枠の位置や分類情報）と画像サンプルの検出枠タグ付け情報（例えば、検出枠の位置タグ付け情報や分類タグ付け情報）との間の差異、及び教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異の何れも、訓練生徒ニューラルネットワークのガイド情報とされている。

１つの選択可能な一例において、前記操作Ｓ１１０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作されるニューラルネットワーク１０１０によって実行されてもよい。

図２は、本願の画像処理方法の別の実施例のフローチャートである。図２に示すように、前記実施例の方法は、操作Ｓ２００、操作Ｓ２１０及び操作Ｓ２２０を備える。以下、図２における各操作のそれぞれについて詳しく説明する。

Ｓ２００において、被処理画像をニューラルネットワークに入力する。

１つの選択可能な一例において、本願のニューラルネットワークは、一般的に、大きさが２Ｍを超えないニューラルネットワークを含む。前記ニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。前記ニューラルネットワークの訓練中に、用いられるガイド情報は、一般的に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの画像サンプルに対してビジョンタスク処理を行ったビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を含む。つまり、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データ及び画像サンプルのタグ付け情報は、生徒ニューラルネットワークを訓練する監視信号とされている。ニューラルネットワークの訓練に用いられる損失関数は、Ｌ２損失関数等を含んでよい。前記操作に関連するネットワーク構造及び被処理画像等の内容については、上記方法の実施形態におけるＳ１００についての記述を参照してよいので、ここで詳しく説明しない。

１つの選択可能な一例において、前記操作Ｓ２００は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像モジュール１０００により実行されてもよい。

Ｓ２１０において、ニューラルネットワークを介して被処理画像の離散的特徴データを形成する。

１つの選択可能な一例において、前記ニューラルネットワークは、まず前記被処理画像の浮動小数点特徴データを形成してよく、選択的に、被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して（例えば、浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換し、別の例として、浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する）、被処理画像の浮動小数点特徴データを形成する。ニューラルネットワークは、被処理画像の浮動小数点特徴データを形成した後でまた被処理画像の離散的特徴データに量子化し、例えば、浮動小数点特徴データにおける浮動小数点数を相応の固定小数点数に転換する等となる。前記操作の内容については、上記方法の実施形態におけるＳ１１０についての関連記述を参照してよいので、ここで詳しく説明しない。

Ｓ２２０において、ニューラルネットワークを介して、被処理画像の離散的特徴データに基づいて被処理画像に対して相応のビジョンタスク処理を行う。前記ビジョンタスク処理は、実際の要求に応じて柔軟的に設けられてよく、前記操作の内容については、上記方法の実施形態におけるＳ１１０についての関連記述を参照してよいので、ここで詳しく説明しない。

１つの選択可能な一例において、前記操作Ｓ２１０及びＳ２２０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作されるニューラルネットワーク１０１０によって実行されてもよい。

図３は、本願の画像処理方法のまた別の実施例のフローチャートである。図３に示すように、前記実施例の方法は、操作Ｓ３００、操作Ｓ３１０及び操作Ｓ３２０を備える。以下、図３における各操作のそれぞれについて詳しく説明する。

Ｓ３００において、被処理画像をニューラルネットワークに入力する。

１つの選択可能な一例において、本願のニューラルネットワークは、一般的に、大きさが２Ｍを超えないニューラルネットワークを含む。前記ニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。前記ニューラルネットワークの訓練中に、用いられるガイド情報は、一般的に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの画像サンプルに対して行われた分類処理の分類処理結果と画像サンプルの分類タグ付け情報との間の差異を含む。つまり、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データ及び画像サンプルの分類タグ付け情報は、生徒ニューラルネットワークを訓練する監視信号とされている。ニューラルネットワークの訓練に用いられる損失関数は、Ｌ２損失関数等を含んでよい。前記操作に関連するネットワーク構造及び被処理画像等の内容については、上記方法の実施形態におけるＳ１００についての記述を参照してよいので、ここで詳しく説明しない。

１つの選択可能な一例において、前記操作Ｓ３００は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像モジュール１０００により実行されてもよい。

Ｓ３１０において、ニューラルネットワークを介して被処理画像の離散的特徴データを形成する。

Ｓ３２０において、ニューラルネットワークを介して、被処理画像の離散的特徴データに基づいて、被処理画像に対して分類処理を行う。前記分類処理のカテゴリの数や内容は、実際の要求に応じて柔軟的に設置されてよい。

１つの選択可能な一例において、前記操作Ｓ３１０及びＳ３２０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作されるニューラルネットワーク１０１０によって実行されてもよい。

図４は、本願の画像処理方法のまた１つの実施例のフローチャートである。図４に示すように、前記実施例の方法は、操作Ｓ４００、操作Ｓ４１０及び操作Ｓ４２０を備える。以下、図４における各操作のそれぞれについて詳しく説明する。

Ｓ４００において、被処理画像をニューラルネットワークに入力する。

１つの選択可能な一例において、本願のニューラルネットワークは、一般的に、大きさが２Ｍを超えないニューラルネットワークを含む。前記ニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。前記ニューラルネットワークの訓練中に、用いられるガイド情報は、一般的に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの画像サンプルに対して行われた物体検出処理の物体検出処理結果と画像サンプルの検出枠タグ付け情報（例えば、検出枠の位置タグ付け情報やカテゴリタグ付け情報等）との間の差異を含む。つまり、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データ及び画像サンプルの検出枠タグ付け情報の何れも、生徒ニューラルネットワークを訓練する監視信号とされている。ニューラルネットワークの訓練に用いられる損失関数は、Ｌ２損失関数等を含んでよい。前記操作に関連するネットワーク構造及び被処理画像等の内容については、上記方法の実施形態におけるＳ１００についての記述を参照してよいので、ここで詳しく説明しない。

１つの選択可能な一例において、前記操作Ｓ４００は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像モジュール１０００により実行されてもよい。

Ｓ４１０において、ニューラルネットワークを介して被処理画像の離散的特徴データを形成する。

１つの選択可能な一例において、前記ニューラルネットワークは、まず前記被処理画像の浮動小数点特徴データを形成してよく、選択的に、被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して（例えば、浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換し、別の例として、浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する）、被処理画像の浮動小数点特徴データを形成する。ニューラルネットワーク型は、被処理画像の浮動小数点特徴データを形成した後でまた被処理画像の離散的特徴データに量子化し、例えば、浮動小数点特徴データにおける浮動小数点数を相応の固定小数点数に転換する等となる。前記操作の内容については、上記方法の実施形態におけるＳ１１０についての関連記述を参照してよいので、ここで詳しく説明しない。

Ｓ４２０において、ニューラルネットワークを介して、被処理画像の離散的特徴データに基づいて、被処理画像に対して物体検出処理を行う。前記物体検出処理に関連する検出枠のカテゴリの数や内容は、実際の要求に応じて柔軟的に設置されてよい。

１つの選択可能な一例において、前記操作Ｓ４１０及びＳ４２０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作されるニューラルネットワーク１０１０によって実行されてもよい。

図５は、本願のニューラルネットワークの訓練方法の１つの実施例のフローチャートである。被訓練のニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。図５に示すように、前記実施例の方法は、操作Ｓ５００、操作Ｓ５１０及び操作Ｓ５２０を備える。以下、図５における各操作のそれぞれについて詳しく説明する。

Ｓ５００において、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する。

１つの選択可能な一例において、本願は、訓練データセットから画像サンプルを取得することができる。本願における訓練データセットにはニューラルネットワークを訓練するための複数の画像サンプルを含み、一般的には、各々の画像サンプルの何れにも相応のビジョンタスクに関連するタグ付け情報が設置されている。例えば、画像サンプルのタグ付け情報は、画像サンプルの分類タグ付け情報を含んでよい。別の例として、画像サンプルのタグ付け情報は、画像サンプルの検出枠の位置タグ付け情報や分類タグ付け情報等を含んでもよい。本願は、ランダムに読み取るように、又は画像サンプルの配列順序によって順次に読み取るように、一度に訓練データセットから１つ又は複数の画像サンプルを読み取ってよい。

１つの選択可能な一例において、本願の生徒ニューラルネットワーク及び教師ニューラルネットワークに提供する画像サンプルの大きさは、一般的に、ニューラルネットワークの入力画像に対する大きさ要求に関連し、例えば、画像サンプルの大きさは２５６×２５６等であってよい。所定の大きさを有する画像サンプルを取得するために、本願は、読み取られた画像サンプルに対して拡縮処理を行って、生徒ニューラルネットワーク及び教師ニューラルネットワークに提供された各々の画像サンプルがそれぞれ所定の大きさを有するようにすることができる。本願は、画像サンプルの大きさ及び拡縮処理の実現形態を制限しない。

１つの選択可能な一例において、本願における教師ニューラルネットワークのネットワークパラメータは、必ずしも固定小数点ネットワークパラメータである必要はなく、つまり、浮動小数点ネットワークパラメータであってもよく、教師ニューラルネットワークは、浮動小数点演算を行うことができるが、教師ニューラルネットワークの最終的に形成する特徴データは離散的特徴データであり、即ち、教師ニューラルネットワークの画像サンプルに対して抽出された浮動小数点特徴データが量子化処理された後で、離散的特徴データを形成する。本願は、離散的特徴データを形成する教師ニューラルネットワークによって生徒ニューラルネットワークを訓練することで、教師ニューラルネットワークの知識を生徒ニューラルネットワークに遷移させることができ、且つ生徒ニューラルネットワークのネットワークパラメータも必ずしも固定小数点ネットワークパラメータである必要はなく、つまり、浮動小数点ネットワークパラメータであってもよく、生徒ニューラルネットワークは、浮動小数点演算を行うことができるので、うまく訓練された後で、特定の命令セット及び特定の機器に制限されないことができ、ニューラルネットワークの適用範囲の向上に有利である一方、浮動小数点演算で取得した浮動小数点特徴データが量子化によって離散的特徴データに転換された後で、離散的特徴データに良好な正確性を保持させることができ、且つ教師ニューラルネットワークの出力した離散的特徴データと生徒ニューラルネットワークの出力した離散的特徴データとのマッチングに有利であるので、教師ニューラルネットワークの知識を生徒ニューラルネットワークに良好に遷移させることに有利であり、ニューラルネットワークの性能の向上に有利である。

Ｓ５１０において、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ画像サンプルの離散的特徴データを形成する。

１つの選択可能な一例において、生徒ニューラルネットワークは、まず前記画像サンプルの浮動小数点特徴データを形成し、選択的に、画像サンプルに対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して（例えば、浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換し、別の例として、浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する）、画像サンプルの浮動小数点特徴データを形成してよい。生徒ニューラルネットワークは、画像サンプルの浮動小数点特徴データを形成してから、前記浮動小数点特徴データを画像サンプルの離散的特徴データに量子化し、例えば、浮動小数点特徴データにおける浮動小数点数を相応の固定小数点数に転換する等となる。同様に、教師ニューラルネットワークは、まず前記画像サンプルの浮動小数点特徴データを形成し、選択的に、画像サンプルに対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して（例えば、浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換し、別の例として、浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する）、画像サンプルの浮動小数点特徴データを形成してよい。教師ニューラルネットワークは、画像サンプルの浮動小数点特徴データを形成してから、前記浮動小数点特徴データを画像サンプルの離散的特徴データに量子化し、例えば、浮動小数点特徴データにおける浮動小数点数を相応の固定小数点数に転換する等となる。

１つの選択可能な一例において、前記操作Ｓ５００及びＳ５１０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像サンプルモジュール１０２０により実行されてもよい。

Ｓ５２０において、ガイド情報に基づいて、生徒ニューラルネットワークに対して教師あり学習を行う。

１つの選択可能な一例において、本願のガイド情報は、一般的に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含む。また、本願のガイド情報は、一般的に、生徒ニューラルネットワークの出力した相応のビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を更に含む。つまり、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データは、生徒ニューラルネットワークを訓練する監視信号とされていると共に、画像サンプルのタグ付け情報も同様に生徒ニューラルネットワークを訓練する監視信号とされている。本願は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を小さくし、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を小さくするために、相応の損失関数（例えば、Ｌ２損失関数）によって、生徒ニューラルネットワークに対して教師あり学習を行うことができる。

１つの選択可能な一例において、生徒ニューラルネットワークに対する訓練が所定の反複条件を達成する場合、今回、訓練過程は終了する。本願における所定の反複条件は、生徒ニューラルネットワークの出力した離散的特徴データと教師ニューラルネットワークの出力した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異の何れも所定の差異要求を満たしていることを含んでよい。差異が前記所定の差異要求を満たしている場合、今回、生徒ニューラルネットワークはうまく訓練されて終了する。本願における所定の反複条件は、生徒ニューラルネットワークに対して訓練を行って、用いられる画像サンプルの数が所定の数の要求に達成すること等を含んでもよい。使用される画像サンプルの数が所定の数の要求を達成したが、差異が所定の差異要求を満たしていない場合、今回、生徒ニューラルネットワークはうまく訓練されていない。うまく訓練されて終了した生徒ニューラルネットワークは、被処理画像の離散的特徴データの形成やビジョンタスク処理に用いられることができる。

１つの選択可能な一例において、前記操作Ｓ５２０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される監視モジュール１０３０によって実行されてもよい。

図６は、本願のニューラルネットワークの訓練方法の別の実施例のフローチャートである。被訓練のニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。図６に示すように、前記実施例の方法は、操作Ｓ６００、操作Ｓ６１０、操作Ｓ６２０及び操作Ｓ６３０を備える。以下、図６における各操作のそれぞれについて詳しく説明する。

Ｓ６００において、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する。前記操作の内容については、上記方法の実施形態におけるＳ５００についての関連記述を参照してよいので、ここで詳しく説明しない。

Ｓ６１０において、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ画像サンプルの離散的特徴データを形成する。前記操作の内容については、上記方法の実施形態におけるＳ５１０についての関連記述を参照してよいので、ここで詳しく説明しない。

１つの選択可能な一例において、前記操作Ｓ６００及びＳ６１０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像サンプルモジュール１０２０により実行されてもよい。

Ｓ６２０において、生徒ニューラルネットワークを介して、生徒ニューラルネットワークの形成した画像サンプルの離散的特徴データに基づいて、画像サンプルに対して分類処理を行う。

Ｓ６３０において、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異を、ガイド情報として、生徒ニューラルネットワークに対して教師あり学習を行う。

１つの選択可能な一例において、本願は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を小さくし、及び生徒ニューラルネットワークの出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異を小さくするために、相応の損失関数（例えば、Ｌ２損失関数）によって、生徒ニューラルネットワークに対して教師あり学習を行うことができる。

１つの選択可能な一例において、生徒ニューラルネットワークに対する訓練が所定の反複条件を達成する場合、今回、訓練過程は終了する。本願における所定の反複条件は、生徒ニューラルネットワークの出力した離散的特徴データと教師ニューラルネットワークの出力した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異の何れも所定の差異要求を満たしていることを含んでよい。差異が前記所定の差異要求を満たしている場合、今回、生徒ニューラルネットワークはうまく訓練されて終了する。本願における所定の反複条件は、生徒ニューラルネットワークに対して訓練を行って、用いられる画像サンプルの数が所定の数の要求に達成すること等を含んでもよい。使用される画像サンプルの数が所定の数の要求を達成したが、差異が所定の差異要求を満たしていない場合、今回、生徒ニューラルネットワークはうまく訓練されていない。うまく訓練されて終了した生徒ニューラルネットワークは、被処理画像の離散的特徴データの形成や分類処理に用いられることができる。

１つの選択可能な一例において、前記操作Ｓ６２０及びＳ６３０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される監視モジュール１０３０によって実行されてもよい。

図７は、本願のニューラルネットワークの訓練方法のまた１つの実施例のフローチャートである。被訓練のニューラルネットワークは、訓練中に、生徒ニューラルネットワークとされている。図７に示すように、前記実施例の方法は、操作Ｓ７００、操作Ｓ７１０、操作Ｓ７２０及び操作Ｓ７３０を備える。以下、図７における各操作のそれぞれについて詳しく説明する。

Ｓ７００において、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する。前記操作の内容については、上記方法の実施形態におけるＳ５００についての関連記述を参照してよいので、ここで詳しく説明しない。

Ｓ７１０において、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ画像サンプルの離散的特徴データを形成する。前記操作の内容については、上記方法の実施形態におけるＳ５１０についての関連記述を参照してよいので、ここで詳しく説明しない。

１つの選択可能な一例において、前記操作Ｓ７００及びＳ７１０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される入力画像サンプルモジュール１０２０により実行されてもよい。

Ｓ７２０において、生徒ニューラルネットワークを介して、生徒ニューラルネットワークの形成した画像サンプルの離散的特徴データに基づいて、画像サンプルに対して物体検出処理を行う。

Ｓ７３０において、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異を、ガイド情報として、生徒ニューラルネットワークに対して教師あり学習を行う。

１つの選択可能な一例において、生徒ニューラルネットワークの出力した物体検出処理結果は、検出枠の位置情報（例えば、検出枠の対角線における２つの頂点の座標）やカテゴリ等を含んでよい。本願は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を小さくし、及び生徒ニューラルネットワークの出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異を小さくするために、相応の損失関数（例えば、Ｌ２損失関数）によって、生徒ニューラルネットワークに対して教師あり学習を行うことができる。本願の画像サンプルの検出枠タグ付け情報は、検出枠の位置タグ付け情報（例えば、検出枠の対角線における２つの頂点の座標ラベル）やカテゴリラベル等を含んでよい。

１つの選択可能な一例において、生徒ニューラルネットワークに対する訓練が所定の反複条件を達成する場合、今回、訓練過程は終了する。本願における所定の反複条件は、生徒ニューラルネットワークの出力した離散的特徴データと教師ニューラルネットワークの出力した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異の何れも所定の差異要求を満たしていることを含んでよい。差異が前記所定の差異要求を満たしている場合、今回、生徒ニューラルネットワークはうまく訓練されて終了する。本願における所定の反複条件は、生徒ニューラルネットワークに対して訓練を行って、用いられる画像サンプルの数が所定の数の要求に達成すること等を含んでもよい。使用される画像サンプルの数が所定の数の要求を達成したが、差異が所定の差異要求を満たしていない場合、今回、生徒ニューラルネットワークはうまく訓練されていない。うまく訓練されて終了した生徒ニューラルネットワークは、被処理画像の離散的特徴データの形成及び物体検出処理に用いられることができる。

１つの選択可能な一例において、本願における知識遷移用の教師ニューラルネットワークは、主に、一般的に入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対して相応のビジョンタスク処理（例えば、分類処理又は物体検出処理等）を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、主に、浮動小数点教師ニューラルネットワークの出力した浮動小数点特徴データを離散的特徴データに転換して、離散的特徴データを浮動小数点教師ニューラルネットワークに提供するための量子化補助ユニットと、の２つの部分を含む。量子化補助ユニットの入力は浮動小数点教師ニューラルネットワークにおける相応層（例えば、第Ｎ層）の出力であり、量子化補助ユニットの出力は浮動小数点教師ニューラルネットワークにおける相応層（例えば、第Ｎ＋１層）の入力である。これにより、本願における量子化補助ユニットは浮動小数点教師ニューラルネットワークに挿入される層と見なされてよいことが判明される。教師ニューラルネットワークに対する訓練過程は、実際に、浮動小数点教師ニューラルネットワークのネットワークパラメータに対する微調整過程である。

１つの選択可能な一例において、前記操作Ｓ７２０及びＳ７３０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される監視モジュール１０３０によって実行されてもよい。

本願の教師ニューラルネットワークの訓練過程の１つの実施例のフローチャートを、図８に示す。

図８において、前記訓練過程は、操作Ｓ８００、操作Ｓ８１０及び操作Ｓ８２０を備える。以下、図８における各操作のそれぞれについて詳しく説明する。

Ｓ８００において、画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力する。前記うまく訓練された浮動小数点教師ニューラルネットワークは、予め画像サンプルによってうまく訓練された相応のビジョンタスクを実現するためのニューラルネットワークである。前記浮動小数点教師ニューラルネットワークの訓練過程の１つの実施例を図９に示す。

Ｓ８１０において、うまく訓練された浮動小数点教師ニューラルネットワークを介して、入力された画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う。例えば、うまく訓練された浮動小数点教師ニューラルネットワークが画像サンプルの離散的特徴データに基づいて、画像サンプルに対して分類処理又は物体検出処理等を行う。

１つの選択可能な一例において、前記操作Ｓ８００及びＳ８１０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される教師訓練モジュール１０４０の第１ユニットによって実行されてもよい。

Ｓ８２０において、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整（つまりネットワークパラメータの微調整）を行う。

１つの選択可能な一例において、前記操作は、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対して教師あり学習を行うことと考えてもよい。本願は、うまく訓練された浮動小数点教師ニューラルネットワークの離散的特徴データに基づいて出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を小さくするために、相応の損失関数（例えば、Ｌ２損失関数等）によって、うまく訓練された浮動小数点教師ニューラルネットワークのネットワークパラメータに対して微調整を行うことができる。ネットワークパラメータ微調整の収束条件は、一般的に、うまく訓練された浮動小数点教師ニューラルネットワークの離散的特徴データに基づいて出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異が所定の差異要求を満たしていることを含む。

１つの選択可能な一例において、前記操作Ｓ８２０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される教師訓練モジュール１０４０の第１監視ユニットによって実行されてもよい。

本願は、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータ微調整を行うことで、浮動小数点教師ニューラルネットワーク（つまり教師ニューラルネットワーク）の離散的特徴データに基づいて出力したビジョンタスク処理結果をより正確にすることができるので、知識遷移によって、本願のニューラルネットワークの形成した離散的特徴データがビジョンタスク処理を正確に終了することにより有利であるようにすることができる。

本願の浮動小数点教師ニューラルネットワークの訓練過程の１つの実施例のフローチャートを、図９に示す。図９において、前記訓練過程は、操作Ｓ９００、操作Ｓ９１０及び操作Ｓ９２０を備える。以下、図９における各操作のそれぞれについて詳しく説明する。

Ｓ９００において、画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力する。前記被訓練の浮動小数点教師ニューラルネットワークのネットワークパラメータは一般的に浮動小数点ネットワークパラメータであり、前記浮動小数点教師ニューラルネットワークは一般的に畳み込みニューラルネットワーク等である。

Ｓ９１０において、被訓練の浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出して、浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う。例えば、被訓練の浮動小数点教師ニューラルネットワークは、浮動小数点特徴データに基づいて、画像サンプルに対して分類処理又は物体検出処理等を行う。

１つの選択可能な一例において、前記操作Ｓ９００及びＳ９１０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される教師訓練モジュール１０４０の第２ユニットによって実行されてもよい。

Ｓ９２０において、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行う。

１つの選択可能な一例において、画像サンプルのタグ付け情報は、画像サンプルの分類タグ付け情報や検出枠タグ付け情報等であってよい。本願は、被訓練の浮動小数点教師ニューラルネットワークの浮動小数点特徴データに基づいて出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を小さくするために、相応の損失関数（例えば、Ｌ２損失関数等）によって、被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行うことができる。訓練の所定の反複条件は、一般的に、被訓練の浮動小数点教師ニューラルネットワークの浮動小数点特徴データに基づいて出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異が所定の差異要求を満たしていることを含む。

１つの選択可能な一例において、前記操作Ｓ９２０は、プロセッサによってメモリに記憶される相応の命令を呼び出して実行されてもよいし、プロセッサにより動作される教師訓練モジュール１０４０の第２監視ユニットにより実行されてもよい。

本願の実施例により提供されたいずれか一項の方法は、データ処理能力を有するいかなる適切な装置により実行されてもよく、前記装置は、端末装置及びサーバを含むが、これらに限定されない。又は、本願の実施例により提供されたいずれか一項の方法は、プロセッサにより実行されてもよく、例えば、プロセッサは、メモリに記憶された対応のコマンドを呼び出すことで本願の実施例により提供されたいずれか一項の方法を実行されてもよい。以下、詳細な説明を省略する。

当業者であれば、上記方法の実施例を実現する全てまたは一部の操作はプログラムによって関連ハードウェアに命令を出すことにより完成できることを理解でき、前記プログラムは、ＲＯＭ、ＲＡＭ、磁気ディスクまたは光ディスクなどのプログラムコードを記憶可能である様々な媒体を含むコンピュータ読み取り可能記憶媒体に記憶可能であり、該プログラムは実行される時に、上記方法の実施例の操作を実行する。

図１０は、本願の画像処理装置の１つの実施例の構造模式図である。図１０に示す画像処理装置は、入力画像モジュール１０００及びニューラルネットワーク１０１０を含む。選択的に、前記装置は、入力画像サンプルモジュール１０２０、監視モジュール１０３０、教師訓練モジュール１０４０を更に含んでもよい。

入力画像モジュール１０００は、被処理画像をニューラルネットワーク１０１０に入力することに用いられる。

ニューラルネットワーク１０１０は、被処理画像の離散的特徴データを形成することに用いられる。

本願におけるニューラルネットワークは、ガイド情報に基づいて訓練されたものであり、且つ訓練中に、生徒ニューラルネットワークとされ、ニューラルネットワークを訓練するためのガイド情報は、一般的に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含む。

１つの選択可能な一例において、本願のニューラルネットワークは、大きさが２Ｍを超えないニューラルネットワークを含む。

１つの選択可能な一例において、本願のニューラルネットワークは、更に、被処理画像の浮動小数点特徴データを形成して被処理画像の離散的特徴データに量子化する工程に用いられる。例えば、ニューラルネットワークは、被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して、被処理画像の浮動小数点特徴データを形成する。

１つの選択可能な一例において、ニューラルネットワークは、浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換することができる。別の選択可能な一例において、ニューラルネットワークは、浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換することができる。

１つの選択可能な一例において、ニューラルネットワークは、更に、被処理画像の離散的特徴データに対して続けて処理を行い、例えば、被処理画像の離散的特徴データに基づいて被処理画像に対して相応のビジョンタスク処理を行うことができる。ニューラルネットワークがビジョンタスク処理を続けて実行する必要がある場合、前記ニューラルネットワークを訓練するためのガイド情報は、生徒ニューラルネットワークの画像サンプルに対して出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を更に含む。

１つの選択可能な一例において、ニューラルネットワークを続けて実行するビジョンタスク処理は、分類処理であってもよいし、物体検出処理等であってもよい。つまり、ニューラルネットワークは、被処理画像の離散的特徴データに基づいて、被処理画像に対して分類処理を行ってよい。ニューラルネットワークは、被処理画像の離散的特徴データに基づいて、被処理画像に対して物体検出処理を行ってもよい。

ニューラルネットワークが被処理画像の離散的特徴データに基づいて、被処理画像に対して分類処理を行う必要がある場合、前記ニューラルネットワークを訓練するためのガイド情報は、生徒ニューラルネットワークの画像サンプルに対して出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異を更に含んでよい。

ニューラルネットワークが被処理画像の離散的特徴データに基づいて、被処理画像に対して物体検出処理を行う必要がある場合、前記ニューラルネットワークを訓練するためのガイド情報は、生徒ニューラルネットワークの画像サンプルに対して出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異を更に含んでよい。

入力画像モジュール１０００及びニューラルネットワーク１０１０の実行する操作については、上記方法の実施形態における図１〜図４についての記述を参照してよい。入力画像サンプルモジュール１０２０、監視モジュール１０３０及び教師訓練モジュール１０４０の実行する操作については、図１１についての下記記述を参照してよい。ここで何れも繰り返して説明しない。

図１１は、本願のニューラルネットワークの訓練装置の１つの実施例の構造模式図である。図１１に示す訓練装置は、入力画像サンプルモジュール１０２０、監視モジュール１０３０及び教師訓練モジュール１０４０を含む。

入力画像サンプルモジュール１０２０は、画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力して、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ画像サンプルの離散的特徴データを形成することに用いられる。

監視モジュール１０３０は、ガイド情報に基づいて生徒ニューラルネットワークに対して教師あり学習を行うことに用いられる。ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含む。

１つの選択可能な一例において、生徒ニューラルネットワークが画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる場合、監視モジュール１０３０は、更に、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、生徒ニューラルネットワークに対して教師あり学習を行うことに用いられる。

１つの選択可能な一例において、本願における教師ニューラルネットワークは、うまく訓練された浮動小数点教師ニューラルネットワーク及び量子化補助ユニットを含む。うまく訓練された浮動小数点教師ニューラルネットワークは、入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにすることに用いられる。量子化補助ユニットは、浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにすることに用いられる。

１つの選択可能な一例において、本願における教師訓練モジュール１０４０は、教師ニューラルネットワークを訓練することに用いられ、第１ユニット及び第１監視ユニットを含む。第１ユニットは、画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力して、うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる。第１監視ユニットは、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行うことに用いられる。

１つの選択可能な一例において、前記教師訓練モジュール１０４０は、第２ユニット及び第２監視ユニットを更に含んでよい。第２ユニットは、画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力して、被訓練の浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出して、浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる。第２監視ユニットは、ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行うことに用いられる。

入力画像サンプルモジュール１０２０、監視モジュール１０３０及び教師訓練モジュール１０４０の実行する操作については、上記方法の実施形態における図５〜図９についての記述を参照してよい。ここで繰り返して説明しない。

＜例示的装置＞
図１２は本願を実現するのに適する例示的装置１２００を示し、装置１２００は自動車に配置されるコントロールシステム／電子システム、携帯端末（例えば、スマートフォン等）、パーソナルコンピュータ（ＰＣ、例えば、デスクトップコンピュータ又はノートパソコン等）、タブレット型コンピュータ及びサーバ等であってよい。図１２において装置１２００は１つ又は複数のプロセッサ、通信部などを含み、前記１つ又は複数のプロセッサは、１つ又は複数の中央処理ユニット（ＣＰＵ）１２０１、及び／又はニューラルネットワークを用いて画像を処理する１つ又は複数の画像プロセッサ（ＧＰＵ）１２１３などであり、プロセッサは、読み取り専用メモリ（ＲＯＭ）１２０２に記憶された実行可能コマンド又は記憶部１２０８からランダムアクセスメモリ（ＲＡＭ）１２０３にロードされた実行可能コマンドによって各種の適切な動作及び処理を実現することができる。通信パート１２１２はネットワークカードを含んでよいが、それに限定されなく、前記ネットワークカードはＩＢ（Ｉｎｆｉｎｉｂａｎｄ）ネットワークカードを含んでよいが、それに限定されない。プロセッサは読み取り専用メモリ１２０２及び／又はランダムアクセスメモリ１２０３と通信して実行可能コマンドを実行し、通信バス１２０４を介して通信パート１２１２に接続され、通信パート１２１２を介して他のターゲットデバイスと通信してよく、それにより本願の対応の操作を完成する。

上記各コマンドに実行される操作については上記の方法の実施例での関連説明を参照してもよく、ここで詳細な説明を省略する。また、ＲＡＭ１２０３には、装置の動作に必要な各種のプログラムやデータが格納されていてもよい。ＣＰＵ１２０１、ＲＯＭ１２０２及びＲＡＭ１２０３は、通信バス１２０４を介して相互に接続される。

ＲＡＭ１２０３を有する場合に、ＲＯＭ１２０２は選択可能なモジュールである。ＲＡＭ１２０３は実行可能コマンドを格納するか、または動作時に実行可能コマンドをＲＯＭ１２０２に書き込み、実行可能コマンドによって中央処理ユニット１２０１に上記物体分割方法に対応する操作を実行させる。入力／出力（Ｉ／Ｏ）インタフェース１２０５も通信バス１２０４に接続される。通信パート１２１２は、統合的に設置されてもよく、それぞれバスに接続される複数のサブモジュール（例えば複数のＩＢネットワークカード）を有するように設置されてもよい。

キーボード、マウスなどを含む入力部１２０６と、陰極線管（ＣＲＴ）、液晶ディスプレイー（ＬＣＤ）など及びスピーカなどを含む出力部１２０７と、ハードディスクなどを含む記憶部１２０８と、ＬＡＮカード、モデムなどのネットワークインタフェースカードを含む通信部１２０９とがＩ／Ｏインタフェース１２０５に接続されている。通信部１２０９は例えばインターネットのようなネットワークを介して通信処理を行う。ドライブ１２１０も必要に応じてＩ／Ｏインタフェース１２０５に接続される。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどのリムーバブル媒体１２１１は、必要に応じてドライブ１２１０上に装着され、そこから読み出されたコンピュータプログラムを必要に応じて記憶部３０８にインストールする。

なお、図１２に示す構造は選択可能な一実施形態に過ぎず、具体的な実践過程では、実際の必要に応じて上記図１２の部品の数及び種類を選択、削除、追加、または置換することができ、異なる機能部品の設置上でも、分離設置または統合設置などの実施形態を採用でき、例えばＧＰＵとＣＰＵは分離設置するかまたはＧＰＵをＣＰＵに統合するようにしてよく、通信部は分離設置するか、またはＣＰＵやＧＰＵに統合設置することなども可能であることを説明する必要がある。これらの置換可能な実施形態はいずれも本願の保護範囲に属する。

特に、本願の実施例によれば、フローチャートを参照しながら上述したプロセスはコンピュータソフトウェアプログラムとして実現できる。例えば、本願の実施例はコンピュータプログラム製品を含み、それは機械可読媒体に有形に具現化された、フローチャートに示す操作を実行するためのプログラムコードを含むコンピュータプログラムを含み、プログラムコードは本願の実施例により提供される方法の操作を対応して実行する対応のコマンドを含んでよい。

このような実施例では、該コンピュータプログラムは通信部１２０９によってネットワークからダウンロード及びインストールされ、及び／又はリムーバブル媒体１２１１からインストールされ得る。中央処理ユニット（ＣＰＵ）１２０１によって該コンピュータプログラムを実行する時に、本願に記載の上記対応操作を実現するコマンドを実行する。

１つ又は複数の選択可能な実施形態では、本願の実施例は、コンピュータ読み取り可能命令を記憶するためのコンピュータプログラム製品であって、前記命令が実行される場合に、コンピュータに上記のいずれか１つの実施例に記載の画像処理方法又はニューラルネットワークの訓練方法を実行させるコンピュータプログラム製品を更に提供する。

該コンピュータプログラム製品はハードウェア、ソフトウェア又はそれらの組合せにより実現可能である。選択可能な一例において、前記コンピュータプログラム製品はコンピュータ記憶媒体として実現され、別の選択可能な一例において、前記コンピュータプログラム製品は、例えばソフトウェア開発キット（ＳｏｆｔｗａｒｅＤｅｖｅｌｏｐｍｅｎｔＫｉｔ：ＳＤＫ）などのソフトウェア製品として実現される。

１つ又は複数の選択可能な実施形態では、本願の実施例は、別の画像処理方法とニューラルネットワークの訓練方法及びそれらに対応する装置と電子機器、コンピュータ記憶媒体、コンピュータプログラム並びにコンピュータプログラム製品を更に提供し、前記方法は、第１装置から、第２装置に上記のいずれか１つの可能な実施例における画像処理方法又はニューラルネットワークの訓練方法を実行させる画像処理指示又はニューラルネットワーク訓練指示を第２装置に送信する工程と、第１装置により第２装置から送信される画像処理結果又はニューラルネットワーク訓練結果を受信する工程と、を含む。

いくつかの実施例では、該画像処理指示又はニューラルネットワーク訓練指示は呼び出し命令であってよく、第１装置は、呼び出すことで第２装置に画像処理操作又はニューラルネットワーク訓練操作を実行させるように指示することができ、それに対して、呼び出し命令が受信されたことに応じて、第２装置は上記画像処理方法又はニューラルネットワークの訓練方法のいずれか１つの実施例における操作及び／又はフローを実行することができる。

本願の実施例における「第１の」、「第２の」などの用語は区別するためのものに過ぎず、本願の実施例に対する限定と理解してはならないことを理解すべきである。更に、本願では、「複数の」は２つ又は２つ以上を指してよく、「少なくとも１つの」は１つ、２つ又は２つ以上を指してよいことを理解すべきである。更に、本願で言及された任意の部材、データ又は構造は、明確に限定され又は明細書の前後で反対的に示唆された場合でなければ、一般的には１つ又は複数と理解してよいことを理解すべきである。更に、本願ではそれぞれの実施例についての説明はそれぞれの実施例の相違点を重点として強調し、その同一又は類似的な点について相互に参照してよく、簡単化するために、ここで一つずつに繰り返して説明しないことを理解すべきである。

本願の方法及び装置、電子機器並びにコンピュータ読み取り可能記憶媒体は、様々な形態で実現され得る。例えば、ソフトウェア、ハードウェア、ファームウェアまたはソフトウェア、ハードウェア、ファームウェアの任意の組み合わせによって本願の方法及び装置、電子機器並びにコンピュータ読み取り可能記憶媒体を実現することができる。方法の操作のための上記順序は説明することのみを目的とし、本願の方法の操作は、特に断らない限り、以上で説明した順序に限定されない。また、いくつかの実施形態では、本願は記録媒体に記憶されたプログラムとしてもよく、これらのプログラムは本願の方法を実現するための機械可読コマンドを含む。従って、本願は本願の方法を実行するためのプログラムが記憶された記録媒体も含む。

本願の説明は、例示及び説明のために提示されたものであり、網羅的なものでありもしくは開示された形式に本願を限定するというわけでない。当業者にとっては多くの修正及び変形は明らかなものであろう。実施形態は本願の原理及び実際応用をより明瞭に説明するため、かつ当業者が本願を理解して特定用途に適した各種の修正を加えた各種の実施形態を設計可能にするように選択され説明されたものである。

Claims

被処理画像をニューラルネットワークに入力する工程と、
前記ニューラルネットワークを介して前記被処理画像の離散的特徴データを形成する工程と、
を備え、
前記ニューラルネットワークは、ガイド情報に基づいて訓練されたものであり、且つ訓練中に、生徒ニューラルネットワークとされ、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの前記画像サンプルに対して形成した離散的特徴データとの間の差異を含むことを特徴とする画像処理方法。
前記ニューラルネットワークは、大きさが２Ｍを超えないニューラルネットワークを含むことを特徴とする請求項１に記載の方法。
前記ニューラルネットワークを介して前記被処理画像の離散的特徴データを形成する前記工程は、
前記ニューラルネットワークを介して前記被処理画像の浮動小数点特徴データを形成し、前記浮動小数点特徴データを前記被処理画像の離散的特徴データに量子化する工程を含むことを特徴とする請求項１〜２の何れか１項に記載の方法。
前記ニューラルネットワークを介して前記被処理画像の浮動小数点特徴データを形成する前記工程は、
前記ニューラルネットワークを介して前記被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して、前記被処理画像の浮動小数点特徴データを形成する工程を含むことを特徴とする請求項３に記載の方法。
前記抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換する前記工程は、
前記浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換する工程、及び／又は、
前記浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換する工程を含むことを特徴とする請求項４に記載の方法。
前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して相応のビジョンタスク処理を行う工程を更に備えることを特徴とする請求項１〜５の何れか１項に記載の方法。
前記ガイド情報は、生徒ニューラルネットワークの画像サンプルに対して出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を更に含むことを特徴とする請求項６に記載の方法。
前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して相応のビジョンタスク処理を行う前記工程は、
前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して分類処理を行う工程、又は、
前記ニューラルネットワークを介して、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して物体検出処理を行う工程を更に含むことを特徴とする請求項６に記載の方法。
前記ガイド情報は、
前記生徒ニューラルネットワークの画像サンプルに対して出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異、又は、
前記生徒ニューラルネットワークの画像サンプルに対して出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異を更に含むことを特徴とする請求項８に記載の方法。
前記ニューラルネットワークの訓練過程は、
画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する工程と、
生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成する工程と、
ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程と、
を含み、
前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含むことを特徴とする請求項１〜９の何れか１項に記載の方法。
前記ニューラルネットワークの訓練過程は、
前記生徒ニューラルネットワークを介して、前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程を更に含み、
前記ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程は、
教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程を含むことを特徴とする請求項１０に記載の方法。
前記教師ニューラルネットワークは、
入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、
浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにするための量子化補助ユニットと、
を含むことを特徴とする請求項１〜１１の何れか１項に記載の方法。
前記教師ニューラルネットワークの訓練過程は、
画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力する工程と、
うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して前記離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程と、
ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行う工程と、
を含むことを特徴とする請求項１２に記載の方法。
前記浮動小数点教師ニューラルネットワークの訓練過程は、
画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力する工程と、
被訓練の浮動小数点教師ニューラルネットワークを介して前記画像サンプルの浮動小数点特徴データを抽出して、前記浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程と、
前記ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、前記被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行う工程と、
を含むことを特徴とする請求項１２〜１３の何れか１項に記載の方法。
被訓練のニューラルネットワークが訓練中に、生徒ニューラルネットワークとされるニューラルネットワークの訓練方法であって、
画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力する工程と、
生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成する工程と、
ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程と、
を備え、
前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含むことを特徴とするニューラルネットワークの訓練方法。
前記ニューラルネットワークが生徒ニューラルネットワークとされる訓練過程は、
前記生徒ニューラルネットワークを介して、前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程を含み、
前記ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行う工程は、
教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程を含むことを特徴とする請求項１５に記載の方法。
前記教師ニューラルネットワークは、
入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、
浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにするための量子化補助ユニットと、
を含むことを特徴とする請求項１５〜１６の何れか１項に記載の方法。
前記教師ニューラルネットワークの訓練過程は、
画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力する工程と、
うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して前記離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程と、
ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行う工程と、
を含むことを特徴とする請求項１７に記載の方法。
前記浮動小数点教師ニューラルネットワークの訓練過程は、
画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力する工程と、
被訓練の浮動小数点教師ニューラルネットワークを介して前記画像サンプルの浮動小数点特徴データを抽出して、前記浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行う工程と、
前記ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、前記被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行う工程と、
を含むことを特徴とする請求項１７〜１８の何れか１項に記載の方法。
被処理画像をニューラルネットワークに入力するための入力画像モジュールと、
前記被処理画像の離散的特徴データを形成するためのニューラルネットワークと、
を含み、
前記ニューラルネットワークは、ガイド情報に基づいて訓練されたものであり、且つ訓練中に、生徒ニューラルネットワークとされ、前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの前記画像サンプルに対して形成した離散的特徴データとの間の差異を含むことを特徴とする画像処理装置。
前記ニューラルネットワークは、大きさが２Ｍを超えないニューラルネットワークを含むことを特徴とする請求項２０に記載の装置。
前記ニューラルネットワークは、更に、
前記被処理画像の浮動小数点特徴データを形成して前記被処理画像の離散的特徴データに量子化する工程に用いられることを特徴とする請求項２０〜２１の何れか１項に記載の装置。
前記ニューラルネットワークは、前記被処理画像に対して、浮動小数点特徴データの抽出を行って、抽出された浮動小数点特徴データを所定の要求を満たしている浮動小数点特徴データに転換して、前記被処理画像の浮動小数点特徴データを形成することを特徴とする請求項２２に記載の装置。
前記ニューラルネットワークは、前記浮動小数点特徴データを所定のチャンネル数を有する浮動小数点特徴データに転換し、及び／又は、
前記浮動小数点特徴データを所定の大きさを有する浮動小数点特徴データに転換することを特徴とする請求項２３に記載の装置。
前記ニューラルネットワークは、更に、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して相応のビジョンタスク処理を行う工程に用いられることを特徴とする請求項２０〜２４の何れか１項に記載の装置。
前記ガイド情報は、生徒ニューラルネットワークの画像サンプルに対して出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を更に含むことを特徴とする請求項２５に記載の装置。
前記ニューラルネットワークは、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して分類処理を行い、又は、
前記ニューラルネットワークは、前記被処理画像の離散的特徴データに基づいて、前記被処理画像に対して物体検出処理を行うことを特徴とする請求項２５に記載の装置。
前記ガイド情報は、
前記生徒ニューラルネットワークの画像サンプルに対して出力した分類処理結果と画像サンプルの分類タグ付け情報との間の差異、又は、
前記生徒ニューラルネットワークの画像サンプルに対して出力した物体検出処理結果と画像サンプルの検出枠タグ付け情報との間の差異を更に含むことを特徴とする請求項２７に記載の装置。
画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力して、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成するための入力画像サンプルモジュールと、
ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行うための監視モジュールと、
を更に含み、
前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含むことを特徴とする請求項２０〜２８の何れか１項に記載の装置。
前記生徒ニューラルネットワークが前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる場合、
前記監視モジュールは、更に、
教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程に用いられることを特徴とする請求項２９に記載の装置。
前記教師ニューラルネットワークは、
入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、
浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにするための量子化補助ユニットと、
を含むことを特徴とする請求項２０〜３０の何れか１項に記載の装置。
前記教師ニューラルネットワークを訓練するための教師訓練モジュールを更に含み、
前記教師訓練モジュールは、
画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力して、うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して前記離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うための第１ユニットと、
ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行うための第１監視ユニットと、
を含むことを特徴とする請求項３１に記載の装置。
前記教師訓練モジュールは、
画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力して、被訓練の浮動小数点教師ニューラルネットワークを介して前記画像サンプルの浮動小数点特徴データを抽出して、前記浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うための第２ユニットと、
前記ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、前記被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行うための第２監視ユニットと、
を更に含むことを特徴とする請求項３２に記載の装置。
被訓練のニューラルネットワークが生徒ニューラルネットワークとされるニューラルネットワークの訓練装置であって、
画像サンプルをそれぞれ生徒ニューラルネットワーク及び教師ニューラルネットワークに入力して、生徒ニューラルネットワーク及び教師ニューラルネットワークを介して、それぞれ前記画像サンプルの離散的特徴データを形成するための入力画像サンプルモジュールと、
ガイド情報に基づいて、前記生徒ニューラルネットワークに対して教師あり学習を行うための監視モジュールと、
を含み、
前記ガイド情報は、教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異を含むことを特徴とするニューラルネットワークの訓練装置。
前記生徒ニューラルネットワークが前記画像サンプルの離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うことに用いられる場合、
前記監視モジュールは、更に、
教師ニューラルネットワークの画像サンプルに対して形成した離散的特徴データと前記生徒ニューラルネットワークの画像サンプルに対して形成した離散的特徴データとの間の差異、及び生徒ニューラルネットワークの出力したビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異を、ガイド情報として、前記生徒ニューラルネットワークに対して教師あり学習を行う工程に用いられることを特徴とする請求項３４に記載の装置。
前記教師ニューラルネットワークは、
入力画像に対して浮動小数点特徴データを形成して、前記浮動小数点特徴データに基づいて、入力画像に対してビジョンタスク処理を行うためのうまく訓練された浮動小数点教師ニューラルネットワークと、
浮動小数点教師ニューラルネットワークの形成した浮動小数点特徴データを離散的特徴データに転換して、前記離散的特徴データを浮動小数点教師ニューラルネットワークに提供し、浮動小数点教師ニューラルネットワークが前記離散的特徴データに基づいて、入力画像に対してビジョンタスク処理を行うようにするための量子化補助ユニットと、
を含むことを特徴とする請求項３４〜３５の何れか１項に記載の装置。
前記教師ニューラルネットワークを訓練するための教師訓練モジュールを更に含み、
前記教師訓練モジュールは、
画像サンプルをうまく訓練された浮動小数点教師ニューラルネットワークに入力して、うまく訓練された浮動小数点教師ニューラルネットワークを介して画像サンプルの浮動小数点特徴データを抽出し、量子化補助ユニットを介して浮動小数点特徴データを離散的特徴データに転換し、またうまく訓練された浮動小数点教師ニューラルネットワークを介して前記離散的特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うための第１ユニットと、
ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、うまく訓練された浮動小数点教師ニューラルネットワークに対してネットワークパラメータの調整を行うための第１監視ユニットと、
を含むことを特徴とする請求項３６に記載の装置。
前記教師訓練モジュールは、
画像サンプルを被訓練の浮動小数点教師ニューラルネットワークに入力して、被訓練の浮動小数点教師ニューラルネットワークを介して前記画像サンプルの浮動小数点特徴データを抽出して、前記浮動小数点特徴データに基づいて、画像サンプルに対してビジョンタスク処理を行うための第２ユニットと、
前記ビジョンタスク処理結果と画像サンプルのタグ付け情報との間の差異をガイド情報として、前記被訓練の浮動小数点教師ニューラルネットワークに対して教師あり学習を行うための第２監視ユニットと、
を更に含むことを特徴とする請求項３７に記載の装置。
コンピュータプログラムを記憶するためのメモリと、
前記メモリに記憶されるコンピュータプログラムを実行することに用いられ、且つ前記コンピュータプログラムが実行される場合、上記請求項１〜１９の何れか１項に記載の方法を実現するプロセッサと、
を含むことを特徴とする電子機器。
コンピュータプログラムが記憶されるコンピュータ読み取り可能記憶媒体であって、前記コンピュータプログラムがプロセッサにより実行される場合、上記請求項１〜１９の何れか１項に記載の方法を実現することを特徴とするコンピュータ読み取り可能記憶媒体。
コンピュータ命令を含むコンピュータプログラムであって、前記コンピュータ命令が機器のプロセッサにおいて動作される場合、上記請求項１〜１９の何れか１項に記載の方法を実現することを特徴とするコンピュータプログラム。