JP7355299B2 - 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム - Google Patents

学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム Download PDF

Info

Publication number
JP7355299B2
JP7355299B2 JP2019110810A JP2019110810A JP7355299B2 JP 7355299 B2 JP7355299 B2 JP 7355299B2 JP 2019110810 A JP2019110810 A JP 2019110810A JP 2019110810 A JP2019110810 A JP 2019110810A JP 7355299 B2 JP7355299 B2 JP 7355299B2
Authority
JP
Japan
Prior art keywords
images
unit
data set
related images
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019110810A
Other languages
English (en)
Other versions
JP2020204800A (ja
Inventor
安紘 土田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2019110810A priority Critical patent/JP7355299B2/ja
Publication of JP2020204800A publication Critical patent/JP2020204800A/ja
Application granted granted Critical
Publication of JP7355299B2 publication Critical patent/JP7355299B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラムに関する。
従来から、監視カメラ等のカメラで撮影したフレーム画像(撮影画像)に映り込んだ人等の物体を、学習済物体検出用ニューラルネットワークで検出し、検出した物体の認識を、学習済物体認識用ニューラルネットワークを用いて行うようにした装置やシステムが知られている(例えば、特許文献1参照)。
特開2018-093283号公報
ところが、上記のようなニューラルネットワークを用いて物体検出及び物体認識を行う装置やシステムでは、物体検出用ニューラルネットワークや、物体認識用ニューラルネットワークの機械学習のためのデータセット(学習用データセット)が必要になる。ここで、上記特許文献1のようなカメラによる撮影画像に基づいて、物体検出及び物体認識を行う装置やシステムでは、上記の学習用データセットは、多数の画像(データ)と、これらの画像のクラス分類の正解ラベルとを含む教師データ(訓練データ)である。上記の学習用データセットに含まれるデータのうち、(多数の)画像については、これらの画像の候補となる画像(候補画像)を集めることは比較的容易であるが、学習用データセットに含めるべき画像の選別、及び選別された画像へのラベル付け(アノテーション)には、多大な時間と費用が必要である。そして、上記の画像の選別、及び選別された画像へのラベル付けは、一般に、管理部門のスタッフ等の人が、パソコンやサーバ等の情報処理機器を用いて行っている。
本発明は、上記課題を解決するものであり、物体検出用ニューラルネットワークや、物体認識用ニューラルネットワークの学習用データセットを、容易に作成することが可能な学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラムを提供することを目的とする。
上記課題を解決するために、本発明の第1の態様による学習用データセット生成システムは、複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセットを入力する画像入力部と、前記種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像のうち、前記種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を収集する画像収集部と、前記画像入力部で入力された種データセットに含まれるサンプル画像を用いて、前記クラス分類の正解ラベルに応じたクラスタを形成するクラスタ形成部と、前記画像収集部により収集した複数の関連画像の各々が、前記クラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、前記関連画像の各々に付与するラベル付与部と、前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うための訂正入力部と、前記訂正入力部による訂正入力に応じて、前記複数の関連画像の各々に付与された正解ラベルを訂正する訂正処理部とを備える。
この学習用データセット生成システムにおいて、前記複数の関連画像を、前記クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングするマッピング処理部と、前記マッピング処理部による前記複数の関連画像の各々のマッピング結果を表示する表示部とをさらに備え前記訂正入力部は、前記表示部にマッピング結果が表示された前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うためのものであることが望ましい。
この学習用データセット生成システムにおいて、前記複数の関連画像の各々のマッピング結果を、前記クラスタ形成部により形成されたクラスタの境界と共に、前記表示部に表示するように制御する表示制御部をさらに備え、前記訂正入力部による訂正入力は、前記クラスタ形成部により形成された、各正解ラベルのクラスタの境界を訂正するための入力であってもよい。
この学習用データセット生成システムにおいて、前記クラスタ形成部は、前記クラス分類への寄与度の高い軸に重みを付けて、前記クラスタの形成処理を行うことが望ましい。
この学習用データセット生成システムにおいて、前記クラスタ形成部は、VAE(Variational Autoencoder)を利用して、前記クラスタの形成処理を行うことが望ましい。
本発明の第2の態様による学習サーバは、複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセットを入力する画像入力部と、カメラで撮影された撮影画像のうち、前記種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を受信する画像受信部と、前記画像入力部で入力された種データセットに含まれるサンプル画像を用いて、前記クラス分類の正解ラベルに応じたクラスタを形成するクラスタ形成部と、前記画像受信部により受信した複数の関連画像の各々が、前記クラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、前記関連画像の各々に付与するラベル付与部と、前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うための訂正入力部と、前記訂正入力部による訂正入力に応じて、前記複数の関連画像の各々に付与された正解ラベルを訂正する訂正処理部とを備え、前記画像受信部が受信する関連画像は、前記種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像から収集された撮影画像である
この学習サーバにおいて、前記複数の関連画像を、前記クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングするマッピング処理部と、前記マッピング処理部による前記複数の関連画像の各々のマッピング結果を表示する表示部とをさらに備え、前記訂正入力部は、前記表示部にマッピング結果が表示された前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うためのものであることが望ましい。
本発明の第3の態様による学習用データセット生成プログラムは、コンピュータを、複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセットを入力する画像入力部と、カメラで撮影された撮影画像のうち、前記種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を受信する画像受信部と、前記画像入力部で入力された種データセットに含まれるサンプル画像を用いて、前記クラス分類の正解ラベルに応じたクラスタを形成するクラスタ形成部と、前記画像受信部により受信した複数の関連画像の各々が、前記クラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、前記関連画像の各々に付与するラベル付与部と、前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うための訂正入力部と、前記訂正入力部による訂正入力に応じて、前記複数の関連画像の各々に付与された正解ラベルを訂正する訂正処理部として機能させ、前記画像受信部が受信する関連画像は、前記種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像から収集された撮影画像である
この学習用データセット生成プログラムにおいて、前記コンピュータを、さらに、前記複数の関連画像を、前記クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングするマッピング処理部と、前記マッピング処理部による前記複数の関連画像の各々のマッピング結果を表示する表示部として機能させ、前記訂正入力部は、前記表示部にマッピング結果が表示された前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うためのものであることが望ましい。
本発明の第1の態様による学習用データセット生成システムによれば、種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像から、種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する複数の関連画像を収集することにより、学習用データセットに含めるべき画像を選別することができる。また、種データセットに含まれるサンプル画像を用いて、クラス分類の正解ラベルに応じたクラスタを形成した上で、上記の複数の関連画像の各々が、上記のクラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、上記の関連画像の各々に付与することができる。これにより、上記の学習用データセットに含めるべき画像として選別された画像(関連画像)へのラベル付けを、容易に行うことができる。従って、従来と異なり、管理部門のスタッフ等の人が、学習用データセットに含めるべき全ての画像の選別処理や、選別された全ての画像へのラベル付けを行うことなく、少量の種データセット(に含まれる少量のサンプル画像と、これらのサンプル画像に付与されるべきクラス分類の正解ラベル)を入力するだけで、物体検出用ニューラルネットワークや、物体認識用ニューラルネットワークの学習用データセットを、容易に(半自動的に)作成することができる。また、ユーザ(システム管理者)が、半自動的に作成された上記の学習用データセットにおける各関連画像の正解ラベルを訂正することができる。
本発明の第2の態様による学習サーバ、及び第3の態様による学習用データセット生成プログラムによれば、カメラで撮影された撮影画像のうち、種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を受信することにより、学習用データセットに含めるべき画像を集めることができる。また、種データセットに含まれるサンプル画像を用いて、クラス分類の正解ラベルに応じたクラスタを形成した上で、上記の複数の関連画像の各々が、上記のクラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、上記の関連画像の各々に付与することができる。これにより、上記の学習用データセットに含めるべき画像として選別された画像(関連画像)へのラベル付けを、容易に行うことができる。従って、従来と異なり、管理部門のスタッフ等の人が、学習用データセットに含めるべき全ての画像の選別処理や、選別された全ての画像へのラベル付けを行うことなく、少量の種データセット(に含まれる少量のサンプル画像と、これらのサンプル画像に付与されるべきクラス分類の正解ラベル)を入力するだけで、物体検出用ニューラルネットワークや、物体認識用ニューラルネットワークの学習用データセットを、容易に(半自動的に)作成することができる。また、ユーザ(システム管理者)が、半自動的に作成された上記の学習用データセットにおける各関連画像の正解ラベルを訂正することができる。
本発明の一実施形態の学習用データセット生成システムの概略の構成を示すブロック構成図。 図1中の学習サーバの概略のハードウェア構成を示すブロック図。 図1中の分析ボックスにおけるCPUの機能ブロック構成図。 上記学習用データセット生成システムにおける、主要機器が果たす機能の概要と、主なデータの流れを示すブロック構成図。 同学習用データセット生成システムにおける画像入力部と画像収集部の処理の説明図。 同学習用データセット生成システムにおけるラベリング部の処理の説明図。 VAEのネットワーク構成図。 上記学習サーバのラベル訂正部により行われるラベル訂正処理の説明図。 上記ラベル訂正処理の前後における関連画像の各々のマッピング結果と、クラスタ間の境界の説明図。
以下、本発明を具体化した実施形態による学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラムについて、図面を参照して説明する。図1は、本実施形態による学習用データセット生成システム10(以下、「データセット生成システム10」と略す)の概略の構成を示すブロック構成図である。本実施形態では、複数のネットワークカメラ(IP(Internet Protocol)カメラ)2(以下、「カメラ2」と略す)、及びこれらのカメラ2の各々から入力された画像の分析を行う分析ボックス3が、チェーン店等の店舗S内に配される場合の例について説明する。図1に示すように、データセット生成システム10は、店舗S内に、上記のカメラ2と分析ボックス3に加えて、ハブ5と、ルータ6とを備えている。上記の分析ボックス3は、LAN(Local Area Network)4とハブ5とを介して、複数のカメラ2と接続され、これらのカメラ2の各々から入力された画像を分析する。具体的には、分析ボックス3は、カメラ2の各々から入力された画像に対する物体検出処理と、この物体検出処理で検出された物体の画像に対する物体認識処理とを行う。
また、データセット生成システム10は、クラウドC上のAI分析サーバ7、管理サーバ8、及び学習サーバ1を備えている。AI分析サーバ7は、分析ボックス3からの物体認識結果に基づいて、例えば、各店舗内における人物の行動を分析し、分析結果の情報を、マーケティングや防犯等の種々の用途のアプリケーションが使い易いデータに変換して出力する。
上記の管理サーバ8は、各店舗に配された多数の分析ボックス3、及びこれらの分析ボックス3に接続されたカメラ2の管理を行う。具体的には、管理サーバ8は、各店舗の分析ボックス3へのアプリパッケージのインストールや、これらの分析ボックス3に接続されたカメラ2の起動及び停止等の制御を行う。なお、このアプリパッケージは、例えば、学習済の物体検出用ニューラルネットワークモデル(以下、「物体検出用NNモデル」という)と、1種類以上の学習済の物体認識用ニューラルネットワークモデル(以下、「物体認識用NNモデル」という)と、これらのニューラルネットワークモデル(以下、「NNモデル」という)の使い方(処理の順番)を記載した制御用スクリプトとを含んだパッケージ・プログラムである。
上記の学習サーバ1の詳細については後述するが、この学習サーバ1は、上記の分析ボックス3にインストールされるアプリパッケージに含まれるニューラルネットワークモデル(物体検出用NNモデル、及び物体認識用NNモデル)の学習用データセットを半自動生成する機能と、この学習用データセットを用いて、上記のNNモデルの学習又は再学習を行う機能とを有している。なお、上記の再学習とは、現在の(分析ボックス3にインストールされている)NNモデル(物体検出用NNモデル、及び物体認識用NNモデル)が陳腐化しないように、新しい学習用データセットを用いて、学習済のNNモデルの学習をやり直す処理である。この再学習が済むと、再学習後の新しいバージョンのNNモデルが、学習サーバ1から、管理サーバ8を介して、分析ボックス3にインストールされる。
次に、図2を参照して、学習サーバ1のハードウェア構成について説明する。学習サーバ1は、装置全体の制御及び各種演算を行うCPU11(請求項における「クラスタ形成部」、「ラベル付与部」、「マッピング処理部」、「表示制御部」、及び「訂正処理部」に相当)と、各種のデータやプログラムを格納するハードディスク12と、RAM(Random Access Memory)13と、ディスプレイ14(請求項における「表示部」に相当)と、マウスを含む操作部15(請求項における「訂正入力部」に相当)と、通信部16(請求項における「画像受信部」に相当)と、USB(Universal Serial Bus)コネクタ17とを備えている。このUSBコネクタ17には、画像等を記憶したUSBメモリカード25を接続することができる。
上記のハードディスク12に格納されるプログラムには、学習用データセット生成訂正プログラム18(請求項における「学習用データセット生成プログラム」)が含まれている。この学習用データセット生成訂正プログラム18は、上記の分析ボックス3にインストールされるアプリパッケージに含まれるニューラルネットワークモデルの学習用データセットを半自動生成する機能と、半自動生成した学習用データセットの(正解)ラベルを簡易なユーザ操作で訂正するための機能とを提供する。
また、上記のハードディスク12に格納されるデータには、種データセット19、検出モデルDB20、生データDB21、誤り有ラベル付データセット22、及び誤り訂正済ラベル付データセット23が含まれている。
上記の種データセット19は、複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである。上記の検出モデルDB20は、複数の物体検出用NNモデルが格納されたデータベースである。上記の生データDB21は、複数のカメラ2で撮影された撮影画像のうち、上記の種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、多数の関連画像を格納するデータベースである。上記の誤り有ラベル付データセット22は、上記の生データDB21に含まれる多数の関連画像に、これらの関連画像の各々が属する(含まれる)クラスタに応じた正解ラベルを自動的に付与した(学習用)データセットである。上記の誤り訂正済ラベル付データセット23は、上記の誤り有ラベル付データセット22の関連画像に自動的に付与された正解ラベルの訂正後の(学習用)データセットである。
図3は、図1中の分析ボックス3におけるCPU31の機能ブロックを示す。分析ボックス3は、機能ブロックとして、画像収集部32と、画像分析部33と、プロセッサ割当部34とを備えている。画像収集部32は、カメラ2で撮影された撮影画像のうち、種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を収集する。
また、上記の画像分析部33は、カメラ2の各々から入力された画像に映り込んだ物体を検出するための学習済の物体検出用NNモデルと、この物体検出用NNモデルにより検出された物体を認識するための1種類以上の学習済の物体認識用NNモデルとを含むアプリパッケージを用いて、カメラ2の各々から入力された画像を分析する。また、プロセッサ割当部34は、アプリパッケージの各インスタンスに含まれる物体検出用NNモデル及び物体認識用NNモデルの各々の推論処理に必要な推論時間と使用頻度とに基づいて、複数のチップ35のうち、物体検出用NNモデルにおける推論処理、及び物体認識用NNモデルの各々における推論処理に用いるチップ(推論用プロセッサ)の割り当てを行う。
上記の各(推論)チップ35は、DNN(Deep Neural Networks)推論に最適化されたプロセッサ(推論専用チップ)であることが望ましいが、一般的な用途に用いられる汎用のGPU(Graphics Processing Unit)、又はその他のプロセッサであってもよい。
次に、図4を参照して、データセット生成システム10において、図1中の主要機器(学習サーバ1、分析ボックス3及び管理サーバ8)が果たす機能の概要と、主なデータの流れについて説明する。図4は、図1中の主要機器における、機能ブロックと主なデータファイルを示す。図4に示すように、管理サーバ8は、そのハードディスク41に、各種のアプリパッケージを格納したアプリケーションDB42を格納している。アプリケーションDB42に格納されている各アプリパッケージは、画像分析用のアプリパッケージであり、学習済物体検出用NNモデルと、1種類以上の学習済の物体認識用NNモデルと、これらのNNモデルの使い方(処理の順番)を記載した制御用スクリプトとを含んだパッケージ・プログラムである。データセット生成システム10の管理者は、アプリケーションDB42に格納されている各アプリパッケージの中から、各カメラ2の画像の分析に適切なアプリパッケージを選択して、選択したアプリパッケージを、アプリ配信部43により分析ボックス3に配信する。
分析ボックス3は、管理サーバ8から受信した上記のアプリパッケージを、画像分析アプリケーション37としてインストールする。また、分析ボックス3は、管理サーバ8から、分析ボックスOS36も受信する。この分析ボックスOS36は、分析ボックス3内の画像分析アプリケーション37のインスタンス等のアプリケーションの制御を行うと共に、管理サーバ8との送受信を行う。なお、上記の画像分析アプリケーション37は、図3中における画像分析部33に相当する処理を行うためのアプリパッケージである。画像分析アプリケーション37の各インスタンスにおける物体検出用NNモデルと物体認識用NNモデルの推論処理には、これらのNNモデルの推論処理に割り当てられたチップ35が用いられる。
学習サーバ1は、複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセット19を入力する画像入力部51を備えている。この種データセット19に含まれるデータのうち、サンプル画像の入力については、例えば、図2に示すUSBメモリカード25に格納された画像を読み取ったり、通信部16を介して他のコンピュータに格納された画像を受信する方法により行ってもよいし、学習サーバ1が通信部16を介してカメラ2から受信した撮影画像のうち、データセット生成システム10の管理者(以下、「システム管理者」と略す)が学習用データセットに含めるべきであると判断した画像を、種データセット19のサンプル画像として選択してもよい。また、種データセット19に含まれるデータのうち、正解ラベルの入力については、例えば、学習サーバ1の操作部15に含まれているキーボードやマウス等により行う。従って、画像入力部51(請求項の「画像入力部」に相当)は、図2に示されるハードウェアのうち、USBメモリカード25、USBコネクタ17、通信部16、及び操作部15に対応する。
なお、詳細については後述するが、システム管理者は、検出モデルDB20に格納された複数の物体検出用NNモデルのうち、上記の種データセット19内のデータ(以下、「種データ」という)を精度良く検出することができる物体検出用NNモデルを、操作部15により選択して、選択した物体検出用NNモデルを、分析ボックス3における画像収集部32で用いる物体検出用NNモデルとして、分析ボックス3にインストールする。
また、学習サーバ1は、分析ボックス3の画像収集部32により収集された複数の関連画像を受信する画像受信部52を備えている。すなわち、画像受信部52は、カメラ2で撮影された撮影画像のうち、種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する複数の関連画像を受信する。学習サーバ1(のCPU11)は、画像受信部52により受信した複数の関連画像を、生データDB21に格納する。
さらに、学習サーバ1は、クラスタ形成部54とラベル付与部55とから構成されるラベリング部53を備えている。クラスタ形成部54は、画像入力部51で入力された種データセット19に含まれるサンプル画像を用いて、クラス分類の正解ラベルに応じたクラスタを形成する。また、ラベル付与部55は、分析ボックス3の画像収集部32により収集した(画像受信部52により受信した)、生データDB21内の複数の関連画像の各々が、クラスタ形成部54により形成されたクラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、関連画像の各々に付与する。このラベル付与部55により正解ラベルが付与された後の各関連画像は、誤り有ラベル付データセット22に格納される。
さらに、学習サーバ1は、マッピング処理部57と、表示制御部58と、訂正入力部60と、訂正処理部61とから構成されるラベル訂正部56を備えている。マッピング処理部57は、上記の複数の関連画像を、クラス分類への寄与度の高い2軸を用いた2次元平面上にマッピングすることにより、複数の関連画像のマッピング結果を可視化する。表示制御部58は、マッピング処理部57による複数の関連画像の各々のマッピング結果を、クラスタ形成部54により形成されたクラスタの境界と共に、表示部59に表示するように制御する。訂正入力部60は、表示部にマッピング結果が表示された複数の関連画像の各々について、ラベル付与部により付与された正解ラベルの訂正入力を行うための入力装置であり、例えば、操作部15(図2参照)に含まれるマウスである。訂正処理部61は、訂正入力部60による訂正入力に応じて、誤り有ラベル付データセット22に格納された関連画像の各々に付与された正解ラベルを訂正して、訂正後の関連画像と正解ラベルを、誤り訂正済ラベル付データセット23に格納する。
また、学習サーバ1は、学習部63を備えている。学習部63は、上記の誤り訂正済ラベル付データセット23を用いて、既に管理サーバ8のアプリケーションDB42に格納されているアプリパッケージに含まれる既存のNNモデル(物体検出用NNモデル、及び物体認識用NNモデル)の再学習や、上記のアプリパッケージに未だ含まれていない新しいNNモデルの学習を行う。この学習又は再学習後のNNモデル(物体検出用NNモデル、及び物体認識用NNモデル)は、一旦、学習サーバ1から管理サーバ8に送られて、管理サーバ8のアプリケーションDB42に格納された後、適当なタイミングで、管理サーバ8から、各店舗内の分析ボックス3にインストールされる。
次に、図5乃至図9を参照して、上記の画像入力部51、画像収集部32、ラベリング部53、及びラベル訂正部56が行う、学習用データセットの半自動生成と訂正処理について、詳述する。まず、学習用データセットの半自動生成処理について、説明する。この学習用データセットの半自動生成処理は、主に、上記の画像入力部51、画像収集部32、及びラベリング部53によって行われる。
この学習用データセットの半自動生成処理では、図5に示すように、まず、画像入力部51を用いた種データセット19の入力処理を行う。この画像入力部51を用いた入力処理では、まず、システム管理者が、USBメモリカード25に格納された複数の画像や、通信部16を介して他のコンピュータから受信した複数の画像を、サンプル画像として入力した上で、操作部15を用いて、これらのサンプル画像にクラス分類の正解ラベルを付与し、種データとして、種データセット19に格納する。システム管理者が、種データセット19に格納する種データ(正解ラベルを付与したサンプル画像)の数は、例えば、20個程度である。
次に、システム管理者は、検出モデルDB20に格納された複数の物体検出用NNモデルのうち、上記の種データ(のサンプル画像)を精度良く検出することができる物体検出用NNモデルを、操作部15により選択する。例えば、半自動生成したい学習用データセットが、店員と顧客の分類を行う物体認識用NNモデルであった場合は、システム管理者は、店員及び顧客(のサンプル画像)を精度良く検出することができる物体検出用NNモデルを、操作部15により選択する。なお、物体検出用NNモデルの選択は、システム管理者が手動で行うのではなく、学習サーバ1のCPU11が、検出モデルDB20の物体検出用NNモデルを順に取得し、取得した各物体検出用NNモデルに種データを入力して正しく検出ができるかどうかを検査し、当該検査の結果、最も種データを正確に検出できた物体検出用NNモデルを自動的に選択するようにしてもよい。選択された物体検出用NNモデルは、通信部16(図2参照)により、各店舗に配された分析ボックス3a,3bにおける画像収集部32で用いる物体検出用NNモデルとして、分析ボックス3a,3bにインストールされる。
上記の物体検出用NNモデルのインストールにより、各店舗に配された分析ボックス3a,3b(の画像収集部32)が、カメラ2で撮影された撮影画像のうち、種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する複数の撮影画像(例えば、店員か顧客のいずれかに類似する撮影画像)を、関連画像として、収集することができる。分析ボックス3a,3bの画像収集部32は、マスク機能71を有しており、収集した関連画像が、人の顔を含む画像である場合は、関連画像中の顔にマスク処理を施すことができる。分析ボックス3a,3bは、必要に応じてマスク処理が施された関連画像を、学習サーバ1に送信する。学習サーバ1は、通信部16(図4中の「画像受信部52」に相当)により、分析ボックス3a,3bから送信された関連画像を受信して、生データDB21に格納する。
次に、学習サーバ1のCPU11は、図6に示すように、ラベリング部53による処理に移行する。このラベリング部53による処理では、まず、(ラベリング部53の)クラスタ形成部54(図4参照)によるクラスタ形成処理(クラスタリング)が行われる。具体的には、まず、上記の生データDB21に格納された関連画像を訓練データとして用いて、VAE(Variational Autoencoder)の学習(図6中の「VAE学習73」に相当)を行う。
ここで、図7を参照して、上記のVAEの概要について説明する。VAEは、通常のAE(Autoencoder(オートエンコーダ))と同様に、入力画像(データ)と同じ画像を出力するニューラルネットワークであり、図7に示すように、入力画像(データ)を潜在変数zに変換するニューラルネットワーク(エンコーダ)と、潜在変数zを入力して、元の入力画像(データ)を復元するニューラルネットワーク(デコーダ)とから構成される。ただし、VAEは、通常のオートエンコーダと異なり、図7に示すように、潜在変数zを確率分布(通常、z~N(0,1))という構造に押し込めている。すなわち、VAEにおける潜在変数zは、通常、平均値μ=0、分散σ=1の正規分布をとる。従って、VAEの場合は、同じ分類のデータは、中心値から分散1の正規分布をとるように学習が進む。例えば、手書き数字の「7」は、「7」の中心値(平均値)から分散1の正規分布をとるように、VAEの学習が進む。このため、VAEを利用すると、クラスタが非常に形成し易い(平均値から分散1の範囲にある(画像)データでクラスタを形成すればよい)。
次に、図6に戻って、ラベリング部53におけるクラスタリング・ラベリング74の処理について、説明する。図6中のクラスタリング・ラベリング74の処理は、図4中のクラスタ形成部54とラベル付与部55の機能ブロックが行う処理に相当する。具体的には、クラスタリング・ラベリング74の処理では、上記の生データDB21に格納された関連画像を訓練データとして用いたVAEの学習(「VAE学習73」)が完了した後に、この学習で得られたVAEのエンコーダに、種データセット19に格納された(種データの)サンプル画像を入力する。ここで、上記のように、学習済のVAEの場合は、同じ分類の(同じラベルの)画像に対応する潜在変数zは、中心値(平均値)から分散1の正規分布をとるので、学習済のVAEのエンコーダに、種データセット19に含まれるサンプル画像を入力することにより、これらのサンプル画像に付与された(クラス分類の正解)ラベルに応じたクラスタを、容易に形成することができる。
ただし、上記のように、学習済のVAEのエンコーダに、種データセット19に含まれるサンプル画像を入力するだけでは、例えば、潜在変数zの空間を2次元空間にした場合に、この空間の2軸を、クラス分類への寄与度の高い軸にしないと、ある(クラス分類の正解)ラベルが付されたサンプル画像に対応する潜在変数zの分布位置と、他のラベルが付されたサンプル画像に対応する潜在変数zの分布位置とがオーバーラップしてしまうので、サンプル画像に対応する潜在変数zの分布位置に基づいて形成した各ラベル毎のクラスタが、オーバーラップしてしまう。そこで、クラスタリング・ラベリング74に含まれるクラスタリング処理(図4中のクラスタ形成部54が行うクラスタ形成処理)では、クラス分類への寄与度の高い軸に重みを付ける(クラス分類への寄与度の高い軸を、主成分軸化する)方法を適用して、異なるクラスの(サンプル画像に対応する)潜在変数zの分布位置のオーバーラップ(異なるクラスのクラスタのオーバーラップ)を防いでいる。
次に、クラスタリング・ラベリング74に含まれるラベリング処理(図4中のラベル付与部55が行うラベル付与処理)について、説明する。このラベリング処理では、学習サーバ1のCPU11(のラベル付与部55)は、図5中の画像収集部32により収集した生データDB21内の複数の関連画像の各々を、上記の学習済のVAEのエンコーダに入力して、これらの関連画像に対応する潜在変数zが、上記のクラス分類への寄与度の高い2軸を主成分軸とした2次元平面上のいずれのクラスタ内に位置するかを判定する。言い換えると、学習サーバ1のCPU11は、まず、生データDB21内の複数の関連画像の各々を、上記の学習済のVAEのエンコーダに入力して、これらの関連画像に対応する潜在変数zを得て、これらの潜在変数zに基づき、生データDB21内の複数の関連画像の各々を、上記のクラス分類への寄与度の高い2軸を主成分軸とした2次元平面上にマッピングする。そして、上記のマッピングされた関連画像の各々が、上記のクラスタリング処理で形成したクラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、関連画像の各々に付与する。
例えば、半自動生成したい学習用データセットが、店員と顧客の分類を行う物体認識用NNモデルの学習用データセットであり、上記の関連画像が、店員又は顧客のサンプル画像に類似する撮影画像であった場合には、学習サーバ1のCPU11(のラベル付与部55)は、図6に示すように、顧客の(正解)ラベルに対応する第1クラスタ75内に含まれる(位置する)第1種類画像77には、顧客の正解ラベルを自動的に付与し、店員の(正解)ラベルに対応する第2クラスタ76内に含まれる(位置する)第2種類画像78には、店員の正解ラベルを自動的に付与する。これらの正解ラベルが自動付与された関連画像は、誤り有ラベル付データセット22に格納される。このように、データの分布状況から、正解ラベルを自動的に付与する技術はPseudo-Labeling(PL)と言われている。PLを行うための手段として前述のVAE等のオートエンコーダでの潜在変数の分布を利用する方法の他、様々な手法が提案されている。例えば、少ないデータセットで分類モデルの学習を行い、当該分類モデルでラベル無データの分類を行い、分類対象のラベル無データに、当該分類実施時に当該分類の確からしさが最も高いクラスをラベルとして付与する、という手法を採用してもよい。
ところが、上記のように、(種データセット19内の)少数の種データを用いて形成したクラスタに基づいて、生データDB21内の関連画像の各々に、正解ラベルを自動的に付与する方式では、どうしても、作成したデータセット(誤り有ラベル付データセット22)に誤りが含まれてしまう。すなわち、誤り有ラベル付データセット22には、付与する(正解)ラベルが間違ったデータが含まれてしまう。特に、各データクラス間(各クラスタ間)の境界付近においては、ラベリング誤りが発生しやすい。誤り有ラベル付データセット22に含まれるデータの精度(誤り有ラベル付データセット22に含まれるデータのうち、関連画像と正解ラベルの組み合わせが正しいデータの割合)は、例えば、8割程度である。
次に、図8及び図9を参照して、ラベル訂正部56により行われるラベル訂正処理について説明する。このラベル訂正処理は、上記のラベリング処理で生じたラベル付けの誤りを、ユーザ(システム管理者)が簡単に見つけることができるように、上記の関連画像(のサムネイル画像)を、上記のクラスタリング処理及びラベリング処理の説明で言及した、クラス分類への寄与度の高い2軸を主成分軸とした2次元平面上にマッピングして可視化し、簡易な手順で誤りを訂正できるようにしたものである。具体的には、学習サーバ1のCPU11(のラベル訂正部56)は、上記のクラスタリング処理で(種データセット19の種データを用いて)形成したクラスタ間の境界(図9におけるクラスタ間の境界83に相当)と、ラベリング処理で行った、クラス分類への寄与度の高い軸を主成分軸とした2次元平面上への関連画像の各々のマッピング結果(図9における顧客画像81及び店員画像82に相当)を、ディスプレイ14(表示部59)に表示する。要するに、図9の左側に示すラベル訂正前の画面は、上記のクラスタリング・ラベリング74により行われる関連画像の各々がいずれのクラスタに含まれるかの判定処理の結果を示す画面である。
図9にマッピングされている関連画像(顧客画像81及び店員画像82)は、誤り有ラベル付データセット22に格納された関連画像のサムネイル画像であってもよいし、上記のマッピング後における周囲の関連画像の平均値の画像のサムネイル画像であってもよい。なお、図9では、図を分かり易くするために、顧客画像81を、白丸で表し、店員画像82を、網掛けの付いた丸で表している。また、当該表示されるデータはデータ分布全体ではなく、各データクラス間(各クラスタ間)の境界部分をクローズアップし(境界部分が複数ある場合は、タブ等で複数のクローズアップされた部分を切り替えできる形式とし)、境界部分以外はラベル付けの誤りが発生する確率が低いため、当該表示の対象外にするという表示方法にしてもよい。
上記の可視化処理について、以下に詳述する。一般に、画像は、数100次元のベクトル(データ)の形式でVAE等のニューラルネットワークに入力されるため、上記のラベリング処理において、関連画像の各々(のベクトル(データ))を学習済のVAEのエンコーダに入力して得た結果(平均値μと分散σ、又は潜在変数z)は、数10~数100次元のベクトル(データ)になる。従って、潜在変数zに基づいて関連画像の各々をマッピングするためには、全ての関連画像の潜在変数zに基づいて、クラス分類への寄与度の高い2軸(第1主成分軸と第2主成分軸)を求めて、これらの2軸を用いた2次元平面上に、各関連画像をマッピングする必要がある。これにより、各関連画像の潜在変数zのベクトル次元を削減して、各関連画像のマッピング結果を可視化することができるからである。
図9の左側に示すように、学習サーバ1のCPU11(の表示制御部58(図4参照))は、上記の関連画像(顧客画像81及び店員画像82)の各々のマッピング結果を、クラスタリング処理で形成したクラスタ間の境界83と共に、ディスプレイ14に表示する。システム管理者は、図9の右側に示すように、ディスプレイ14に表示された(各正解ラベルに対応した)各クラスタ間の境界83を、操作部15(図2参照)に含まれるマウス(図4における訂正入力部60に相当)のドラッグ&ドロップ操作等で訂正入力することにより、ディスプレイ14にマッピング結果が表示された全ての関連画像について、ラベル付与部55により付与された正解ラベルの訂正入力を行うことができる。
そして、学習サーバ1のCPU11(の訂正処理部61)は、この訂正入力に応じて、誤り有ラベル付データセット22に格納された関連画像の各々に付与された正解ラベルを一括して訂正して、訂正後の関連画像と正解ラベルを、誤り訂正済ラベル付データセット23に格納する。従って、簡単な操作で、ラベル付与部55により付与された正解ラベルのうち、誤っている正解ラベルを一括して訂正することができる。そして、この誤り訂正済ラベル付データセット23(に格納されている教師データ(訓練データ))を用いて、学習サーバ1のCPU11(の学習部63)が、既存のNNモデルの再学習や、新しいNNモデルの学習を行う。
上記のように、本実施形態のデータセット生成システム10によれば、カメラ2で撮影された撮影画像から、種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する複数の関連画像を収集することにより、学習用データセットに含めるべき画像を選別することができる。また、種データセット19に含まれるサンプル画像を用いて、クラス分類の正解ラベルに応じたクラスタを形成した上で、上記の複数の関連画像の各々が、上記のクラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、上記の関連画像の各々に付与することができる。これにより、上記の学習用データセットに含めるべき画像として選別された画像(関連画像)へのラベル付けを、容易に行うことができる。従って、従来と異なり、管理部門のスタッフ等の人が、学習用データセットに含めるべき全ての画像の選別処理や、選別された全ての画像へのラベル付けを行うことなく、種データセット19に少量の種データ(少量のサンプル画像と、これらのサンプル画像に付与されるべきクラス分類の正解ラベル)を入力するだけで、物体検出用NNや、物体認識用NNの学習用データセットを、容易に(半自動的に)作成することができる。
また、本実施形態の学習サーバ1、及び学習用データセット生成訂正プログラム18によれば、カメラ2で撮影された撮影画像のうち、種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を受信することにより、学習用データセットに含めるべき画像を集めることができる。また、種データセット19に含まれるサンプル画像を用いて、クラス分類の正解ラベルに応じたクラスタを形成した上で、上記の複数の関連画像の各々が、上記のクラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、上記の関連画像の各々に付与することができる。これにより、上記の学習用データセットに含めるべき画像として選別された画像(関連画像)へのラベル付けを、容易に行うことができる。従って、従来と異なり、管理部門のスタッフ等の人が、学習用データセットに含めるべき全ての画像の選別処理や、選別された全ての画像へのラベル付けを行うことなく、種データセット19に少量の種データ(少量のサンプル画像と、これらのサンプル画像に付与されるべきクラス分類の正解ラベル)を入力するだけで、物体検出用ニューラルネットワークや、物体認識用ニューラルネットワークの学習用データセットを、容易に(半自動的に)作成することができる。
また、本実施形態のデータセット生成システム10、学習サーバ1、及び学習用データセット生成訂正プログラム18によれば、複数の関連画像を、クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングすることにより、複数の関連画像のマッピング結果を可視化して、このマッピング結果を表示することができる。これにより、ユーザ(システム管理者)が、表示された関連画像の各々のマッピング結果を見ながら、半自動的に生成された学習用データセット(誤り有ラベル付データセット22)における各関連画像の正解ラベルの訂正入力を行うことができる。
また、本実施形態のデータセット生成システム10によれば、複数の関連画像の各々を2次元平面又は3次元空間上にマッピングした結果が、クラスタの境界と共に表示部に表示される。そして、ユーザ(システム管理者)は、各正解ラベルのクラスタの境界を訂正するための入力を行うことにより、ラベル付与部55により自動的に付与された正解ラベルの訂正入力を行うことができる。従って、簡単な操作で、ラベル付与部55により付与された正解ラベルのうち、誤っている正解ラベルを一括して訂正することができる。
また、本実施形態のデータセット生成システム10によれば、クラス分類への寄与度の高い軸に重みを付けて、クラスタの形成処理を行うようにした。これにより、異なるクラスのクラスタがオーバーラップしてしまうことを防ぐことができる。
また、本実施形態のデータセット生成システム10によれば、VAEを利用して、クラス分類の正解ラベルに応じたクラスタの形成処理を行うようにした。一般に、VAEの場合は、同じ分類(同じクラス)のデータは、平均値(中心値)から分散1の正規分布をとるように学習が進むので、VAEを利用することにより、クラス分類の正解ラベルに応じたクラスタを容易に形成することができる。
変形例:
なお、本発明は、上記の各実施形態の構成に限られず、発明の趣旨を変更しない範囲で種々の変形が可能である。次に、本発明の変形例について説明する。
変形例1:
上記の実施形態では、分析ボックス3に画像収集部32を配して(分析ボックス3に、物体検出用NNモデルをインストールして)、この画像収集部32により、カメラ2で撮影された撮影画像のうち、種データセット19に含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を収集するようにした。けれども、この構成に限られず、例えば、各店舗に配するカメラを、いわゆるエッジコンピューティング機能を有するAI(Artificial Intelligence)カメラにして、このAIカメラに、種データ(のサンプル画像)を精度良く検出することができる物体検出用NNモデルをインストールし、複数の関連画像を収集するようにさせてもよい。また、学習サーバが、画像収集部32を有する構成にしてもよい。すなわち、学習サーバに、カメラで撮影された全ての撮影画像を送信して、学習サーバが、種データのサンプル画像を精度良く検出することができる物体検出用NNモデルを用いて、種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を収集(選別)するようにしてもよい。
変形例2:
上記の実施形態では、複数の関連画像の各々を、クラス分類への寄与度の高い2軸を主成分軸とした2次元平面上にマッピングすることにより、複数の関連画像のマッピング結果を可視化した。けれども、複数の関連画像の各々を、クラス分類への寄与度の高い3軸を主成分軸とした(3軸を用いた)3次元空間上にマッピングすることにより、複数の関連画像のマッピング結果を可視化するようにしてもよい。
変形例3:
上記の実施形態では、ディスプレイ14に表示された各クラスタ間の境界83を、マウスのドラッグ&ドロップ操作等で訂正入力することにより、ディスプレイ14にマッピング結果が表示された全ての関連画像について、ラベル付与部55により付与された正解ラベルの訂正入力を行うようにした。けれども、正解ラベルの訂正入力の方法は、これに限られず、例えば、ディスプレイ14にマッピング結果が表示された関連画像(のサムネイル画像)のうち、誤った正解ラベルに対応するクラスタに含まれている関連画像(のサムネイル画像)を、マウスのドラッグ操作で、正しい正解ラベルに対応するクラスタの方向に引っ張ることにより、正解ラベルの訂正入力を行うようにしてもよい。なお、この場合、ドラッグ操作で正しい(正解ラベルに対応する)クラスタの方向に引っ張られた関連画像(のサムネイル画像)の位置は変化せず、クラスタの境界(線)の方が変えられる(訂正される)。
変形例4:
上記の実施形態では、データセット生成システム10が、クラウドC上に、学習サーバ1とAI分析サーバ7と管理サーバ8とを備える場合の例を示したが、データセット生成システムの構成はこれに限られず、例えば、クラウド上に、学習サーバと管理サーバを備えていてもよいし、学習サーバのみを備えていてもよい。
1 学習サーバ
2 カメラ
10 データセット生成システム(学習用データセット生成システム)
11 CPU(クラスタ形成部、ラベル付与部、マッピング処理部、表示制御部、訂正処理部)
14 ディスプレイ(表示部)
15 操作部(訂正入力部)
18 学習用データセット生成訂正プログラム(学習用データセット生成プログラム)
19 種データセット
32 画像収集部
51 画像入力部
52 画像受信部
54 クラスタ形成部
55 ラベル付与部
57 マッピング処理部
58 表示制御部
59 表示部
60 訂正入力部
61 訂正処理部
83 境界(クラスタの境界)

Claims (9)

  1. 複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセットを入力する画像入力部と、
    前記種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像のうち、前記種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を収集する画像収集部と、
    前記画像入力部で入力された種データセットに含まれるサンプル画像を用いて、前記クラス分類の正解ラベルに応じたクラスタを形成するクラスタ形成部と、
    前記画像収集部により収集した複数の関連画像の各々が、前記クラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、前記関連画像の各々に付与するラベル付与部と
    前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うための訂正入力部と、
    前記訂正入力部による訂正入力に応じて、前記複数の関連画像の各々に付与された正解ラベルを訂正する訂正処理部とを備える学習用データセット生成システム。
  2. 前記複数の関連画像を、前記クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングするマッピング処理部と、
    前記マッピング処理部による前記複数の関連画像の各々のマッピング結果を表示する表示部とをさらに備え
    前記訂正入力部は、前記表示部にマッピング結果が表示された前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うためのものであることを特徴とする請求項1に記載の学習用データセット生成システム。
  3. 前記複数の関連画像の各々のマッピング結果を、前記クラスタ形成部により形成されたクラスタの境界と共に、前記表示部に表示するように制御する表示制御部をさらに備え、
    前記訂正入力部による訂正入力は、前記クラスタ形成部により形成された、各正解ラベルのクラスタの境界を訂正するための入力であることを特徴とする請求項2に記載の学習用データセット生成システム。
  4. 前記クラスタ形成部は、前記クラス分類への寄与度の高い軸に重みを付けて、前記クラスタの形成処理を行うことを特徴とする請求項1乃至請求項3のいずれか一項に記載の学習用データセット生成システム。
  5. 前記クラスタ形成部は、VAE(Variational Autoencoder)を利用して、前記クラスタの形成処理を行うことを特徴とする請求項1乃至請求項4のいずれか一項に記載の学習用データセット生成システム。
  6. 複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセットを入力する画像入力部と、
    カメラで撮影された撮影画像のうち、前記種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を受信する画像受信部と、
    前記画像入力部で入力された種データセットに含まれるサンプル画像を用いて、前記クラス分類の正解ラベルに応じたクラスタを形成するクラスタ形成部と、
    前記画像受信部により受信した複数の関連画像の各々が、前記クラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、前記関連画像の各々に付与するラベル付与部と
    前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うための訂正入力部と、
    前記訂正入力部による訂正入力に応じて、前記複数の関連画像の各々に付与された正解ラベルを訂正する訂正処理部とを備え、
    前記画像受信部が受信する関連画像は、前記種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像から収集された撮影画像である学習サーバ。
  7. 前記複数の関連画像を、前記クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングするマッピング処理部と、
    前記マッピング処理部による前記複数の関連画像の各々のマッピング結果を表示する表示部とをさらに備え、
    前記訂正入力部は、前記表示部にマッピング結果が表示された前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うためのものであることを特徴とする請求項6に記載の学習サーバ。
  8. コンピュータを、
    複数枚のサンプル画像と、これらのサンプル画像に付与されたクラス分類の正解ラベルとを含む教師データである種データセットを入力する画像入力部と、
    カメラで撮影された撮影画像のうち、前記種データセットに含まれる複数枚のサンプル画像の少なくともいずれかに類似する撮影画像である、複数の関連画像を受信する画像受信部と、
    前記画像入力部で入力された種データセットに含まれるサンプル画像を用いて、前記クラス分類の正解ラベルに応じたクラスタを形成するクラスタ形成部と、
    前記画像受信部により受信した複数の関連画像の各々が、前記クラスタのうち、いずれのクラスタに含まれるかを判定して、この判定結果のクラスタに応じた正解ラベルを、前記関連画像の各々に付与するラベル付与部と
    前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うための訂正入力部と、
    前記訂正入力部による訂正入力に応じて、前記複数の関連画像の各々に付与された正解ラベルを訂正する訂正処理部として機能させ
    前記画像受信部が受信する関連画像は、前記種データセットに含まれるサンプル画像を検出することが可能な物体検出用NNモデルを用いて、カメラで撮影された撮影画像から収集された撮影画像である学習用データセット生成プログラム。
  9. 前記コンピュータを、さらに、
    前記複数の関連画像を、前記クラス分類への寄与度の高い2軸又は3軸を用いた2次元平面又は3次元空間上にマッピングするマッピング処理部と、
    前記マッピング処理部による前記複数の関連画像の各々のマッピング結果を表示する表示部として機能させ
    前記訂正入力部は、前記表示部にマッピング結果が表示された前記複数の関連画像の各々について、前記ラベル付与部により付与された正解ラベルの訂正入力を行うためのものであることを特徴とする請求項8に記載の学習用データセット生成プログラム。
JP2019110810A 2019-06-14 2019-06-14 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム Active JP7355299B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019110810A JP7355299B2 (ja) 2019-06-14 2019-06-14 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019110810A JP7355299B2 (ja) 2019-06-14 2019-06-14 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム

Publications (2)

Publication Number Publication Date
JP2020204800A JP2020204800A (ja) 2020-12-24
JP7355299B2 true JP7355299B2 (ja) 2023-10-03

Family

ID=73837383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019110810A Active JP7355299B2 (ja) 2019-06-14 2019-06-14 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム

Country Status (1)

Country Link
JP (1) JP7355299B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784691B (zh) * 2020-12-31 2023-06-02 杭州海康威视数字技术股份有限公司 一种目标检测模型训练方法、目标检测方法和装置
JPWO2023058433A1 (ja) * 2021-10-06 2023-04-13

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007504480A (ja) 2003-06-10 2007-03-01 エイド・コーポレイション マルチチャネルデータのグラフィック表現を用いて基板の表面において生じる欠陥を分類するための方法及びシステム
WO2018154900A1 (ja) 2017-02-22 2018-08-30 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2019087012A (ja) 2017-11-07 2019-06-06 キヤノン株式会社 情報処理装置、情報処理方法、コンピュータプログラム、及び記憶媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2870415B2 (ja) * 1994-08-22 1999-03-17 日本電気株式会社 領域分割方法および装置
JP4132229B2 (ja) * 1998-06-03 2008-08-13 株式会社ルネサステクノロジ 欠陥分類方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007504480A (ja) 2003-06-10 2007-03-01 エイド・コーポレイション マルチチャネルデータのグラフィック表現を用いて基板の表面において生じる欠陥を分類するための方法及びシステム
WO2018154900A1 (ja) 2017-02-22 2018-08-30 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2019087012A (ja) 2017-11-07 2019-06-06 キヤノン株式会社 情報処理装置、情報処理方法、コンピュータプログラム、及び記憶媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
安富 優,解説 認識・検出 低コストなデータで学習可能なディープラーニングによる物体検出,画像ラボ 第30巻 第1号 Image Laboratory,日本,日本工業出版株式会社,2019年01月07日,第30巻,pp.43-47

Also Published As

Publication number Publication date
JP2020204800A (ja) 2020-12-24

Similar Documents

Publication Publication Date Title
JP7375006B2 (ja) 画像セマンティックセグメンテーションネットワークのトレーニング方法、装置、機器及びコンピュータプログラム
Li et al. Localizing and quantifying damage in social media images
US10828000B2 (en) Medical image data analysis
WO2018170311A1 (en) Mixed-initiative machine learning systems and methods for determining segmentations
CN109191424B (zh) 一种乳腺肿块检测与分类系统、计算机可读存储介质
CN113139628B (zh) 样本图像的识别方法、装置、设备及可读存储介质
CN112070135A (zh) 电力设备图像检测方法、装置、电力设备及存储介质
CN110009038B (zh) 筛查模型的训练方法、装置及存储介质
US20220092407A1 (en) Transfer learning with machine learning systems
JP7355299B2 (ja) 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム
Li et al. Localizing and quantifying infrastructure damage using class activation mapping approaches
CN111159241B (zh) 一种点击转化预估方法及装置
CN115908988A (zh) 一种缺陷检测模型生成方法、装置、设备以及存储介质
US20230297886A1 (en) Cluster targeting for use in machine learning
Sameki et al. ICORD: Intelligent Collection of Redundant Data-A Dynamic System for Crowdsourcing Cell Segmentations Accurately and Efficiently.
WO2024045319A1 (zh) 人脸图像聚类方法、装置、电子设备及存储介质
KR20200124887A (ko) 데이터 프로그래밍에 기반한 레이블링 모델 생성 방법 및 장치
CN114114457A (zh) 基于多模态测井数据的裂缝表征方法、装置及设备
KR20210031444A (ko) 데이터 프로그래밍에 기반한 레이블링 모델 생성 방법 및 장치
CN111582404A (zh) 内容分类方法、装置及可读存储介质
Kardawi et al. A Comparative Analysis of Deep Learning Models for Detection of Knee Osteoarthritis Disease through Mobile Apps
Vidyabharathi et al. Enhancing crack detection with convolutional neural networks and oriented non-maximal suppression
JP2020181265A (ja) 情報処理装置、システム、情報処理方法及びプログラム
CN115496931B (zh) 一种工业机器人健康监测方法及系统
CN117574098B (zh) 一种学习专注度分析方法以及相关装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230908

R150 Certificate of patent or registration of utility model

Ref document number: 7355299

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150