JP2023063063A - 教師データ生成装置 - Google Patents
教師データ生成装置 Download PDFInfo
- Publication number
- JP2023063063A JP2023063063A JP2021173328A JP2021173328A JP2023063063A JP 2023063063 A JP2023063063 A JP 2023063063A JP 2021173328 A JP2021173328 A JP 2021173328A JP 2021173328 A JP2021173328 A JP 2021173328A JP 2023063063 A JP2023063063 A JP 2023063063A
- Authority
- JP
- Japan
- Prior art keywords
- image
- likelihood
- teacher data
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims description 63
- 238000012549 training Methods 0.000 claims description 45
- 230000008859 change Effects 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009966 trimming Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000013500 data storage Methods 0.000 description 22
- 238000000034 method Methods 0.000 description 21
- 238000002372 labelling Methods 0.000 description 13
- 230000010365 information processing Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Abstract
【課題】 生成した教師データによって、モデルの学習効率が低下することなく、教師データの多様性の幅が拡充可能な教師データを生成することが難しい場合があった。【解決手段】 教師データ生成装置において、画像生成部と、画像に対してラベルデータを付与する正解ラベル付与部と、画像が教師データとして尤もらしいかを示す教師データ尤度の推定を行う教師データ尤度推推定モデルを出力する尤度学習部と、前記教師データ尤度推推定モデルを用いて、画像の教師データ尤度を推定する尤度推論部を有し、前記尤度推論部によって推定された教師データ尤度が閾値以上の画像と、画像に付与されたラベルデータとを教師データとすることを特徴とした教師データ生成装置。【選択図】 図3
Description
本発明は画像データ生成に関し、特に学習に用いる教師データを効率的に選定可能な教師データ生成装置に関するものである。
近年、ディープラーニング技術を含む機械学習を用いた画像の認識、分類、検出への取り組みが多く行われている。例えば、この機械学習を用いた画像の認識では、入力された画像に対して、認識に必要なラベルをラベリングするモデル(以降、画像認識モデル)が用いられる。
その機械学習の一例として、予め正しいラベルが付された画像(教師データ)を用い、画像認識モデルを定義するパラメータを機械的に学習し、学習された画像認識モデルを用いて、未知画像のラベルを推論することで、画像を認識する方法が知られている。
このような機械学習における、画像認識モデルのようなモデルの学習時には、画像の数が不足すると効果的な学習を行うことができないため、多数の教師データを用意する必要がある。
そこで、特許文献1では既存の教師データに対して画像の反転、異なる画像との合成、色調補正といった画像処理を施すことで教師データの生成に関する技術が述べられている。
しかしながら、特許文献1では教師データから新規生成した教師データの質に対して、言及をしていない。そのため、新規に生成した教師データが、教師データとしての尤度(以後、教師データ尤度)が小さい場合に、画像認識モデルの学習効率が低下してしまう課題がある。
この課題は、教師データの新規生成において、教師データに対して予め定めたパターンに従って所定の画像処理を施すことで、モデルの学習効率の低下をある程度抑制可能である。しかし、その場合は新規に生成が可能な教師データの多様性の幅を狭めることになり、学習効率が上がりにくい課題がある。
そこで、本発明では、これらの課題を鑑み、生成した教師データによって、モデルの学習効率が低下することなく、教師データの多様性の幅が拡充可能な教師データ生成することを目的とする。
教師データ生成装置において、画像生成部と、画像に対してラベルデータを付与する正解ラベル付与部と、画像が教師データとして尤もらしいかを示す教師データ尤度の推定を行う尤度推定モデルを出力する尤度学習部と、前記尤度推推定モデルを用いて、画像の教師データ尤度を推定する尤度推論部を有し、前記尤度推論部によって推定された教師データ尤度が閾値以上の画像と、画像に付与されたラベルデータとを教師データとすることを特徴とした教師データ生成装置。
尤度推論部において、推定に用いる尤度推定モデルの学習が十分であれば、画像認識モデルの学習効率を低下させることなく、教師データの多様性の幅が拡充容易な教師データ生成装置を提供することが可能となる。
以下に、本発明の好ましい実施の形態を、図面に基づいて詳細に説明する。
(実施形態)
まず、本発明を利用したシステム構成例(図1)を説明する。
まず、本発明を利用したシステム構成例(図1)を説明する。
本実施形態におけるシステム構成は、図1で示すように、教師データ生成装置100、学習・推論サーバー107、画像収集サーバー108と、クライアント端末106が、ネットワーク109を介して接続される。
本発明である教師データ生成装置100のシステム構成を述べる前に、教師データ生成装置100と、ネットワーク109を介在して接続されるクライアント端末106、学習・推論サーバー107、画像収集サーバー108に関して説明する。
クライアント端末106は、本システムとユーザとのインターフェースを担う。そのため、クライアント端末はユーザからの正解ラベルデータの入力を受け付け、ネットワークを介して、後述するサーバーへの処理を促す。そして、教師データ生成装置100に対しては、教師データの生成指示と、正解ラベル情報提供を行う。
学習・推論サーバー107は、ユーザが所望する機械学習モデルに対する学習や推論のサービスを担う。本実施形態では、画像認識モデルの学習、推論を行うものとする。
なお、画像認識モデル以外にも、画像分類モデル、画像からの被写体検出モデルなど画像を扱かった機械学習であれば問題ない。
画像収集サーバー108は、本発明を利用したシステムにおいて、画像や画像に紐づいたデータを格納する。本実施形態では、画像収集サーバー108は、少なくとも、学習・推論サーバー107の学習に必要な教師データを保持するものとする。
次に、教師データ生成装置100のシステム構成を説明する。
教師データ生成装置100は、前述したとおり、クライアント端末106から教師データの生成指示と、教師データ生成に必要な正解ラベル情報を受け付け、教師データ生成サービスを実施する。これによって生成された教師データは、画像収集サーバー108に格納される。
教師データ生成装置100の内部は、画像生成サーバー101、画像収集サーバー102、尤度学習サーバー103、尤度推論サーバー104、ラベル付与サーバー105で構成される。
画像生成サーバー101は、クライアント端末106からの教師データ生成指示を受け、任意の画像処理を施すことで新たな教師データ用の画像を生成し、画像収集サーバー102に格納する。
画像収集サーバー102は教師データ生成装置100内で、利用される画像および画像に関するデータ群を格納する。例えば、画像生成サーバー101で生成された画像と、画像に紐づくラベル情報や画像生成処理内容といったデータを合わせて格納してもよい。
尤度学習サーバー103は、教師データとしての尤度を推定するモデル(尤度推定モデル)の学習を行な行い、モデルを実現するパラメータを尤度推論サーバー104に出力する。なお、尤度推定モデルの詳細に関しては、図6を用いて、後述する。
尤度推論サーバー104は、尤度推定モデルを用いて画像の教師データ尤度を推定する。推定された教師データ尤度は、ラベル付与サーバー105へと出力される。
ラベル付与サーバー105は、画像の教師データ尤度を用いて、教師データとしての可否を判定し、教師データとして可となった場合には、該当する画像に正解ラベルを付与して、ネットワークを介し画像収集サーバー108に格納する。
以上が本実施形態におけるシステム構成に関する説明である。
続いて、これらのシステムに対してハードウェア構成に関して、図2を用いて説明する。図2は図1のシステムを構成する各情報処理装置のハードウェア構成を示す図である。また、情報処理装置の構成部の中で、差がないものは同じ付番を付けて説明を省略する。
CPU201は、各情報処理装置の制御プログラムを後述のROM202より読み出し、後述のRAM203に展開して実行する。これにより、CPU201は、システムバス205を介して、情報処理装置内の各ブロックを制御する。
ROM202は、電気的に消去・記録可能な不揮発性メモリであり、各情報処理装置の動作プログラムに加え、動作に必要なパラメータなどを記憶する。
RAM203は、書き換え可能な揮発性メモリであり、CPU201が実行するプログラムの展開や、情報処理装置の動作で生成されたデータの一時的な記憶等に用いられる。
HDD204は、書き換え可能な揮発性メモリであり、情報処理装置の動作に用いる画像、各種パラメータを記憶する。
システムバス205は、各情報処理装置内のデータの送受信に利用される。
NIC206は、各情報処理装置をネットワーク109に接続するための装置である。NIC206は、各情報処理装置間のデータの送受信に利用される。
GPU207は、尤度学習サーバー103、尤度推論サーバー104、学習・推論サーバー107において、学習および推論プログラム実行時に各情報処理装置の動作を制御する。
GPU207はデータをより多く並列よりすることで効率的な演算を行うことができるので、ディープラーニングのような学習モデルを用いて複数回にわたり学習を行う場合にはGPU209で処理を行うことが有効である。
そこで本実施形態では、学習、推論による処理にはCPU201に加えてGPU207を用いる。具体的には、学習モデルを含む学習プログラムを実行する場合に、CPU201とGPU207が協働して演算を行うことで学習を行う。なお、学習処理はCPU201またはGPU207のみにより演算が行われても良い。また、推論処理も学習処理と同様にGPU207を用いても良い。
入力部208は、後述の表示部209とキーボード、マウスやタッチパネル、ボタン等を介して、ユーザからの指示を教師データ生成装置100に反映するためのインターフェースである(指示受付部)。例えば、入力部208を介して、教師データを生成する際の正解ラベルデータの指定、画像生成する際の画像パラメータの指定が行われる。
表示部209は、LCD等の表示デバイスであり、RAM203やHDD204に記録されている画像の表示、ユーザからの指示を受け付けるための操作ユーザーインターフェイスの表示等を行う。
なお、本実施形態では、図1のシステム構成のサーバー単位に、図2で示すように個別にハードウェア資源を割り当てているが、これに限らなくてよい。教師データ生成装置100が、1つのGPUを備えた情報処理装置210で実施してもよい。
続いて、図2のハードウェア構成図で示したハードウェア資源とプログラムを利用することで実現されるソフトウェア構成に関して、図3、図4を用いて説明する。図3は図2のハードウェア構成図で示したハードウェア資源とプログラムを利用することで実現されるソフトウェア構成を示す図である。図4は本実施形態における尤度推定モデルを説明する図である。
図3のソフトウェア構成はCPU201、GPU207がROM202より動作プログラムを読み出し、RAM203に展開して実行することで実現される。
図3において、教師データ生成装置100は画像の生成を行い、画像の教師データ尤度の推定を利用して、教師データを生成する。
画像生成サーバー101は、データ記憶部310、画像生成パラメータ決定部311、画像生成部312によって構成される。
画像生成パラメータ決定部311は、指定された画像処理に対し、画像生成パラメータを決定する。ここでの画像生成パラメータは、画像の拡大縮小、回転、左右反転、重畳位置、ホワイトバランス、明るさ補正等の任意の画像処理における効果の度合いを示すパラメータである。ここで決定されたパラメータに基づき、画像回転処理や画像反転処理、拡大縮小処理、重畳合成処理などが実行される。
画像生成部312は、画像生成パラメータ決定部311によって決定された画像生成パラメータに従い、画像処理を行う。
データ記憶部310は、画像生成パラメータ決定部311が決定した画像生成パラメータ、画像生成部312の入出力画像を記憶する。
画像収集サーバー102は、データ記憶部320によって構成される。
データ記憶部320は、画像生成部312が生成した画像を記憶する。記憶された画像は後述する尤度学習部332、尤度推論部340、正解ラベル付与部352の処理に利用される。
尤度学習サーバー103は、データ記憶部330、教師データ尤度ラベル付与部331、尤度学習部332によって構成される。
データ記憶部330は、尤度学習サーバー103で利用する画像やパラメータを格納する。またこれら画像と教師データ尤度ラベルとパラメータ、尤度推定モデルごとに、管理され、必要に応じて、尤度学習サーバー内で読み出し、書き出し利用される。
教師データ尤度ラベル付与部331は、画像に教師データ尤度ラベルを付与する。教師データ尤度ラベルは、少なくとも、後述の尤度学習部332での尤度推定モデルの学習に必要な教師データ尤度を含む。
本実施形態においては、データ記憶部330から読みだされた画像に一律、画像が教師データであることを表す100という数値を付与し、尤度学習部332に出力する。
尤度学習部332は、教師データ尤度ラベルが付与された画像を教師データとして、画像の教師データ尤度について学習を行い、尤度推定モデルを生成する。尤度学習部332は、尤度推定モデルの精度が閾値以上になるまで学習を行う。
学習の具体的なアルゴリズムとしては、最近傍法、ナイーブベイズ法、決定木、サポートベクターマシンなどが挙げられる。また、ニューラルネットワークを利用して、学習するための特徴量、結合重み付け係数を自ら生成する深層学習(ディープラーニング)も挙げられる。適宜、上記アルゴリズムのうち利用できるものを用いて本実施形態に適用することができる。本実施形態では、深層学習を用いる。
ここで、図4を用いて、生成した画像から尤度を推定する尤度推定モデルに関して説明する。図4は尤度推定モデルの例であり、尤度推定モデル402は多数のニューラルネットワークから構成される。
本実施例において、尤度推定モデル402への入力401は、画像生成部が生成した画像であり、出力403は、画像の教師データとしての尤度である。
また、この尤度推定モデル402の学習方法に関する処理フローは図6を用いて、後述する。
次に、図3を用いたソフトウェア構成の説明に戻り、尤度推論部340以降を説明する。
データ記憶部330は、尤度推定モデル402の学習に必要な教師データや、尤度推定モデル402を構成するパラメータを格納している。
また、尤度推定モデルは、推定したい教師データ尤度の種類に応じて、2つ以上のモデルを備えていても良い。その際の尤度モデルを識別するための管理データも格納してもよい。
なお、学習済みの尤度推定モデル402があらかじめ入手可能な場合は、尤度学習サーバー103は、ネットワーク109を介し、尤度推定モデル402の情報を取得してもよい。
そして、取得した尤度推定モデル402に対して、尤度学習部332が前記モデルを強化するような追加の学習を施してもよいし、尤度推論部340へ、尤度推定モデルの情報を出力してもよい。
尤度推論サーバー104は、尤度推論部340によって構成される。
尤度推論部340は、前述の尤度学習サーバー103から得た尤度推定モデル402を用いて、画像収集サーバー102に格納されている画像を入力し、得られた画像に対する教師データ尤度の推定値をラベル付与サーバー105に出力する。
ラベル付与サーバー105は、データ記憶部350、尤度判定部351、正解ラベル付与部352によって構成される。
尤度判定部351は、尤度推論部340によって推定された画像の教師データ尤度が閾値以上であるか否かを判定する。
正解ラベル付与部352は、データ記憶部320の画像に対して正解ラベルを生成付与し、画像および正解ラベルを教師データとして出力し、データ記憶部380へ格納する。
教師データ生成指示部360は、クライアント端末106に位置し、ユーザと、教師データ生成装置100とのインターフェースを担う。具体的は、ユーザの入力部208へのキー入力を、教師データ生成装置100への画像生成サーバー101や、ラベル付与サーバー105への入力情報に変換する。また、画像生成サーバー101からの生成した画像を表示部209に表示し、所定のユーザ入力を要求する処理も担う。
学習部370は、本発明である教師データ生成装置100が出力し、データ記憶部380に格納した教師データを入力として、ユーザの機械学習モデルの学習処理を行う。
この学習部370の学習進捗の度合いに応じて、教師データ生成指示部360は、教師データ生成装置への新規教師データ生成の指示を行なわれる。
以上で、本発明の実施形態におけるソフトウェア構成に関して説明した。
続けて、前述のソフトウェア構成による、本発明の実施における処理フローに関して、図5から図7を用いて説明をする。図5は、本実施例における教師データについて説明する図である。図6は、本実施例における尤度推定モデルの学習に関する処理フローである。図7は、本実施例における一連の教師データ生成処理に関する処理フローである。
まず、図5を用いて、本実施例において、クライアント端末からの指示により、新規に生成する教師データに関して説明する。
本実施例では、クライアントは、「被写体ではなく手前の障害物に合焦してしまった画像」を教師データとして生成したいものとする。
また、教師データを生成するに至って、クライアント端末から教師データ生成装置へと入力される教師データは、図5(a)に示す。図5(a)は、被写体(猫)501の手前に障害物(檻)502があり、障害物(檻)側に合焦している。
そこで、画像生成部は、図5(a)の教師データから、同じラベルが付与された画像の参照、画像の切り出し、画像同士の合成処理といった画像処理を施すことで、図5(b)に示すような画像群を生成できる。また、図5(b)の画像のそれぞれの画像における特徴を図5(c)に表にしている。
図5(b)(c)からわかるように、画像503から画像505までは、ユーザの意図である「被写体ではなく手前の障害物に合焦してしまった画像」のため、教師データとして適切(尤度として大きくなるべき画像)である。また、画像506、507は意図に沿えておらず、教師データとして不適切(尤度としては低くなるべき画像)である。
また、画像505のように、ユーザの意図は汲めているが、画像内の被写体と障害物の位置関係が現実的ではない場合においても、不適切(尤度としては低くなるべき画像)だといえる。
そしてまた、例えば、ユーザが「猫が写っている画像」を教師データ生成したい場合においては、画像506、507が適切で、それ以外の画像が不適切となる。
このように、教師データ生成に求められる画像は、ユーザが学習・推論サーバー107で学習させたい内容に強く依存していることがわかる。
続いて、前述の、尤度学習サーバー103における尤度推定モデル402の学習に関する処理フローを、図6を用いて説明する。図6は本実施例における尤度推定モデルの学習に関する処理フローである。
ステップS601において、教師データ尤度ラベル付与部331は、学習のための教師データを取得する。
本実施例では、尤度学習部332が教師データとなる画像群を、ネットワーク109を通じて取得し、データ記憶部330に保存する。教師データ尤度ラベル付与部331は、保存された画像群に対して、尤度ありのラベルを貼る。
ステップS602において、尤度学習部332は画像に対する推定結果と教師データとの差を最小化するよう尤度学習部332内部のパラメータを更新することで尤度推定モデル402の学習を行なう。
具体的には、尤度学習部332は、損失関数を用いて、ニューラルネットワークからの出力データと入力した教師データとの誤差を計算する。
そして、得られた誤差が小さくなるように、ニューラルネットワークのノード間の結合重み付け係数等を更新する。この更新は、例えば、公知の技術である誤差逆伝播法を用いて行われる。
これにより、尤度学習部332は既存の教師データの画像に見た目が近い画像ほど教師データ尤度が高く推定され、見た目が遠い画像ほど教師データ尤度が小さく推定されるように学習が進行する。
ステップS603において、尤度学習部332は尤度推定モデル402の精度が閾値以上か否かを判定する。
尤度学習部332が尤度推定モデル402の精度を閾値以上であると判定した場合、処理はステップS604に進む。この時、尤度推定モデル402は、学習済みモデルとして、尤度推論サーバー104での利用が可能となる。
尤度学習部332が尤度推定モデル402の精度を閾値未満であると判定した場合、処理はステップS601に進む。
ステップS604において、尤度学習部332は精度が閾値以上となった尤度推定モデル402の情報を尤度学習サーバー103のデータ記憶部330に書き出し、尤度推論サーバー104へ情報出力する。
以上、教師画像生成装置100における尤度推定モデル402の学習済みモデルの学習方法に関する実施方法を述べた。
続いて、この尤度推定モデル402を用いた、教師データ生成の処理フローに関して、図7を用いて説明する。図7は本発明の本実施形態における教師データ生成に関する処理フロー図である。
図7のフローチャートを参照しながら、合成画像の生成処理、教師データ尤度の推論処理と、教師データ生成処理の流れを説明する。
ステップS701において、画像生成サーバー101の画像生成パラメータ決定部311は画像生成パラメータを決定し、決定された画像生成パラメータは、同サーバーのデータ記憶部310に記憶される。
例えば、図5の503の画像を生成時における画像生成パラメータは、入力である教師データ501に対して、別の画像(金網やフェンス)を合成するといった具合である。
ステップS702において、画像生成サーバー101の画像処理部312は、同サーバーのデータ記憶部310から画像生成パラメータを読み出す。そして、所定の画像処理を施した後、生成した画像と、正解ラベルデータを画像収集サーバー102のデータ記憶部320へ書き出す。
例えば、一枚の教師データ画像から新しい画像を生成する場合は、画像に対してトリミング処理、色調補正処理、ぼかし処理のうち、任意の画像処理が適用されればよい。
また、教師データ画像を含む二つ以上の画像から新しい画像を生成する場合は、それぞれの画像処理パラメータに加えて、画像の重畳処理が適用されればよい。
なお、生成された画像に、画像処理内容を反映した正解ラベルデータを付与してもよい。例えば、画像合成がなされた際には、新しい正解ラベルとして、合成前のそれぞれの正解ラベルの内容を足し込むことで更新してもよい。
また、画像処理内容を反映した正解ラベルデータは、クライアント端末106の表示部209で生成した画像を表示し、入力部208からの入力を促すことで、ユーザにより内容を更新してもよい。
ステップS703において、尤度推論サーバー104の尤度推論部340は、画像収集サーバー102のデータ記憶部320から書き出された画像を読み出し、そして、尤度推定モデルへ入力することで教師データ尤度を得る。得られた教師データ尤度は、ラベル付与サーバー105の尤度判定部351へ出力される。
ステップS704で、ラベル付与サーバー105の尤度判定部351は、ステップS703で得た教師データ尤度を用い、ステップS702で画像収集サーバー102のデータ記憶部320に書き出した新規生成画像を、新規教師データとして扱うか否か判定する。
尤度判定部351が推定された教師データ尤度を所定の閾値以上であると判定した場合、処理はステップS705へ進む。
尤度判定部351が推定された教師データ尤度を閾値未満であると判定した場合、処理はステップS701へ進む。
ステップS705において、ラベル付与サーバー105の正解ラベル付与部352は、新規生成画像に対する正解ラベルを付与し、教師データとして、画像収集サーバー108のデータ記憶部180へ書き出し出力する。
なお、ここで付与される正解ラベルは、新規生成画像の正解ラベルであれば、生成方式に関しては特に言及しない。例えば、新規生成画像を、クライアント端末106に表示し、ユーザにその画像に対する正解ラベルの入力を促しても良い。この他にも、正解ラベル付与部352が、新規生成時に施された画像処理内容から、元画像の正解ラベルに対するラベル更新処理を行うことで、その更新された正解ラベルを付与してもよい。
本処理によれば、教師データ生成において、生成された画像の教師データとしての尤度を推定し、その尤度を用いて教師データとしての可否を判定する。
続いて、複数の教師データを連続的に生成する場合の振る舞いに関して図8を用いて説明する。図8は、本発明の本実施形態における複数の教師データを連続的に生成時の処理フロー図である。なお、図8において、ステップS701からS705は、前述の図7を用いた教師データ生成処理フローと同じ処理のため、詳細説明は省略する。
ステップS801において、クライアント端末106の教師データ生成指示部360は、画像生成サーバー101の画像生成部312に教師データの新規生成数Nを指示する。また、生成枚数の管理変数nも0に初期化する。本実施例においては、新規生成数N=10とする。
ステップS701からステップS705の処理は、基本的に前述した内容と同様である。
ここでは、複数の教師データを連続的に生成する場合において、差分となる処理にのみ説明する。
ステップS704において、尤度判定部351が推定された教師データ尤度を閾値未満であると判定した場合、処理はステップS805へ進む。
ステップS802において、ラベル付与サーバー105は、ステップS705で出力された新規生成された教師データに対して、推定された教師データ尤度を付与し、第二の教師データとして、画像収集サーバー102もしくは、108へ出力する。
これにより、クライアント端末106は、これらの第二の教師データを参照し、新規生成した教師データを教師データ尤度によって分類、選別して学習部370の学習に利用してもよい。
また、第二の教師データの構成として、教師データ尤度の他に、例えば、画像生成時に用いた画像やパラメータを含めてもよい。
ステップS803において、画像生成部102は、生成枚数の管理変数nを1つインクリメントする。
ステップS804において、画像生成部102は、生成枚数の管理変数nが新規生成数Nに到達したか否かを判定する。
画像生成部102が管理変数nを新規生成数Nに到達したと判定した場合、処理を終了する。
画像生成部102が管理変数nを新規生成数Nに到達していないと判定した場合、処理はステップS806へ進む。
ステップS805において、画像生成サーバー101の画像生成パラメータ決定部311は前処理のステップS704における尤度の閾値との差分が大きいほど、教師データ尤度への変化が大きくなるように重み付けして画像生成パラメータを算出する。
算出された画像生成パラメータは、同サーバーのデータ記憶部310に記憶される。
例えば、教師データ尤度が低い時には、合成処理に用いる画像を差し替えるや、画像の合成位置関係を大きくするといった画像生成パラメータにしてもよい。
なお、ここでの処理の別の方法として、クライアント端末106の表示部209に対して、教師データ生成に関する警告表示を行なうことで、ユーザから、教師データ尤度が大きくなるような画像生成パラメータの入力指示を促してもよい。
ステップS806において、画像生成サーバー101の画像生成パラメータ決定部311は教師データ尤度への変化が小さく、かつ教師データのラベル差分が大きくなるように、重み付けして画像生成パラメータを算出する。算出された画像生成パラメータは、同サーバーのデータ記憶部310に記憶される。例えば、画像生成パラメータごとに、過去、教師データ尤度がより高く出たものが選択されやすいように重み付けしてもよい。
または、比較的教師データ尤度が大きく変化し易い、合成処理などの複数の画像を用いた画像処理の処理度合いを少なくなるように重み付けしてもよい。
そしてまた、画像に付与されるラベルが新規であるほど、選択されやすいように重み付けしてもよい。
これにより、新たな教師データを必要としている機械学習モデルにおける学習効率を低下させることなく、多様な教師データの生成が可能となる教師データ生成装置を提供することが可能となる。
なお本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
例えば、教師データ生成指示部360が、画像生成パラメータ決定部311で算出された画像生成パラメータや、正解ラベル付与部352で生成された正解ラベルデータ、尤度判定部で用いる尤度閾値の確認ができるようにしてもよい。
そしてまた、確認したパラメータに対して、ユーザ意図を反映できるように教師データ生成指示部360が、パラメータ変更できるようにしてもよい。
Claims (10)
- 教師データ生成装置において、
画像生成部と、
画像に対してラベルデータを付与する正解ラベル付与部と、
画像が教師データとして尤もらしいかを示す教師データの尤度推定モデルを出力する尤度学習部と、
前記尤度推定モデルを用いて、画像の教師データ尤度を推定する尤度推論部を有し、
前記尤度推論部によって推定された教師データ尤度が閾値以上の画像と、画像に付与されたラベルデータとを教師データとすることを特徴とした教師データ生成装置。 - 前記画像生成部は
画像に対する画像処理を決定する画像生成パラメータ決定部を有し、
その画像生成パラメータに従って、画像に対してトリミング処理、色調補正処理、ぼかし処理のうち、任意の画像処理を適用して画像を生成すること
を特徴とする請求項1記載の教師データ生成装置。 - 前記画像生成パラメータ決定部は
二つ以上の画像を用いた画像処理の画像生成パラメータを決定し、その画像生成パラメータに従って、二つ以上の画像に対して、トリミング処理、画像回転処理、画像反転処理、画像の拡大縮小処理のうち任意の画像処理を適用し、画像同士を任意の位置関係となるように重畳合成することで画像を生成することを
特徴とする請求項2記載の教師データ生成装置。 - 前記画像生成部は、
画像に付与されている正解ラベルに対し、
前記画像生成パラメータ決定部が決定した画像生成パラメータに応じた前記正解ラベルの更新処理を行い、更新した後の正解ラベルを、生成した画像へ付与すること
を特徴とする請求項3に記載の教師データ生成装置。 - 指示受付部を有し、
指示受付部は、生成する画像に対して、少なくとも画像生成パラメータ、正解ラベルデータ、教師データ尤度を受け付け、
受け付けたとき前記画像生成パラメータを前記画像生成部で用いて、画像生成し、
前記正解ラベルデータを前記正解ラベル付与部で用いて、生成した後の画像に付与し、
前記教師データ尤度を尤度判定部で、尤度閾値として用いること
を特徴とした請求項4に記載の教師データ生成装置。 - 前記尤度推論部によって推定された教師データ尤度が閾値以上の画像と、画像に付与されたラベルデータを第一の教師データとして出力するのとは別に、前記画像と前記推定された教師データ尤度を第二の教師データとして出力すること
を特徴とした請求項5に記載の教師データ生成装置。 - 前記尤度推論部によって推定された教師データ尤度が閾値以上の画像と、
前記推定された教師データ尤度と、
前記画像生成に用いた画像と、
前記画像生成パラメータと、
前記正解ラベルデータを含むこと
を特徴とする請求項6に記載の第二の教師データ。 - 前記尤度推論部によって推定された教師データ尤度を
前記画像生成パラメータ決定部に入力するパラメータとし、
教師データ尤度に応じて、画像生成パラメータの算出方法を切り替えること
を特徴とする請求項7に記載の教師データ生成装置。 - 教師データを連続して生成する際に、前記教師データ尤度が所定の閾値以上でない場合は、
前記画像生成パラメータ決定部が、次の画像生成パラメータを、教師データ尤度の変化が大きくなるように重みを付けて算出すること
を特徴とする請求項8に記載の教師データ生成装置。 - 教師データを連続して生成する際に、前記教師データ尤度が所定の閾値以上の場合は、
前記画像生成パラメータ決定部が、次の画像生成パラメータを、教師データ尤度の変化が小さく、教師データのラベル差分が大きくなるように重みを付けて算出すること
を特徴とする請求項8に記載の教師データ生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021173328A JP2023063063A (ja) | 2021-10-22 | 2021-10-22 | 教師データ生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021173328A JP2023063063A (ja) | 2021-10-22 | 2021-10-22 | 教師データ生成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023063063A true JP2023063063A (ja) | 2023-05-09 |
Family
ID=86270527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021173328A Pending JP2023063063A (ja) | 2021-10-22 | 2021-10-22 | 教師データ生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023063063A (ja) |
-
2021
- 2021-10-22 JP JP2021173328A patent/JP2023063063A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11003995B2 (en) | Semi-supervised regression with generative adversarial networks | |
WO2018063840A1 (en) | Learning coach for machine learning system | |
KR20200022739A (ko) | 데이터 증강에 기초한 인식 모델 트레이닝 방법 및 장치, 이미지 인식 방법 및 장치 | |
US11551057B2 (en) | Systems and methods for generating data explanations for neural networks and related systems | |
US10614347B2 (en) | Identifying parameter image adjustments using image variation and sequential processing | |
JP2020013563A (ja) | 意味的情報に基づいてフォトリアリスティックな合成画像を生成するためのシステムおよび方法 | |
JP7095599B2 (ja) | 辞書学習装置、辞書学習方法、データ認識方法およびコンピュータプログラム | |
KR20200094608A (ko) | 이미지를 처리하기 위한 방법 및 그에 따른 장치 | |
JP7207309B2 (ja) | プログラム、情報処理方法、および情報処理装置 | |
JPWO2018203549A1 (ja) | 信号変更装置、方法、及びプログラム | |
JP7207846B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN115424088A (zh) | 图像处理模型训练方法以及装置 | |
CN114783017A (zh) | 基于逆映射的生成对抗网络优化方法及装置 | |
CN117315758A (zh) | 面部表情的检测方法、装置、电子设备及存储介质 | |
JP2023063063A (ja) | 教師データ生成装置 | |
CN109902729B (zh) | 基于序列状态演进的行为预测方法及装置 | |
JP7073171B2 (ja) | 学習装置、学習方法及びプログラム | |
KR20200092453A (ko) | 키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법 | |
Rahnamayan et al. | Image Thresholding Using Differential Evolution. | |
JP7398944B2 (ja) | 電子アルバム生成装置、電子アルバム生成方法及びプログラム | |
JP2019082847A (ja) | データ推定装置、データ推定方法及びプログラム | |
CN113657506A (zh) | 一种对抗样本生成方法、装置、设备及介质 | |
EP3605389A1 (en) | Motion synthesis apparatus and motion synthesis method | |
CN112861601A (zh) | 生成对抗样本的方法及相关设备 | |
JP7265690B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |