JP2019046269A - 機械学習用訓練データの生成 - Google Patents

機械学習用訓練データの生成 Download PDF

Info

Publication number
JP2019046269A
JP2019046269A JP2017169856A JP2017169856A JP2019046269A JP 2019046269 A JP2019046269 A JP 2019046269A JP 2017169856 A JP2017169856 A JP 2017169856A JP 2017169856 A JP2017169856 A JP 2017169856A JP 2019046269 A JP2019046269 A JP 2019046269A
Authority
JP
Japan
Prior art keywords
image
training data
pseudo
original
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017169856A
Other languages
English (en)
Other versions
JP6647632B2 (ja
Inventor
誓旅 渡邊
Seiryo Watanabe
誓旅 渡邊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Soat Corp
Original Assignee
Soat Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Soat Corp filed Critical Soat Corp
Priority to JP2017169856A priority Critical patent/JP6647632B2/ja
Publication of JP2019046269A publication Critical patent/JP2019046269A/ja
Application granted granted Critical
Publication of JP6647632B2 publication Critical patent/JP6647632B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】 機械学習システム用に、短時間で多くの適切な訓練データセットを自動的に生成する。
【解決手段】 類似画像生成部22は、原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する。類推画像生成部23は、原ラベル画像から原サンプル画像への変換特性に従って擬似ラベル画像から類推される画像を、擬似ラベル画像に対応する擬似サンプル画像として生成する。ここで、擬似サンプル画像は、訓練データにおける機械学習システムの入力画像であり、擬似ラベル画像は、訓練データにおける機械学習システムの出力画像である。
【選択図】 図1

Description

本発明は、機械学習用訓練データの生成に関するものである。
ある画像処理方法では、ニューラルネットワークを使用して、生物学的組織サンプルの画像内の生物学的構成を自動検出している(例えば特許文献1参照)。
一般的に、このような、画像が入力されるニューラルネットワークの訓練データとしては、サンプル画像を入手して、そのサンプル画像に対するラベルを手作業で付したものが使用される。
特表2017−516992号公報
しかしながら、ディープニューラルネットワークのような機械学習システムでは多くの訓練データセット(つまり、多くの入力と出力との対)が必要になるため、適切な訓練データを作成するのに長い時間がかかってしまう。
原訓練データからの擬似的な訓練データセットを生成する方法としては、データ拡張がある。データ拡張では、原訓練データセットの原サンプル画像(機械学習用の入力画像)に対して、平行移動、鏡像反転、回転、所定の幾何学的変形、若干の色変更、ノイズ付加などを行うことで、新たな訓練データセットを生成している。通常、データ拡張では、原サンプル画像に対して付されているラベルが、そのまま、新たな訓練データセットでも使用される。ただし、機械学習システムの出力が画像(ラベル画像)である場合には、データ拡張では、原訓練データセットの原ラベル画像(機械画像用の出力画像)に、原サンプル画像の平行移動、鏡像反転、回転、および所定の幾何学的変形に合わせて、同様の平行移動、鏡像反転、回転、および所定の幾何学的変形を施した画像が、新たな訓練データセットのラベル画像として使用される。なお、若干の色変更、およびノイズ付加によるデータ拡張の場合、原ラベル画像と同一の画像が新たな訓練データセットのラベル画像として使用される。
しかし、データ拡張を使用した場合、原画像の訓練データセットのみに比べて過学習が発生しにくいものの、データ拡張で生成した新たな訓練データセットのサンプル画像およびラベル画像は、上述のような比較的単純な方法で加工されたものであり、実際に取得された原サンプル画像および原ラベル画像の特徴を多く残しているため、データ拡張で多くの訓練データセットを新たに生成したとしても、原サンプル画像および原ラベル画像の少なさに起因して、多くの訓練データセットで機械学習が行われるディープニューラルネットワークのような機械学習システムでは依然として過学習が発生しやすい。
本発明は、上記の問題に鑑みてなされたもので、短時間で多くの適切な訓練データセットを自動的に生成する訓練データ生成システム、訓練データ生成方法、および訓練データ生成プログラムを得ることを目的とする。
本発明に係る訓練データ生成システムは、入力画像から出力画像を生成する機械学習システム用の訓練データを自動生成する訓練データ生成システムであり、原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する類似画像生成部と、原ラベル画像から原サンプル画像への変換特性に従って擬似ラベル画像から類推される画像を、擬似ラベル画像に対応する擬似サンプル画像として生成する類推画像生成部とを備える。ここで、擬似サンプル画像は、訓練データにおける機械学習システムの入力画像であり、擬似ラベル画像は、訓練データにおける機械学習システムの出力画像である。
本発明に係る訓練データ生成方法は、入力画像から出力画像を生成する機械学習システム用の訓練データを自動生成する訓練データ生成方法であり、原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する類似画像生成ステップと、原ラベル画像から原サンプル画像への変換特性に従って擬似ラベル画像から類推される画像を、擬似ラベル画像に対応する擬似サンプル画像として生成する類推画像生成ステップとを備える。ここで、擬似サンプル画像は、訓練データにおける機械学習システムの入力画像であり、擬似ラベル画像は、訓練データにおける機械学習システムの出力画像である。
本発明に係る訓練データ生成プログラムは、コンピュータに、入力画像から出力画像を生成する機械学習システム用の訓練データを自動生成させる訓練データ生成プログラムであり、コンピュータに、原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する類似画像生成ステップと、原ラベル画像から原サンプル画像への変換特性に従って擬似ラベル画像から類推される画像を、擬似ラベル画像に対応する擬似サンプル画像として生成する類推画像生成ステップとを実行させる。ここで、擬似サンプル画像は、訓練データにおける機械学習システムの入力画像であり、擬似ラベル画像は、訓練データにおける機械学習システムの出力画像である。
本発明によれば、短時間で多くの適切な訓練データセットが自動的に生成される。
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
図1は、本発明の実施の形態に係る訓練データ生成システムの構成を示すブロック図である。 図2は、入力画像から出力画像を生成する機械学習システムについて説明する図である。 図3は、図1に示すシステムにおける訓練データ生成方法について説明するフローチャートである。 図4は、図1に示すシステムにおける原訓練データセットと擬似訓練データセットとの対応関係を説明する図である。 図5は、原サンプル画像および原ラベル画像の具体例を説明する図である。 図6は、擬似ラベル画像の生成の具体例を説明する図である。 図7は、擬似サンプル画像の生成の具体例を説明する図である。 図8は、機械学習後の画像生成エンジンの出力画像の具体例を説明する図である。
以下、図に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態に係る訓練データ生成システムの構成を示すブロック図である。図1に示す訓練データ生成システムは、1台の情報処理装置で構成されているが、後述の各処理部を、互いにデータ通信可能な複数の情報処理装置に分散させてもよい。
この実施の形態に係る訓練データ生成システムは、ディープニューラルネットワークなどの画像生成エンジンの学習に使用する訓練データセットに使用可能な複数(多数)の擬似サンプル画像および擬似ラベル画像を、1または複数の原訓練データセット(原サンプル画像と原ラベル画像との対)から自動的に生成する。
図2は、入力画像から出力画像を生成する機械学習システムについて説明する図である。図2に示すように、この機械学習システムは、例えばディープニューラルネットワークなどの画像生成エンジンを使用して、入力画像から、その入力画像に対応する出力画像を自動的に生成するためのシステムである。
このようなシステムでは、ユーザーの用意する未知の入力画像から所望の出力画像が自動的に生成されるように、使用開始前に、あるいは、随時、既知の入力画像とその既知の入力画像に対応する出力画像との対である訓練データセットに基づいて、ディープニューラルネットワークなどの画像生成エンジンの学習が実行される。
この実施の形態に係る訓練データ生成システムを使用することで、原訓練データセット(原サンプル画像と原ラベル画像との対)から多数の擬似訓練データセット(擬似サンプル画像と擬似ラベル画像との対)が得られ、それらの原訓練データセットおよび擬似訓練データセットを使用した画像生成エンジンの学習が適切に実行される。
図1に示す訓練データ生成システムは、記憶装置1、通信装置2、画像読取装置3、および演算処理装置4を備える。
記憶装置1は、フラッシュメモリー、ハードディスクなどの不揮発性の記憶装置であって、各種データやプログラムを格納する。
ここでは、記憶装置1には、訓練データ生成プログラム11が格納されており、また、生成された訓練データが必要に応じて格納される。なお、訓練データ生成プログラム11は、CD(Compact Disk)などの可搬性のあるコンピュータ読み取り可能な記録媒体に格納されていてもよい。その場合、例えば、その記録媒体から記憶装置1へ訓練データ生成プログラム11がインストールされる。また、訓練データ生成プログラム11は、1つのプログラムでも、複数のプログラムの集合体でもよい。
通信装置2は、ネットワークインターフェイス、周辺機器インターフェイス、モデムなどのデータ通信可能な装置であって、必要に応じて、他の装置とデータ通信を行う。画像読取装置3は、入力画像としての原画像を含む写真などの物理媒体の原稿の画像を光学的に読み取り、原画像の画像データを生成する。通信装置2および画像読取装置3は、原訓練データセットの取得に使用される。
演算処理装置4は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備えるコンピュータであって、プログラムを、ROM、記憶装置1などからRAMにロードしCPUで実行することで、各種処理部として動作する。
ここで、訓練データ生成プログラム11を実行することで、演算処理装置4は、原データ取得部21、類似画像生成部22、および類推画像生成部23として動作する。
原データ取得部21は、1または複数の原訓練データセットを取得する。1つの原訓練データセットは、入力画像から出力画像を生成する機械学習システム用の訓練データとして使用可能な、1つの原サンプル画像と、その原サンプル画像に対応する原ラベル画像とを含む。原サンプル画像は、機械学習時に入力画像として使用可能な、実際に得られた写真などの画像であり、原ラベル画像は、機械学習時に出力画像として使用可能な、原サンプル画像に対して手作業などで生成された適正なラベル画像である。
原データ取得部21は、記憶装置1に格納されている原訓練データセットを読み出したり、通信装置2を使用して、外部の装置から原訓練データセットを受信したり、画像読取装置3を使用して、画像読取装置3により読み取られた画像を原訓練データセットとして取得したりする。なお、通信装置2および画像読取装置3を使用して取得された原訓練データセットは、記憶装置1に格納されるようにしてもよい。
類似画像生成部22は、取得された原ラベル画像の類似画像を、擬似ラベル画像として生成する。ここで、擬似ラベル画像は、機械学習時に機械学習システムの出力画像として使用されるものである。
この実施の形態では、類似画像生成部22は、所定範囲(例えば−1〜+1)の値を有する1または複数の乱数値(乱数ベクトル)を入力値とし入力値に対応する画像を生成する画像生成エンジンを備え、複数の原ラベル画像を使用してその画像生成エンジンの機械学習を行い、その画像生成エンジンに別の乱数値を入力したときの出力画像を類似画像(つまり、擬似ラベル画像)とする。例えば、類似画像生成部22は、DCGANS(Deep Convolutional Generative Adversarial Networks)などのGAN(Generative Adversarial Network)に基づいて、原ラベル画像の類似画像を、擬似ラベル画像として生成する。この類似画像の生成方法は、通常のデータ拡張(平行移動、鏡像反転、回転変動、幾何学的変形、濃度変更、色の変動、ランダムノイズの付加など)とは異なるものである。つまり、通常のデータ拡張は、何らかの規則に従って原画像を変換したものであるか、原画像を多少不規則に変化させたものであり、データ拡張で得られる画像には、1枚の原画像に固有の規則性がある程度残されるが、この生成方法では、複数枚の原画像(原ラベル画像)の規則性が機械学習で抽出され、類似画像に反映されるため、個々の原画像に固有の規則性が、生成された類似画像に残りにくくなっている。
類似画像生成部22は、GANで類似ラベル画像を生成する場合、ジェネレータおよびディスクリミネータを備え、ディスクリミネータおよびジェネレータの機械学習を行った後、ジェネレータで、乱数値ベクトルから擬似ラベル画像を生成する。ディスクリミネータは、原ラベル画像とジェネレータにより生成された画像とを互いに区別するニューラルネットワークであり、ジェネレータは、乱数ベクトルから画像を生成するニューラルネットワークである。ディスクリミネータおよびジェネレータの機械学習では、(a)原ラベル画像に基づいて、原ラベル画像が原ラベル画像であると識別されるように、ディスクリミネータが機械学習され、(b)任意にサンプリングされた乱数ベクトルに対してジェネレータにより生成された画像について、当該画像が原ラベル画像であると識別されるようにジェネレータが機械学習されるとともに、当該画像がジェネレータにより生成された画像であると識別されるようにジェネレータが機械学習される。
なお、類似画像生成部22は、原ラベル画像で機械学習される別の画像生成エンジンで、原ラベル画像の類似画像を擬似ラベル画像として生成するようにしてもよい。
また、類似画像生成部22は、生成した擬似ラベル画像に対して、ノイズ除去処理を行うようにしてもよい。そのノイズ除去処理は、例えば、Non-local Means Denoising algorithmなどに従って実行される。
さらに、必要に応じて、類似画像生成部22は、生成した擬似ラベル画像に対して、通常のデータ拡張(平行移動、鏡像反転、回転変動、幾何学的変形、濃度変更、色の変動、ランダムノイズの付加など)を行って、擬似ラベル画像の数を増加させるようにしてもよい。
類推画像生成部23は、原ラベル画像から原サンプル画像への変換特性に従って擬似ラベル画像から類推される画像(類推画像)を、その擬似ラベル画像に対応する擬似サンプル画像として生成する。ここで、擬似サンプル画像は、機械学習時に機械学習システムの入力画像として使用されるものである。
例えば、類推画像生成部23は、擬似ラベル画像の各画素を注目画素として、注目画素の周辺領域(注目画素を含む所定サイズのウィンドウ)の画素値分布に最も近い画素値分布を周辺領域に有する画素を原ラベル画像内で探索し、発見した画素の位置と同一の位置の原サンプル画像の画素値を、擬似サンプル画像において同一位置の画素にセットすることで、擬似サンプル画像を生成する。
例えば、類推画像生成部23は、イメージアナロジー法(Image analogies)に基づいて、原ラベル画像から原サンプル画像への変換特性に従って、擬似ラベル画像から類推される画像を、擬似サンプル画像として生成する。
原訓練データセットが複数ある場合、類推画像生成部23は、複数の原訓練データセットから、1つの原訓練データセットを選択し、選択した原訓練データセットにおける原ラベル画像から原サンプル画像への変換特性に従って、擬似ラベル画像から類推される画像を、擬似サンプル画像として生成する。その際、原訓練データセットは、例えばランダムに、あるいは、所定の規則に従って選択される。
また、原訓練データセットが複数ある場合、類推画像生成部23は、複数の原訓練データセットのそれぞれについて、選択した原訓練データセットにおける原ラベル画像から原サンプル画像への変換特性に従って、擬似ラベル画像から類推される画像を、擬似サンプル画像候補として生成し、複数の擬似サンプル画像候補から1つの擬似サンプル画像を選択したり、複数の擬似サンプル画像候補に対して所定の画像処理を行って1つの擬似サンプル画像を生成するようにしてもよい。複数の擬似サンプル画像候補から1つの擬似サンプル画像を選択する場合、例えばランダムに、あるいは、所定の規則に従って擬似サンプル画像が選択される。
次に、上記システムの動作について説明する。図3は、図1に示すシステムにおける訓練データ生成方法について説明するフローチャートである。図4は、図1に示すシステムにおける原訓練データセットと擬似訓練データセットとの対応関係を説明する図である。
まず、原データ取得部21が、上述のようにして1または複数の原訓練データセット(互いに対応する原サンプル画像と原ラベル画像との対)を取得する(ステップS1)。
その後、類似画像生成部22は、取得された原訓練データセットにおける原ラベル画像から、上述のようにして、複数(例えば数十万〜数千万)の擬似ラベル画像を生成する(ステップS2)。例えば、類似画像生成部22は、GANを使用する場合、互いに異なる複数の乱数ベクトルを生成し、その乱数ベクトルから、乱数ベクトルと同数の擬似ラベル画像を得る。
そして、類推画像生成部23は、取得された原訓練データセットにおける原サンプル画像および原ラベル画像の対から、上述のようにして、各擬似ラベル画像に対応する擬似サンプル画像を生成する(ステップS3)。平行移動などの従来のデータ拡張では、原サンプル画像を加工して、擬似的なサンプル画像を取得しているが、本実施の形態においては、原サンプル画像および原ラベル画像の両方の関係性に基づいて、擬似ラベル画像から、擬似サンプル画像が生成される。
これにより、互いに対応する擬似サンプル画像および擬似ラベル画像の対(つまり、擬似訓練データセット)が多数生成され、その後、例えば、記憶装置1に格納されたり、通信装置2で送信されたりする。そして、擬似訓練データセット(あるいは、原訓練データセットおよび擬似訓練データセット)に基づいて、多数の訓練データセットに基づく、ディープニューラルネットワークなどの画像生成エンジンの機械学習が行われる。
ここで、原サンプル画像を細胞組織画像とし、原ラベル画像を細胞組織画像内の細胞の境界線を示す画像とした場合の具体例について説明する。
図5は、原サンプル画像および原ラベル画像の具体例を説明する図である。
図5(A)は、12枚の原サンプル画像としての細胞組織画像(グレースケール画像)を示しており、図5(B)は、12枚の原ラベル画像としての、図5(A)に示す細胞組織画像にそれぞれ対応する細胞境界をエッジ(黒白の境界)で示している2値画像である。
このような、原ラベル画像は、原サンプル画像から手作業などで作成される。通常、多数(例えば10万枚)の原サンプル画像を入手することは困難であるとともに、原サンプル画像から原ラベル画像を作成する手間もかかるため、原訓練データセットのみで、有効な機械学習を行えるような数の訓練データセットを用意することは困難である。
図6は、擬似ラベル画像の生成の具体例を説明する図である。
図6(A)は、図5(B)に示した12枚の原ラベル画像を示している。図6(B)は、図6(A)に示す12枚の原ラベル画像から生成された6枚の擬似ラベル画像を示している。なお、ここでは、6枚の擬似ラベル画像を示しているが、上述のように、類似画像生成処理においては、画像生成エンジンの入力値(上述の乱数、つまり実数値)を変更することで、上限数なく多数の擬似ラベル画像が生成可能であるので、例えば、互いに異なる10万枚、1000万枚などの多数の擬似ラベル画像が生成可能である。図6(C)は、図6(B)に示す6枚の擬似ラベル画像に対してNon-local Means Denoising algorithmに従ってノイズ除去処理を施したものである。なお、ノイズ除去処理は必要に応じて適用すればよく、別のアルゴリズムを使用してもよい。
図7は、擬似サンプル画像の生成の具体例を説明する図である。図5に示す原訓練データセットのうちの1つに基づいて、図6(C)に示す擬似ラベル画像から、図7に示すような、擬似サンプル画像が得られた。
次に、このようにして生成された擬似訓練データセットを使用した機械学習後の画像生成エンジンの出力画像の具体例について説明する。図8は、機械学習後の画像生成エンジンの出力画像の具体例を説明する図である。
図8(A)は、テスト用細胞組織画像(つまり、訓練データセットには含まれていないもの)を示している。
図8(B)は、3つの原訓練データセットに基づき生成された、上述のテスト用細胞組織画像に対応するラベル画像を示している。具体的には、3つの原訓練データセットに対して通常のデータ拡張を行って得られた訓練データセットで機械学習した画像生成エンジンで、図8(A)に示す細胞組織画像に対して、図8(B)に示すラベル画像が生成された。
図8(C)は、12個の原訓練データセットに基づき生成された、上述のテスト用細胞組織画像に対応するラベル画像を示している。具体的には、12個の原訓練データセットに対して通常のデータ拡張を行って得られた訓練データセットで機械学習した画像生成エンジンで、図8(A)に示す細胞組織画像に対して、図8(C)に示すラベル画像が生成された。
図8(D)は、12個の原訓練データセットおよび12個の擬似訓練データセットに基づき生成された、上述のテスト用細胞組織画像に対応するラベル画像を示している。具体的には、これらの訓練データセットに対して通常のデータ拡張を行って得られた訓練データセットで機械学習した画像生成エンジンで、図8(A)に示す細胞組織画像に対して、図8(D)に示すラベル画像が生成された。
ラベル画像内での個々の細胞に対応する領域の分離状況などから、図8(B)および図8(C)に比べ、図8(D)に示すラベル画像が適切であることは明らかである。このように、通常のデータ拡張より、この実施の形態に係る訓練データ生成方法により訓練データを生成したほうが、適切なラベル画像が得られる。
以上のように、上記実施の形態によれば、類似画像生成部22は、原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する。類推画像生成部23は、原ラベル画像から原サンプル画像への変換特性に従って擬似ラベル画像から類推される画像を、擬似ラベル画像に対応する擬似サンプル画像として生成する。ここで、擬似サンプル画像は、訓練データにおける機械学習システムの入力画像であり、擬似ラベル画像は、訓練データにおける機械学習システムの出力画像である。
これにより、原訓練データセットの原サンプル画像および原ラベル画像とはそれぞれ異なる新規な擬似サンプル画像および擬似ラベル画像の訓練データセットが自動的に多数生成できる。つまり、短時間で多くの適切な訓練データセットが自動的に生成される。
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
例えば、上記実施の形態において、ラベル画像は、境界を示すものに限らず、特定の細胞(癌細胞など)を示すものとしてもよい。また、上記実施の形態において、原サンプル画像は、細胞組織画像以外の生体画像でもよいし、その他の撮影画像でもよい。
また、上記実施の形態において、上述の画像生成エンジンは、ディープニューラルネットワーク(つまり、隠れ層が2以上の階層型ニューラルネットワーク)に限定されない。
本発明は、例えば、機械学習システム用の訓練データの自動生成に適用可能である。
11 訓練データ生成プログラム
22 類似画像生成部
23 類推画像生成部

Claims (6)

  1. 入力画像から出力画像を生成する機械学習システム用の訓練データを自動生成する訓練データ生成システムにおいて、
    原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する類似画像生成部と、
    前記原ラベル画像から前記原サンプル画像への変換特性に従って前記擬似ラベル画像から類推される画像を、前記擬似ラベル画像に対応する擬似サンプル画像として生成する類推画像生成部とを備え、
    前記擬似サンプル画像は、前記訓練データにおける前記機械学習システムの入力画像であり、前記擬似ラベル画像は、前記訓練データにおける前記機械学習システムの出力画像であること、
    を特徴とする訓練データ生成システム。
  2. 前記類似画像生成部は、1または複数の乱数値を入力値とし入力値に対応する出力画像を生成する画像生成エンジンを備え、複数の前記原ラベル画像を使用して前記画像生成エンジンの機械学習を行い、前記画像生成エンジンに別の乱数値を入力したときの出力画像を、前記原ラベル画像の類似画像として取得し、前記擬似ラベル画像とすることを特徴とする請求項1記載の訓練データ生成システム。
  3. 前記類推画像生成部は、前記擬似ラベル画像の各画素を注目画素として、前記注目画素についての所定サイズの周辺領域の画素値分布に最も近い画素値分布を周辺領域に有する画素を前記原ラベル画像内で探索し、発見した画素の位置と同一の位置の前記原サンプル画像の画素値を、前記擬似サンプル画像において同一位置の画素にセットすることで、前記擬似サンプル画像を生成することを特徴とする請求項1または請求項2記載の訓練データ生成システム。
  4. 前記原サンプル画像は、細胞組織画像であり、
    前記原ラベル画像は、前記細胞組織画像内の細胞の境界線を示す画像を含むこと、
    を特徴とする請求項1から請求項3のうちのいずれか1項記載の訓練データ生成システム。
  5. 入力画像から出力画像を生成する機械学習システム用の訓練データを自動生成する訓練データ生成方法において、
    原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する類似画像生成ステップと、
    前記原ラベル画像から前記原サンプル画像への変換特性に従って前記擬似ラベル画像から類推される画像を、前記擬似ラベル画像に対応する擬似サンプル画像として生成する類推画像生成ステップとを備え、
    前記擬似サンプル画像は、前記訓練データにおける前記機械学習システムの入力画像であり、前記擬似ラベル画像は、前記訓練データにおける前記機械学習システムの出力画像であること、
    を特徴とする訓練データ生成方法。
  6. コンピュータに、入力画像から出力画像を生成する機械学習システム用の訓練データを自動生成させる訓練データ生成プログラムであって、
    前記コンピュータに、
    原サンプル画像に対応する原ラベル画像の類似画像を、擬似ラベル画像として生成する類似画像生成ステップと、
    前記原ラベル画像から前記原サンプル画像への変換特性に従って前記擬似ラベル画像から類推される画像を、前記擬似ラベル画像に対応する擬似サンプル画像として生成する類推画像生成ステップとを実行させ、
    前記擬似サンプル画像は、前記訓練データにおける前記機械学習システムの入力画像であり、前記擬似ラベル画像は、前記訓練データにおける前記機械学習システムの出力画像であること、
    を特徴とする訓練データ生成プログラム。
JP2017169856A 2017-09-04 2017-09-04 機械学習用訓練データの生成 Active JP6647632B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017169856A JP6647632B2 (ja) 2017-09-04 2017-09-04 機械学習用訓練データの生成

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017169856A JP6647632B2 (ja) 2017-09-04 2017-09-04 機械学習用訓練データの生成

Publications (2)

Publication Number Publication Date
JP2019046269A true JP2019046269A (ja) 2019-03-22
JP6647632B2 JP6647632B2 (ja) 2020-02-14

Family

ID=65812915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017169856A Active JP6647632B2 (ja) 2017-09-04 2017-09-04 機械学習用訓練データの生成

Country Status (1)

Country Link
JP (1) JP6647632B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102034248B1 (ko) * 2019-04-19 2019-10-18 주식회사 루닛 GAN(Generative Adversarial Networks)을 이용하는 이상 검출 방법, 장치 및 그 시스템
CN111161848A (zh) * 2019-10-31 2020-05-15 杭州深睿博联科技有限公司 Ct图像的病灶标注方法及装置、存储介质
KR102115534B1 (ko) * 2019-10-14 2020-05-26 주식회사 루닛 GAN(Generative Adversarial Networks)을 이용하는 이상 검출 방법, 장치 및 그 시스템
CN112102303A (zh) * 2020-09-22 2020-12-18 中国科学技术大学 基于单图像生成对抗网络的语义图像类比方法
WO2021182343A1 (ja) * 2020-03-13 2021-09-16 富士フイルム株式会社 学習データ作成装置、方法、プログラム、学習データ及び機械学習装置
JP2022029079A (ja) * 2020-08-04 2022-02-17 株式会社オプティム コンピュータシステム、データセット作成方法及びプログラム
CN114612717A (zh) * 2022-03-09 2022-06-10 四川大学华西医院 Ai模型训练标签生成方法、训练方法、使用方法及设备
JP2022546571A (ja) * 2019-09-06 2022-11-04 アメリカン エキスプレス トラヴェル リレイテッド サーヴィシーズ カンパニー, インコーポレイテッド 機械学習モデル用の訓練データの生成
JP2022548952A (ja) * 2019-09-20 2022-11-22 グーグル エルエルシー ラベルノイズが存在する状態でのロバストな訓練
JP2023065028A (ja) * 2021-10-27 2023-05-12 堺化学工業株式会社 教師データ生成方法、画像解析モデル生成方法、画像解析方法、教師データ生成プログラム、画像解析プログラムおよび教師データ生成装置
WO2023119922A1 (ja) * 2021-12-21 2023-06-29 富士フイルム株式会社 画像生成装置、方法及びプログラム並びに学習装置及び学習データ

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10733733B1 (en) 2019-04-19 2020-08-04 Lunit Inc. Method for detecting anomaly using generative adversarial networks, apparatus and system thereof
KR102034248B1 (ko) * 2019-04-19 2019-10-18 주식회사 루닛 GAN(Generative Adversarial Networks)을 이용하는 이상 검출 방법, 장치 및 그 시스템
JP7391190B2 (ja) 2019-09-06 2023-12-04 アメリカン エキスプレス トラヴェル リレイテッド サーヴィシーズ カンパニー, インコーポレイテッド 機械学習モデル用の訓練データの生成
JP2022546571A (ja) * 2019-09-06 2022-11-04 アメリカン エキスプレス トラヴェル リレイテッド サーヴィシーズ カンパニー, インコーポレイテッド 機械学習モデル用の訓練データの生成
JP2022548952A (ja) * 2019-09-20 2022-11-22 グーグル エルエルシー ラベルノイズが存在する状態でのロバストな訓練
KR102115534B1 (ko) * 2019-10-14 2020-05-26 주식회사 루닛 GAN(Generative Adversarial Networks)을 이용하는 이상 검출 방법, 장치 및 그 시스템
CN111161848A (zh) * 2019-10-31 2020-05-15 杭州深睿博联科技有限公司 Ct图像的病灶标注方法及装置、存储介质
CN111161848B (zh) * 2019-10-31 2023-08-29 杭州深睿博联科技有限公司 Ct图像的病灶标注方法及装置、存储介质
JPWO2021182343A1 (ja) * 2020-03-13 2021-09-16
WO2021182343A1 (ja) * 2020-03-13 2021-09-16 富士フイルム株式会社 学習データ作成装置、方法、プログラム、学習データ及び機械学習装置
JP2022029079A (ja) * 2020-08-04 2022-02-17 株式会社オプティム コンピュータシステム、データセット作成方法及びプログラム
CN112102303B (zh) * 2020-09-22 2022-09-06 中国科学技术大学 基于单图像生成对抗网络的语义图像类比方法
CN112102303A (zh) * 2020-09-22 2020-12-18 中国科学技术大学 基于单图像生成对抗网络的语义图像类比方法
JP2023065028A (ja) * 2021-10-27 2023-05-12 堺化学工業株式会社 教師データ生成方法、画像解析モデル生成方法、画像解析方法、教師データ生成プログラム、画像解析プログラムおよび教師データ生成装置
WO2023119922A1 (ja) * 2021-12-21 2023-06-29 富士フイルム株式会社 画像生成装置、方法及びプログラム並びに学習装置及び学習データ
CN114612717B (zh) * 2022-03-09 2023-05-26 四川大学华西医院 Ai模型训练标签生成方法、训练方法、使用方法及设备
CN114612717A (zh) * 2022-03-09 2022-06-10 四川大学华西医院 Ai模型训练标签生成方法、训练方法、使用方法及设备

Also Published As

Publication number Publication date
JP6647632B2 (ja) 2020-02-14

Similar Documents

Publication Publication Date Title
JP6647632B2 (ja) 機械学習用訓練データの生成
JP6755849B2 (ja) 人工ニューラルネットワークのクラスに基づく枝刈り
US9036905B2 (en) Training classifiers for deblurring images
WO2018214713A1 (zh) 人脸检测方法、装置、计算机设备及存储介质
Almeer Cloud hadoop map reduce for remote sensing image analysis
RU2716322C2 (ru) Репродуцирующая аугментация данных изображения
US20170344881A1 (en) Information processing apparatus using multi-layer neural network and method therefor
JP2019533866A (ja) 制御フィードバックを用いる画像セグメンテーションの方法及びシステム
Li et al. MapReduce-based fast fuzzy c-means algorithm for large-scale underwater image segmentation
JP2015197702A (ja) 情報処理装置、情報処理方法
JP2017517818A (ja) デジタル画像の色を処理するための方法及びシステム
JP2007047975A (ja) デジタル画像の複数対象物検出方法および装置並びにプログラム
JP2017059090A (ja) 生成装置、生成方法、及び生成プログラム
Solé et al. Evaluation of random forests on large-scale classification problems using a bag-of-visual-words representation
JP2011086183A (ja) 画像処理装置、画像処理方法及びプログラム
Weber et al. Automated labeling of electron microscopy images using deep learning
JP6829518B2 (ja) 材料試料に存在する物理的変動を用いて乱数を生成するためのシステム及び方法
Pajot et al. Unsupervised adversarial image inpainting
US20180218487A1 (en) Model generation apparatus, evaluation apparatus, model generation method, evaluation method, and storage medium
KR20210038027A (ko) 신경망 압축 훈련 방법 및 압축된 신경망을 이용하는 방법
CN116152645A (zh) 一种融合多种表征平衡策略的室内场景视觉识别方法及系统
JP6214073B2 (ja) 生成装置、生成方法、及び生成プログラム
JP2018022332A (ja) 判定装置、判定方法、及び判定プログラム
KR20230096901A (ko) 자율 주행 차량의 학습을 위한 데이터 증식 방법 및 그를 위한 장치
CN113763315B (zh) 玻片图像的信息获取方法、装置、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190805

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190805

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191226

R150 Certificate of patent or registration of utility model

Ref document number: 6647632

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250