JP7388751B2 - 学習データ生成装置、学習データ生成方法および学習データ生成プログラム - Google Patents

学習データ生成装置、学習データ生成方法および学習データ生成プログラム Download PDF

Info

Publication number
JP7388751B2
JP7388751B2 JP2021504668A JP2021504668A JP7388751B2 JP 7388751 B2 JP7388751 B2 JP 7388751B2 JP 2021504668 A JP2021504668 A JP 2021504668A JP 2021504668 A JP2021504668 A JP 2021504668A JP 7388751 B2 JP7388751 B2 JP 7388751B2
Authority
JP
Japan
Prior art keywords
dimensional
learning data
label
dimensional object
data generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021504668A
Other languages
English (en)
Other versions
JPWO2020183598A1 (ja
Inventor
哲夫 井下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020183598A1 publication Critical patent/JPWO2020183598A1/ja
Application granted granted Critical
Publication of JP7388751B2 publication Critical patent/JP7388751B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • G06T15/503Blending, e.g. for anti-aliasing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • G06T3/067Reshaping or unfolding 3D tree structures onto 2D planes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Graphics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Description

本発明は、機械学習で用いられる学習データを生成する学習データ生成装置、学習データ生成方法および学習データ生成プログラムに関する。
ディープラーニングなどを用いた機械学習において、学習を効率的に行うためには大量の学習データが必要である。そのため、学習データを効率的に作成する方法が各種提案されている。
特許文献1には、3D(3-Dimensions)のCG(computer graphics )から2D(2-Dimensions)画像を作成して学習する物体認識装置が記載されている。特許文献1に記載された物体認識装置は、手の様々な形状の画像を予め複数枚作成し、作成された画像に基づいて学習し、認識時に入力された画像に対して形状が近い手の画像を学習画像から検索する。
特開2010-211732号公報
一方、教師あり学習を行う場合、正解ラベルが設定された学習データが必要である。しかし、正解ラベルが適切に設定され、現場に則した学習データを大量に集めることは非常にコストのかかる作業である。
特許文献1に記載された物体認識装置は、3次元のCG基本動作画像データから、1個の動作フレームごとに、ある視点から見た二次元の見え画像(2次元平面へ投影した2次元画像)を1枚作成する。そのため、学習データの生成に要する処理を低減することは可能である。しかし、特許文献1に記載された物体認識装置は、認識対象(例えば、手の認識、身体の認識など)が決まっているため、所定の認識対象か否かを示す正解ラベルしか学習データに設定できないという問題がある。
すなわち、特許文献1に記載された物体認識装置を用いて3次元のCG基本動作画像データから仮想的にデータを増やしたとしても、所定の正解ラベルしか設定できないため、データの種類に応じた正解ラベルを自動的に付与することは困難である。
そこで、本発明は、データの種類に応じた正解ラベルが付与された学習データをCGから自動で生成できる学習データ生成装置、学習データ生成方法および学習データ生成プログラムを提供することを目的とする。
本発明による学習データ生成装置は、属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成部と、2次元平面に3次元空間における3次元モデルを投影して2次元物体を描画する2次元物体描画部と、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成部と、2次元物体と第二の背景とを合成した2次元画像を生成する背景合成部と、第二の背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成部とを備え、ラベル生成部が、学習データを用いて学習されるモデルが判定する内容を示す新たなラベルを属性に基づいて作成し、学習データ生成部は、生成された新たなラベルを対応付けた学習データを生成することを特徴とする。
本発明による学習データ生成方法は、属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成し、2次元平面に3次元空間における3次元モデルを投影して2次元物体を描画し、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成し、2次元物体と第二の背景とを合成した2次元画像を生成し、第二の背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成し、ラベルの生成において、学習データを用いて学習されるモデルが判定する内容を示す新たなラベルを上記属性に基づいて作成し、生成された新たなラベルを対応付けた学習データを生成することを特徴とする。
本発明による学習データ生成プログラムは、コンピュータに、属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成処理、2次元平面に3次元空間における3次元モデルを投影して2次元物体を描画する2次元物体描画処理、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成処理、2次元物体と第二の背景とを合成した2次元画像を生成する背景合成処理、および、第二の背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成処理を実行させ、ラベル生成処理で、学習データを用いて学習されるモデルが判定する内容を示す新たなラベルを属性に基づいて作成させ、学習データ生成処理で、生成された新たなラベルを対応付けた学習データを生成させることを特徴とする。
本発明によれば、データの種類に応じた正解ラベルが付与された学習データをCGから自動で生成できる。
本発明による学習データ生成装置の一実施形態の構成例を示すブロック図である。 学習データの例を示す説明図である。 学習データ生成装置の動作例を示すフローチャートである。 学習データを生成する処理の例を示す説明図である。 本発明による学習データ生成装置の概要を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。
図1は、本発明による学習データ生成装置の一実施形態の構成例を示すブロック図である。本実施形態の学習データ生成装置100は、記憶部10と、3次元空間生成部20と、2次元物体描画部30と、領域算出部40と、ラベル生成部50と、背景合成部60と、学習データ生成部70とを備えている。
記憶部10は、後述する3次元空間を生成するための各種オブジェクトや背景の情報(パラメータ)、合成に用いられる背景上の情報(パラメータ)などを記憶する。また、記憶部10は、生成された学習データを記憶してもよい。記憶部10は、例えば、磁気ディスク等により実現される。
3次元空間生成部20は、3次元モデルと背景とを仮想空間内にモデリングした3次元空間を生成する。具体的には、3次元空間生成部20は、3次元のCGを作成するツールやプログラムにより3次元空間の画像を生成する。3次元空間生成部20は、3次元のCGを生成する一般的な方法を用いて3次元空間を生成してもよい。
3次元モデルは、3次元空間上に存在するオブジェクトであり、例えば、人物や、車両等の物体である。また、3次元モデルには、その3次元モデルの属性を表わす情報が関連付けられている。属性の例として、物体の種類や色、性別や年齢など、様々な要素が挙げられる。
以下、3次元空間生成部20が3次元空間を生成する処理の一例を具体的に説明する。ここでは、人物が動くことを想定した3次元空間を生成する場合を例示する。まず、3次元空間生成部20は、背景CGおよび人物CGを入力し、背景と人物とをCG上で合成させる。なお、人物CGには、性別や服装などの属性情報が関連付けられている。
さらに、3次元空間生成部20は、人物CGの動きを入力する。なお、背景CG、人物CG、および、人物の動きは、ユーザ等により指定される。また、3次元空間生成部20は、3次元空間に対する視点を表わすパラメータや、環境光などの光源を示すパラメータ、物体のテクスチャやシェーディングなどを示す情報を入力してもよい。そして、3次元空間生成部20は、入力された情報に基づいてレンダリング(画像または映像の生成)を行う。
さらに、3次元空間生成部20は、変更対象とする複数の視点を示すパラメータのパターン(以下、視点変更パターンと記す。)と、変更対象とする複数の環境光を示すパラメータのパターン(以下、環境光変更パターンと記す。)のいずれか一方、または、両方を入力してもよい。この場合、3次元空間生成部20は、入力された視点変更パターンおよび環境光変更パターンごとに3次元空間を生成してもよい。このようなパターンを入力することで、数多くの環境を想定した3次元空間を容易に生成することが可能になる。
2次元物体描画部30は、3次元空間における3次元モデルを2次元平面に投影して、2次元物体を描画する。なお、2次元物体描画部30が3次元モデルを2次元物体として描画する方法は任意である。2次元物体描画部30は、例えば、3次元空間内から視点への透視投影変換によって3次元モデルを変換した点群を2次元物体として描画してもよい。なお、透視投影変換によって3次元モデルを変換する方法は広く知られており、ここでは詳細な説明は省略する。
また、2次元物体描画部30は、単一色で定義された2次元平面に3次元モデルを投影して、2次元物体を描画してもよい。単一色の2次元平面に2次元物体を描画することで、後述する領域算出部40による2次元物体の領域の特定が容易になる。
領域算出部40は、描画された2次元物体ごとに、その2次元物体が存在する領域を算出する。具体的には、領域算出部40は、描画された2次元物体ごとに、その2次元物体の外接矩形座標を、物体が存在する領域として算出してもよい。
また、2次元物体が透視投影変換による点群として描画されている場合、領域算出部40は、描画された点群に基づいて、2次元物体が存在する領域を算出してもよい。領域算出部40は、例えば、描画された点群そのものを、物体が存在する領域として算出してもよく、その点群の外接矩形座標を、物体が存在する領域として算出してもよい。
さらに、単一色で定義された2次元平面に2次元物体が描画された場合、領域算出部40は、定義された単一色以外の領域を囲む外接矩形座標を、物体が存在する領域として算出してもよい。
ラベル生成部50は、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成する。生成されるラベルは、関連付けされた属性の一部または複数であってもよい。また、ラベル生成部50は、関連付けされた属性に基づいて、新たなラベルを生成してもよい。例えば、属性に「性別(男性または女性)」を含む場合、ラベル生成部50は、新たなラベルとして、男性か否かを示すラベルや、女性か否かを示すラベルを新たに生成してもよい。
背景合成部60は、2次元物体と背景とを合成した2次元画像を生成する。背景合成部60が合成する背景は、3次元空間生成部20が3次元空間の生成に用いた背景と同一であってもよく、異なっていてもよい。以下の説明では、3次元空間生成部20が3次元空間の生成に用いた背景と、背景合成部60が2次元物体と合成する背景とを区別するため、前者の背景を第一の背景と記し、後者の背景を、第二の背景と記すこともある。
なお、第二の背景と2次元物体とを合成したときの違和感を避けるため、背景合成部60は、2次元物体が描画された際の視点パラメータおよび環境光パラメータと同一のパラメータで定義される第二の背景と、その2次元物体とを合成した2次元画像を生成することが好ましい。
学習データ生成部70は、第二の背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成する。さらに、学習データ生成部70は、2次元画像とラベルに加え、算出された領域を対応付けた学習データを生成してもよい。
学習データ生成部70が生成する学習データの内容は、機械学習で必要とする情報に応じて、予め定めておけばよい。例えば、物体認識を行うモデルを学習する場合、学習データ生成部70は、2次元平面での物体の座標値と画像とを対応付けた学習データを生成してもよい。また、例えば、物体認識に加えて性別も判定するモデルを学習する場合、学習データ生成部70は、2次元平面での物体の座標値、画像、および、男性または女性を示すラベルを対応付けた学習データを生成してもよい。
また、学習データ生成部70は、生成した学習データの中から、所望の条件に合致するラベルが対応付けられた学習データのみ抽出してもよい。例えば、スーツを着用した男性が含まれる学習データのみ抽出したい場合、学習データ生成部70は、生成した学習データのうち、「スーツを着用した男性」を示すラベルが対応付けられた学習データのみを抽出してもよい。このような学習データを抽出することで、例えば、洋服認識のモデルを学習することが可能になる。
図2は、学習データの例を示す説明図である。図2に例示する画像11は、背景合成部60によって生成された2次元画像の一例である。図2に示す例では、画像11が、3種類の2次元物体(2次元物体12、2次元物体13および2次元物体14)を含んでいることを示す。
また、図2に例示するラベル15は、2次元画像に対応付けられるラベルの一例である。図2に示す例では、ラベル15が各2次元物体に対応したラベルを含み、ラベル15の各行が各2次元物体に対応したラベルを示す。
図2に例示するラベル15において、X,Yは、左上を原点とした場合における2次元画像の各2次元物体の座標値(X,Y)を示し、W,Hは、それぞれ、2次元物体の幅および高さを示す。また、IDは、3Dモデルに対応する画像内の2次元物体の識別子を示し、PARTSは、個々の3Dモデル(オブジェクト)の識別子を示す。また、NAMEは、個々の3Dモデルの具体的な名称を示す。
なお、図2のラベル15(APP,OBJ,TYPE,CATG)に例示するように、ラベルには、物体の向きや進行方向、オブジェクトのカテゴリ(例えば、スクーターなど)や具体的な製品名等が設定されていてもよい。例えば、3Dモデルのオブジェクト(OBJ)がバイクの場合、カテゴリ(CATG)には、スクーターなどが設定され、タイプには、スクーターの製品名などが設定され、パーツ(PARTS)には、タイヤやハンドルなどが設定される。
学習データ生成部70が2次元画像とラベルとを対応付ける方法は任意である。例えば、2D画像1枚に1つの物体が存在する場合、学習データ生成部70は、2D画像1枚に対して、1つのラベルを対応付けた学習データを生成してもよい。このとき、物体の存在する範囲が明らかである場合(例えば、画像全体に1つの物体が存在している場合など)、学習データ生成部70は、学習データに領域を対応付けなくてもよい。
また、2D画像1枚に複数の物体が存在する場合、学習データ生成部70は、2D画像1枚に対して、画像中の対応する領域を含む複数のラベルを対応付けた学習データを生成してもよい。この場合、各ラベルには、対応付ける2D画像を識別する情報を含めればよい。このように学習データを生成することで、画像を保存するストレージの量を低減させることが可能になる。
一方、2D画像1枚に複数の物体が存在する場合、学習データ生成部70は、2D画像から、物体が存在する領域(例えば、矩形領域)に対応する部分画像を抽出し、抽出された部分画像とラベルとを対応付けた学習データを生成してもよい。この場合、学習データ生成部70は、学習データに領域を対応付けなくてもよい。また、各ラベルには、対応付ける部分画像を識別する情報(例えば、ファイル名など)を含めればよい。このように学習データを生成することで、画像を保存するストレージの量を低減させつつ、個々の2次元画像(部分画像)に対応するラベルが設定された学習データを保持することが可能になる。
なお、本実施形態では、2次元物体が存在する領域を領域算出部40が算出する場合について説明した。ただし、上述するように領域の設定が不要な学習データを生成する場合、学習データ生成装置100は、領域算出部40を備えていなくてもよい。
3次元空間生成部20と、2次元物体描画部30と、領域算出部40と、ラベル生成部50と、背景合成部60と、学習データ生成部70とは、プログラム(学習データ生成プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit))によって実現される。
例えば、プログラムは、記憶部10に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、3次元空間生成部20、2次元物体描画部30、領域算出部40、ラベル生成部50、背景合成部60および学習データ生成部70として動作してもよい。また、学習データ生成装置100の機能がSaaS(Software as a Service )形式で提供されてもよい。
3次元空間生成部20と、2次元物体描画部30と、領域算出部40と、ラベル生成部50と、背景合成部60と、学習データ生成部70とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
また、学習データ生成装置100の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本実施形態の学習データ生成装置の動作を説明する。図3は、本実施形態の学習データ生成装置100の動作例を示すフローチャートである。
3次元空間生成部20は、属性が関連付けられた3次元モデルと背景とを仮想空間内にモデリングした3次元空間を生成する(ステップS11)。2次元物体描画部30は、3次元空間における3次元モデルを2次元平面に投影して2次元物体を描画する(ステップS12)。領域算出部40は、描画された2次元物体ごとに、その2次元物体が存在する領域を算出してもよい。
ラベル生成部50は、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成する(ステップS13)。背景合成部60は、2次元物体と背景とを合成した2次元画像を生成する(ステップS14)。そして、学習データ生成部70は、背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成する(ステップS15)。
次に、本実施形態における学習データ生成処理の具体例を説明する。図4は、学習データを生成する処理の例を示す説明図である。まず、3次元空間生成部20が、3次元モデルである複数の人物と、背景とを合成させた3次元空間の画像21を生成する。2次元物体描画部30は、画像21が示す3次元空間の人物を2次元平面に投影して2次元の人物を描画して、2次元画像22を生成する。
領域算出部40は、描画された人物ごとに、その人物が存在する領域31を算出する。また、ラベル生成部50は、人物の属性からラベル32を生成する。背景合成部60は、人物と背景とを合成した2次元画像23を生成する。図4では、ラベルのID=0で特定される人物と背景とを合成した2次元画像を生成した例を示す。なお、ラベルのID=1およびID=2で特定される人物と背景とを合成した2次元画像を生成する方法も同様である。そして、学習データ生成部70は、背景と人物とが合成された2次元画像23と、生成されたラベル32とを対応付けた学習データを生成する。
以上のように、本実施形態では、3次元空間生成部20が、属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成し、2次元物体描画部30が、2次元平面に3次元空間における3次元モデルを投影して2次元物体を描画する。また、ラベル生成部50が、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成し、背景合成部60が、2次元物体と第二の背景とを合成した2次元画像を生成する。そして、学習データ生成部70が、第二の背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成する。よって、データの種類に応じた正解ラベルが付与された学習データをCGから自動で生成できる。
次に、本発明の概要を説明する。図5は、本発明による学習データ生成装置の概要を示すブロック図である。本発明による学習データ生成装置80(例えば、学習データ生成装置100)は、属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成部81(例えば、3次元空間生成部20)と、2次元平面に3次元空間における3次元モデルを投影して2次元物体を描画する2次元物体描画部82(例えば、2次元物体描画部30)と、2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成部83(例えば、ラベル生成部50)と、2次元物体と第二の背景とを合成した2次元画像を生成する背景合成部84(例えば、背景合成部60)と、第二の背景と2次元物体とが合成された2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成部85(例えば、学習データ生成部70)とを備えている。
そのような構成により、データの種類に応じた正解ラベルが付与された学習データをCGから自動で生成できる。
また、学習データ生成装置80は、描画された2次元物体ごとにその2次元物体が存在する領域を算出する領域算出部(例えば、領域算出部40)を備えていてもよい。そして、学習データ生成部85は、2次元画像とラベルと領域とを対応付けた学習データを生成してもよい。
具体的には、領域算出部は、描画された2次元物体ごとに、その2次元物体の外接矩形座標を物体が存在する領域として算出してもよい。
また、2次元物体描画部82は、単一色で定義された2次元平面に3次元モデルを投影して、2次元物体を描画し、領域算出部は、定義された単一色以外の領域を囲む外接矩形座標を、物体が存在する領域として算出してもよい。
また、2次元物体描画部82は、3次元空間内から視点への透視投影変換によって3次元モデルを変換した点群を2次元物体として描画し、領域算出部は、描画された点群に基づいて、2次元物体が存在する領域を算出してもよい。
また、背景合成部84は、2次元物体が描画された際の視点パラメータおよび環境光パラメータと同一のパラメータで定義される背景と、その2次元物体とを合成した2次元画像を生成してもよい。
また、3次元空間生成部81は、変更対象とする複数の視点を示すパラメータのパターンである視点変更パターン、および、変更対象とする複数の環境光を示すパラメータのパターンである環境光変更パターンごとに3次元空間を生成してもよい。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成部と、2次元平面に前記3次元空間における前記3次元モデルを投影して2次元物体を描画する2次元物体描画部と、前記2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成部と、前記2次元物体と第二の背景とを合成した2次元画像を生成する背景合成部と、前記第二の背景と前記2次元物体とが合成された前記2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成部とを備えたことを特徴とする学習データ生成装置。
(付記2)描画された2次元物体ごとに当該2次元物体が存在する領域を算出する領域算出部を備え、学習データ生成部は、2次元画像とラベルと前記領域とを対応付けた学習データを生成する付記1記載の学習データ生成装置。
(付記3)領域算出部は、描画された2次元物体ごとに、当該2次元物体の外接矩形座標を物体が存在する領域として算出する付記2記載の学習データ生成装置。
(付記4)2次元物体描画部は、単一色で定義された2次元平面に3次元モデルを投影して、2次元物体を描画し、領域算出部は、定義された前記単一色以外の領域を囲む外接矩形座標を、物体が存在する領域として算出する付記2または付記3記載の学習データ生成装置。
(付記5)2次元物体描画部は、3次元空間内から視点への透視投影変換によって3次元モデルを変換した点群を2次元物体として描画し、領域算出部は、描画された前記点群に基づいて、2次元物体が存在する領域を算出する付記2から付記4のうちのいずれか1つに記載の学習データ生成装置。
(付記6)背景合成部は、2次元物体が描画された際の視点パラメータおよび環境光パラメータと同一のパラメータで定義される背景と、当該2次元物体とを合成した2次元画像を生成する付記1から付記5のうちのいずれか1つに記載の学習データ生成装置。
(付記7)3次元空間生成部は、変更対象とする複数の視点を示すパラメータのパターンである視点変更パターン、および、変更対象とする複数の環境光を示すパラメータのパターンである環境光変更パターンごとに3次元空間を生成する付記1から付記6のうちのいずれか1つに記載の学習データ生成装置。
(付記8)属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成し、2次元平面に前記3次元空間における前記3次元モデルを投影して2次元物体を描画し、前記2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成し、前記2次元物体と第二の背景とを合成した2次元画像を生成し、前記第二の背景と前記2次元物体とが合成された前記2次元画像と、生成されたラベルとを対応付けた学習データを生成することを特徴とする学習データ生成方法。
(付記9)描画された2次元物体ごとに当該2次元物体が存在する領域を算出し、2次元画像とラベルと前記領域とを対応付けた学習データを生成する付記8記載の学習データ生成方法。
(付記10)コンピュータに、属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成処理、2次元平面に前記3次元空間における前記3次元モデルを投影して2次元物体を描画する2次元物体描画処理、前記2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成処理、前記2次元物体と第二の背景とを合成した2次元画像を生成する背景合成処理、および、前記第二の背景と前記2次元物体とが合成された前記2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成処理を実行させるための学習データ生成プログラム。
(付記11)コンピュータに、描画された2次元物体ごとに当該2次元物体が存在する領域を算出する領域算出処理を実行させ、学習データ生成処理で、2次元画像とラベルと前記領域とを対応付けた学習データを生成させる付記10記載の学習データ生成プログラム。
10 記憶部
20 3次元空間生成部
30 2次元物体描画部
40 領域算出部
50 ラベル生成部
60 背景合成部
70 学習データ生成部
100 学習データ生成装置

Claims (10)

  1. 属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成部と、
    2次元平面に前記3次元空間における前記3次元モデルを投影して2次元物体を描画する2次元物体描画部と、
    前記2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成部と、
    前記2次元物体と第二の背景とを合成した2次元画像を生成する背景合成部と、
    前記第二の背景と前記2次元物体とが合成された前記2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成部とを備え
    前記ラベル生成部は、前記学習データを用いて学習されるモデルが判定する内容を示す新たなラベルを前記属性に基づいて作成し、
    前記学習データ生成部は、生成された新たなラベルを対応付けた学習データを生成する
    ことを特徴とする学習データ生成装置。
  2. 描画された2次元物体ごとに当該2次元物体が存在する領域を算出する領域算出部を備え、
    学習データ生成部は、2次元画像とラベルと前記領域とを対応付けた学習データを生成する
    請求項1記載の学習データ生成装置。
  3. 領域算出部は、描画された2次元物体ごとに、当該2次元物体の外接矩形座標を物体が存在する領域として算出する
    請求項2記載の学習データ生成装置。
  4. 2次元物体描画部は、単一色で定義された2次元平面に3次元モデルを投影して、2次元物体を描画し、
    領域算出部は、定義された前記単一色以外の領域を囲む外接矩形座標を、物体が存在する領域として算出する
    請求項2または請求項3記載の学習データ生成装置。
  5. 2次元物体描画部は、3次元空間内から視点への透視投影変換によって3次元モデルを変換した点群を2次元物体として描画し、
    領域算出部は、描画された前記点群に基づいて、2次元物体が存在する領域を算出する
    請求項2から請求項4のうちのいずれか1項に記載の学習データ生成装置。
  6. 背景合成部は、2次元物体が描画された際の視点パラメータおよび環境光パラメータと同一のパラメータで定義される背景と、当該2次元物体とを合成した2次元画像を生成する
    請求項1から請求項5のうちのいずれか1項に記載の学習データ生成装置。
  7. 3次元空間生成部は、変更対象とする複数の視点を示すパラメータのパターンである視点変更パターン、および、変更対象とする複数の環境光を示すパラメータのパターンである環境光変更パターンごとに3次元空間を生成する
    請求項1から請求項6のうちのいずれか1項に記載の学習データ生成装置。
  8. 属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成し、
    2次元平面に前記3次元空間における前記3次元モデルを投影して2次元物体を描画し、
    前記2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成し、
    前記2次元物体と第二の背景とを合成した2次元画像を生成し、
    前記第二の背景と前記2次元物体とが合成された前記2次元画像と、生成されたラベルとを対応付けた学習データを生成し、
    前記ラベルの生成において、前記学習データを用いて学習されるモデルが判定する内容を示す新たなラベルを前記属性に基づいて作成し、
    生成された新たなラベルを対応付けた学習データを生成する
    ことを特徴とする学習データ生成方法。
  9. 描画された2次元物体ごとに当該2次元物体が存在する領域を算出し、
    2次元画像とラベルと前記領域とを対応付けた学習データを生成する
    請求項8記載の学習データ生成方法。
  10. コンピュータに、
    属性が関連付けられた3次元モデルと第一の背景とを仮想空間内にモデリングした3次元空間を生成する3次元空間生成処理、
    2次元平面に前記3次元空間における前記3次元モデルを投影して2次元物体を描画する2次元物体描画処理、
    前記2次元物体の投影元の3次元モデルに関連付けられた属性からラベルを生成するラベル生成処理、
    前記2次元物体と第二の背景とを合成した2次元画像を生成する背景合成処理、および、
    前記第二の背景と前記2次元物体とが合成された前記2次元画像と、生成されたラベルとを対応付けた学習データを生成する学習データ生成処理を実行させ、
    前記ラベル生成処理で、前記学習データを用いて学習されるモデルが判定する内容を示す新たなラベルを前記属性に基づいて作成させ、
    前記学習データ生成処理で、生成された新たなラベルを対応付けた学習データを生成させる
    ための学習データ生成プログラム。
JP2021504668A 2019-03-12 2019-03-12 学習データ生成装置、学習データ生成方法および学習データ生成プログラム Active JP7388751B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/009921 WO2020183598A1 (ja) 2019-03-12 2019-03-12 学習データ生成装置、学習データ生成方法および学習データ生成プログラム

Publications (2)

Publication Number Publication Date
JPWO2020183598A1 JPWO2020183598A1 (ja) 2021-12-23
JP7388751B2 true JP7388751B2 (ja) 2023-11-29

Family

ID=72427386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021504668A Active JP7388751B2 (ja) 2019-03-12 2019-03-12 学習データ生成装置、学習データ生成方法および学習データ生成プログラム

Country Status (3)

Country Link
US (1) US20220157049A1 (ja)
JP (1) JP7388751B2 (ja)
WO (1) WO2020183598A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023093134A (ja) * 2021-12-22 2023-07-04 オプテックス株式会社 学習用データ生成装置、自動ドアシステム、学習用データ生成方法、学習済みモデル生成方法、制御プログラム、および記録媒体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130336640A1 (en) * 2012-06-15 2013-12-19 Efexio, Inc. System and method for distributing computer generated 3d visual effects over a communications network
JP6476658B2 (ja) * 2013-09-11 2019-03-06 ソニー株式会社 画像処理装置および方法
CN105869217B (zh) * 2016-03-31 2019-03-19 南京云创大数据科技股份有限公司 一种虚拟真人试衣方法
JP2019023858A (ja) * 2017-07-21 2019-02-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 学習データ生成装置、学習データ生成方法、機械学習方法及びプログラム
US10699165B2 (en) * 2017-10-30 2020-06-30 Palo Alto Research Center Incorporated System and method using augmented reality for efficient collection of training data for machine learning
US10846818B2 (en) * 2018-11-15 2020-11-24 Toyota Research Institute, Inc. Systems and methods for registering 3D data with 2D image data
JP6810173B2 (ja) * 2019-01-29 2021-01-06 日本金銭機械株式会社 物体把持システム

Also Published As

Publication number Publication date
WO2020183598A1 (ja) 2020-09-17
JPWO2020183598A1 (ja) 2021-12-23
US20220157049A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
US11321769B2 (en) System and method for automatically generating three-dimensional virtual garment model using product description
CN112598785B (zh) 虚拟形象的三维模型生成方法、装置、设备及存储介质
KR20200020739A (ko) 인체 윤곽 키 포인트 검출 방법, 이미지 처리 방법, 장치 및 기기
JP5299173B2 (ja) 画像処理装置および画像処理方法、並びにプログラム
US20130127827A1 (en) Multiview Face Content Creation
US10467793B2 (en) Computer implemented method and device
KR20160041570A (ko) 몽타주 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체
US20140118396A1 (en) Image processing device, image processing method, and computer program product
KR20100138648A (ko) 영상 처리 장치 및 방법
CN104933697A (zh) 图像处理设备、图像处理系统以及图像处理方法
JP6340313B2 (ja) モデリングシステム、モデリングプログラム、及びモデリング方法
CN107610239A (zh) 一种脸谱的虚拟试戴方法及装置
CN110751733A (zh) 用于将3d扫描对象转换为化身的方法和装置
KR20060021001A (ko) 개체인지를 이용한 Marker-less 증강현실과 복합현실 응용시스템 및 그 방법
JP7388751B2 (ja) 学習データ生成装置、学習データ生成方法および学習データ生成プログラム
CN111353069A (zh) 一种人物场景视频生成方法、系统、装置及存储介质
JP7314509B2 (ja) 情報処理装置、情報処理方法及びプログラム
Queiroz et al. A framework for generic facial expression transfer
KR101780496B1 (ko) 컴퓨터그래픽 툴에 의한 캐릭터 모델링 기반 3d 디지털액터 영상 구현방법
CN115880748A (zh) 人脸重建和遮挡区域识别方法、装置、设备及存储介质
KR102097360B1 (ko) 패턴 이미지 기반 얼굴 마스크 제작 장치 및 방법
CN114581288A (zh) 一种图像生成方法、装置、电子设备以及存储介质
US20190377935A1 (en) Method and apparatus for tracking features
JP2005339363A (ja) 人体パーツ自動分割装置及び人体パーツ自動分割方法
US8659600B2 (en) Generating vector displacement maps using parameterized sculpted meshes

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210721

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230314

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20230427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231109

R151 Written notification of patent or utility model registration

Ref document number: 7388751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151