JP6955734B1 - 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム - Google Patents

画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム Download PDF

Info

Publication number
JP6955734B1
JP6955734B1 JP2021036263A JP2021036263A JP6955734B1 JP 6955734 B1 JP6955734 B1 JP 6955734B1 JP 2021036263 A JP2021036263 A JP 2021036263A JP 2021036263 A JP2021036263 A JP 2021036263A JP 6955734 B1 JP6955734 B1 JP 6955734B1
Authority
JP
Japan
Prior art keywords
learning
information
image data
segment
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021036263A
Other languages
English (en)
Other versions
JP2022136583A (ja
Inventor
明洋 庵原
明洋 庵原
陸 藤元
陸 藤元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datagrid Inc
Original Assignee
Datagrid Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datagrid Inc filed Critical Datagrid Inc
Priority to JP2021036263A priority Critical patent/JP6955734B1/ja
Priority to JP2021154694A priority patent/JP7398127B2/ja
Application granted granted Critical
Publication of JP6955734B1 publication Critical patent/JP6955734B1/ja
Publication of JP2022136583A publication Critical patent/JP2022136583A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】生成した画像データの特徴部分の境界が不自然となる場合がある。【解決手段】拡張対象物に拡張データを適用した画像データを生成する画像データ生成方法であって、拡張対象物の位置形態情報を特定した第1ラベル情報を取得する段階と、拡張対象物において拡張データが適用されるデータ適用領域を特定したセグメント情報を取得する段階と、第1ラベル情報とセグメント情報に基づいて第2ラベル情報を生成する段階と、第2ラベル情報に基づいて、拡張対象物に拡張データを適用した画像データを生成する段階とを備える画像データ生成方法を提供する。【選択図】図1A

Description

本発明は、画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラムに関する。
従来、画像の特徴部分を拡張した拡張データを他の画像に適用して画像データを生成することが知られている(例えば、特許文献1参照)。
特許文献1 特開2020−197833号公報
従来の方法では、生成した画像データの特徴部分の境界が不自然となる場合がある。
本発明の第1の態様においては、拡張対象物に拡張データを適用した画像データを生成する画像データ生成方法であって、拡張対象物の位置形態情報を特定した第1ラベル情報を取得する段階と、拡張対象物において拡張データが適用されるデータ適用領域を特定したセグメント情報を取得する段階と、第1ラベル情報とセグメント情報に基づいて第2ラベル情報を生成する段階と、第2ラベル情報に基づいて、拡張対象物に拡張データを適用した画像データを生成する段階とを備える画像データ生成方法を提供する。
本発明の第2の態様においては、学習対象データを取得するための学習対象物の位置形態情報を特定した第1学習用ラベル情報を取得する段階と、学習対象物において学習対象データが取得される学習データ取得領域を特定したセグメント情報を取得する段階と、第1学習用ラベル情報とセグメント情報に基づいて生成された第2学習用ラベル情報を取得する段階と、第2学習用ラベル情報に基づいて、学習対象データを取得するモデルの学習処理を実行する段階とを備える画像データ生成の学習方法を提供する。
本発明の第3の態様においては、コンピュータに本発明の第1の態様に記載の画像データ生成方法を実行させるためのプログラムを提供する。
本発明の第4の態様においては、コンピュータに本発明の第2の態様に記載の画像データ生成の学習方法を実行させるためのプログラムを提供する。
本発明の第5の態様においては、拡張対象物に拡張データを適用した画像データを生成する画像データ生成システムであって、拡張対象物の位置形態情報を特定した第1ラベル情報を取得する第1ラベル情報取得部と、拡張対象物において拡張データが適用されるデータ適用領域を特定したセグメント情報を取得するセグメント情報取得部と、第1ラベル情報とセグメント情報に基づいて第2ラベル情報を取得する第2ラベル情報取得部と、第2ラベル情報に基づいて、拡張対象物に拡張データを適用した画像データを生成する画像データ生成部とを備える画像データ生成システムを提供する。
本発明の第6の態様においては、学習対象データを取得するための学習対象物の位置形態情報を特定した第1学習用ラベル情報を取得する第1学習用ラベル情報取得部と、学習対象物において学習対象データが取得される学習データ取得領域を特定したセグメント情報を取得する学習セグメント情報取得部と、第1学習用ラベル情報とセグメント情報に基づいて生成された第2学習用ラベル情報を取得する第2学習用ラベル情報取得部と、第2学習用ラベル情報に基づいて、学習対象データを取得する学習データ取得部とを備える画像データ生成の学習システムを提供する。
なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
画像データ生成システム100の構成の概要を示す。 画像データ生成システム100を用いた画像データの生成方法の一例を示す。 学習システム200の構成の概要を示す。 学習システム200を用いた画像データの学習方法の一例を示す。 画像データ生成システム100を用いた画像データの生成方法の一例を示す。 画像データ生成システム100を用いた画像データの生成方法の一例を示す。 画像データ生成システム100を用いた画像データの生成方法の一例を示す。 画像データ生成システム100を用いた画像データの生成方法の一例を示す。 第2ラベル情報L2の一例を示す。 第2ラベル情報L2の一例を示す。 第2ラベル情報L2の一例を示す。 第2ラベル情報L2の一例を示す。 本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ2200の例を示す。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1Aは、画像データ生成システム100の構成の概要を示す。本例の画像データ生成システム100は、第1ラベル情報取得部11と、第2ラベル情報取得部12と、セグメント情報取得部20と、画像データ生成部30とを備える。画像データ生成システム100は、拡張対象物150に拡張データを適用した画像データを生成する。
第1ラベル情報取得部11は、拡張対象物150の位置形態情報を特定した第1ラベル情報L1を取得する。位置形態情報とは、拡張対象物150の位置、形状またはテクスチャの少なくとも1つに関する情報を含む情報である。第1ラベル情報L1は、拡張対象物150の位置形態情報を特定できる情報であれば、画像データ、座標等の数値データまたはこれらの組み合わせであってよい。第1ラベル情報取得部11は、エッジ検出またはセグメンテーション等の手法によって、拡張対象画像から拡張対象物150の位置形態情報を取得してよい。
第2ラベル情報取得部12は、第1ラベル情報L1とセグメント情報に基づいて第2ラベル情報L2を取得する。セグメント情報は、拡張するためのセグメント対象に関する情報を含む。例えば、セグメント情報は、データ適用領域R1の位置情報およびクラス情報を含む。データ適用領域R1は、拡張対象物150において拡張データが適用される領域である。クラス情報は、セグメント対象の種類およびデータ属性を含んでよい。例えば、データ適用領域R1の位置情報がセグメントの位置で表現されて、セグメント対象の種類がセグメントの色で表現される。セグメント対象は、拡張対象物150がネジの場合には例えばネジの傷である。
セグメント情報取得部20は、データ適用領域R1を特定したセグメント情報を取得する。セグメント情報は、自動で生成された情報であってもよいし、ユーザによって手動で入力された情報であってもよい。一例において、セグメント情報取得部20は、ユーザによって入力された情報に基づくセグメント情報を取得する。また、セグメント情報取得部20は、データ適用領域R1となり得る範囲を予め指定してランダムにデータ適用領域R1を生成して自動でセグメント情報を取得してもよい。
画像データ生成部30は、第2ラベル情報L2に基づいて、拡張対象物150に拡張データを適用した画像データを生成する。画像データ生成部30は、入力された第2ラベル情報L2に応じて、予め定められた画像データを生成するように学習された学習済みモデルを備えてよい。学習済みモデルは、後述する画像データ生成の学習方法によって学習されてよい。
本例の画像データ生成システム100は、セグメント情報を用いて拡張対象画像に拡張データを適用して、任意のセグメント対象を拡張した画像データを生成する。このように、画像データ生成システム100は、セグメント情報を用いて適用する拡張データを任意に選択することにより、元画像のアイデンティティを残しつつ、拡張したデータを適用できる。これにより、画像データ生成システム100は、より自然な拡張画像を生成することができる。
図1Bは、画像データ生成システム100を用いた画像データの生成方法の一例を示す。本例では、画像データ生成システム100を用いて、拡張対象物150であるネジに予め定められた傷Sが適用された画像データを生成する方法を説明する。
拡張対象画像は、拡張対象物150の実画像である。拡張対象画像の拡張対象物150には、セグメント対象である傷Sが含まれていなくてよい。
第1ラベル情報L1は、拡張対象物150の位置形態情報を含む。本例の第1ラベル情報L1は、拡張対象物150のエッジ検出により取得されたエッジ画像である。第1ラベル情報L1は、拡張対象物150のテクスチャに関する情報を含んでよい。
第2ラベル情報L2は、第1ラベル情報L1およびセグメント情報に基づいて生成された情報である。本例の第2ラベル情報L2は、拡張対象物150の任意の位置がセグメンテーションされた情報を含む。本例の第2ラベル情報L2は、拡張対象物150の任意の位置にデータ適用領域R1が適用されている。
データ適用領域R1は、自動または手動により、形状、サイズまたは位置が設定されてよい。設定されたデータ適用領域R1に拡張データを適用することにより、任意の形状、サイズまたは位置が反映された画像データを生成することができる。データ適用領域R1の位置は、ユーザによって指定されてもよい。画像データは、データ適用領域R1に予め学習された傷Sの拡張データを適用して生成される。適用される傷Sの種類は、ユーザによって選択されてもよいし、傷Sの発生する可能性がある範囲を指定してランダムに生成されてもよいし、ネジ以外の傷に基づいて生成されてもよい。なお、拡張対象物150には、複数のデータ適用領域R1が適用されてもよい。
非対象領域Rr1は、データ適用領域R1以外の領域である。非対象領域Rr1は、セグメンテーションされた領域であってもよいし、実画像またはエッジなどのセグメント以外の領域であってもよい。
本例の画像データ生成システム100は、セグメント情報を指定することにより、任意のデータ適用領域R1に拡張データとして傷Sを適用している。したがって、画像データ生成システム100は、ネジの傷Sの画像データが十分に蓄積されていない場合であっても、様々な種類の傷Sが反映されたネジの画像データを生成することができる。また、画像データ生成システム100は、学習したネジとは異なる製品のネジに傷Sを拡張して適用することもできる。
このように、画像データ生成システム100は、様々な形態の不良品の画像データを生成して、生成した画像を不良品の検知に用いてよい。これにより、不良品のサンプルが少ない場合であっても、データを拡張して新たな製品の不良品を検知することができる。なお、後述する通り、画像データ生成システム100の用途は不良品の検知に限定されない。
図2Aは、学習システム200の構成の概要を示す。学習システム200は、第1学習用ラベル情報取得部211と、第2学習用ラベル情報取得部212と、学習セグメント情報取得部220と、学習対象データ取得部230とを備える。学習システム200は、学習対象物250を含む学習対象画像から学習対象データを取得する。学習システム200によってモデルの学習処理を実行することで、画像データ生成システム100において画像データを生成させるための学習済みモデルを生成できる。
第1学習用ラベル情報取得部211は、学習対象物250の位置形態情報を特定した第1学習用ラベル情報LL1を取得する。第1学習用ラベル情報LL1は、学習対象物250の位置形態情報を特定できる情報であれば、画像データ、座標等の数値データまたはこれらの組み合わせであってよい。第1学習用ラベル情報取得部211は、エッジ検出またはセグメンテーション等の手法によって、学習対象物250の位置形態情報を取得してよい。
第2学習用ラベル情報取得部212は、第1学習用ラベル情報LL1とセグメント情報に基づいて生成された第2学習用ラベル情報LL2を取得する。本例のセグメント情報は、学習対象とするセグメント対象に関する情報と、学習データ取得領域R2の位置情報とを含む。学習データ取得領域R2は、学習対象物250において、セグメント対象が設けられた領域である。また、本例のセグメント情報は、学習対象のクラス情報に関する情報を含んでよい。
学習セグメント情報取得部220は、学習対象物250において学習対象データが取得される学習データ取得領域R2を特定したセグメント情報を取得する。本例のセグメント情報は、自動で生成された情報であってもよいし、ユーザによって手動で入力された情報であってもよい。一例において、学習セグメント情報取得部220は、ユーザによって入力された情報に基づくセグメント情報を取得する。また、学習セグメント情報取得部220は、学習データ取得領域R2を自動で検出してセグメント情報を取得してもよい。
学習対象データ取得部230は、第2学習用ラベル情報LL2に基づいて、学習対象データを取得する。学習対象データ取得部230は、入力された第2学習用ラベル情報LL2に応じて、予め定められた画像データを生成するようなモデルの学習を実現する。
学習システム200は、学習段階において、セグメント情報に応じた学習対象データを生成している。そのため、画像データ生成システム100は、推論段階においてもセグメント情報に応じた画像データの生成を実現することができる。
図2Bは、学習システム200を用いた画像データの学習方法の一例を示す。本例では、学習システム200を用いて、学習対象物250であるネジから、傷Sを学習対象として学習対象データを取得する方法を説明する。
学習対象画像は、学習対象物250の実画像である。学習対象画像の学習対象物250には、学習対象である傷Sが含まれている。
第1学習用ラベル情報LL1は、学習対象物250の位置形態情報を含む。本例の第1学習用ラベル情報LL1は、学習対象物250のエッジ検出により取得されたエッジ画像である。第1学習用ラベル情報LL1は、学習対象物250のテクスチャに関する情報を含んでよい。
第2学習用ラベル情報LL2は、第1学習用ラベル情報LL1およびセグメント情報に基づいて生成された情報である。本例の第2学習用ラベル情報LL2は、学習対象物250の傷Sに対応する位置がセグメンテーションされた情報を含む。学習段階において、第2学習用ラベル情報LL2を取得しておくことにより、画像データの生成時において拡張データを容易に適用することができる。
学習対象データは、第2学習用ラベル情報LL2に基づいて生成される。本例の学習対象データは、学習データ取得領域R2のセグメント情報を含む。学習対象データは、セグメント対象と、学習データ取得領域R2の位置情報およびクラス情報とを含んでよい。また、学習対象データは、非対象領域Rr2の位置形態情報を含んでよい。
非対象領域Rr2は、学習データ取得領域R2以外の領域である。非対象領域Rr2は、セグメンテーションされた領域であってもよいし、実画像またはエッジなどのセグメント以外の領域であってもよい。
図3Aは、画像データ生成システム100を用いた画像データの生成方法の一例を示す。本例の画像データ生成システム100は、学習対象データから特定の学習対象データを指定して、拡張対象物150に反映させる。本例の画像データ生成システム100は、学習対象データではネジ部の先端側にあった傷Sを、ネジ部の根元側に適用している。
学習対象データは、ネジ部の先端側に傷Sが存在している画像である。セグメント情報は、学習対象データの非対象領域Rr0をエッジ検出して、拡張対象領域R0をセグメンテーションして生成される。拡張対象領域R0は、学習対象データの傷Sのある領域であり、非対象領域Rr0は、拡張対象領域R0以外の領域である。
第2ラベル情報L2は、第1ラベル情報L1およびセグメント情報に基づいて生成される。第2ラベル情報L2のデータ適用領域R1は、拡張対象物150のネジ部の根元側に設定される。これにより、画像データ生成システム100は、学習対象データの傷Sをネジ部の根元側に適用された画像データを生成することができる。
本例の画像データ生成システム100は、特定の学習対象データを指定して、指定されたセグメント対象を拡張対象物150に適用した拡張データを取得することができる。本例では、ネジに傷Sを適用する実施形態について説明したが、用途はこれに限定されない。
図3Bは、画像データ生成システム100を用いた画像データの生成方法の一例を示す。本例の画像データ生成システム100は、拡張対象物150にヒトを用いている点で図3Aの場合と相違する。本例の画像データ生成システム100は、指定された任意の人物Aの鼻を拡張対象物150の鼻に適用する。セグメント対象S1はヒトの鼻を示しており、クラス数C1は、例えば、高い鼻などの鼻の特徴を示す。クラス情報は、性別または国籍などのデータ属性を含んでよい。
このように、本例の画像データ生成システム100は、イメージ共有のために画像データの生成を実現できる。例えば、画像データ生成システム100は、学習対象データとしてタトゥの画像を使用することにより、ヒトにタトゥを彫った場合の仕上がりのイメージ画像を生成できる。画像データ生成システム100を用いることにより、画像を拡張する領域を自由に変更できる。また、画像データ生成システム100は、ヒトの手術後または整形後の仕上がりのイメージ画像の生成に用いられてもよい。
図3Cは、画像データ生成システム100を用いた画像データの生成方法の一例を示す。本例の画像データ生成システム100は、複数のクラス数の中から予め定められたクラス数を指定して、拡張対象物150に反映させる。本例の学習対象データにおいては、セグメント対象がネジの傷であり、複数のクラス数が含まれている。即ち、学習システム200は、予め複数のクラス情報に応じた傷Sを学習している。例えば、クラス数C1は、ネジ部の先端側の傷Sを示し、クラス数C2は、ネジの頭部の傷Sを示す。
本例のセグメント情報は、クラス数C1の学習対象データの非対象領域Rr0をエッジ検出し、拡張対象領域R0をセグメンテーションすることで生成される。第2ラベル情報L2は、第1ラベル情報L1およびセグメント情報に基づいて生成され、ネジ部の根元側のデータ適用領域R1を含む。
画像データは、指定されたクラス情報に基づいて生成される。本例の画像データは、クラス数C1の傷Sを拡張対象画像に適用されて生成される。なお、本例の画像データ生成システム100は、クラス数C1の傷Sを指定したが、任意のクラス数を指定してよい。例えば、画像データ生成システム100は、クラス数C2の傷Sを拡張対象物150に適用することにより、ネジの頭部に傷Sがある画像データを生成してもよい。
本例の画像データ生成システム100は、複数のクラス数から任意のクラス数を指定できるので、適用したい傷Sの種類を選択して、画像データを生成できる。傷Sの種類は、ネジの欠け、凹み、ネジ山のつぶれ、線傷または腐食などを含んでよく、それぞれにクラス数が付与されていてもよい。
図3Dは、画像データ生成システム100を用いた画像データの生成方法の一例を示す。本例の画像データ生成システム100は、予め定められたクラス情報およびセグメント対象を指定して、セグメント情報を取得する。
学習対象データは、セグメント対象S1、S2およびクラス数C1、C2を含む人物Aの情報を含む。本例のセグメント対象S1は鼻であり、セグメント対象S2は口である。クラス数C1は高い鼻を示し、クラス数C2は小さい口を示す。また、学習対象データは、セグメント対象S1、S2およびクラス数C3、C4を含む人物Bの情報を含む。本例のクラス数C3は低い鼻を示し、クラス数C4は大きい口を示す。
第2ラベル情報L2は、複数のデータ適用領域R1を含む。本例の第2ラベル情報L2は、セグメント対象S1に応じたデータ適用領域R1aと、セグメント対象S2に応じたデータ適用領域R1bの両方を含む。本例では、複数のデータ適用領域R1に異なるセグメント対象が対応づけられているが、用途によっては同一のセグメント対象が対応づけられてもよい。
画像データは、指定されたクラス情報およびセグメント情報に基づいて生成される。本例の画像データは、セグメント対象S1、S2について、それぞれクラス数C1およびC4のセグメント情報に基づいて生成されている。
本例では、人物Aおよび人物Bの両方から、同一のセグメント対象である鼻のセグメント情報を取得して、学習対象データが用意されている。これにより、各人物のアイデンティティを残すことができる。本例の画像データ生成システム100は、各セグメント対象を組み合わせて新たな画像データを生成できるので、バーチャルヒューマンの生成に用いることもできる。
図4Aは、第2ラベル情報L2の一例を示す。第2ラベル情報L2は、エッジ、セグメントまたは実画像の少なくとも1つの組み合わせを含んでよい。本例の第2ラベル情報L2は、エッジとセグメントの組み合わせによって表現されている。本例では、非対象領域Rr1をエッジで示しており、データ適用領域R1をセグメントで示している。
図4Bは、第2ラベル情報L2の一例を示す。本例の第2ラベル情報L2は、エッジ、セグメントおよび実画像の組み合わせによって表現されている。本例では、非対象領域Rr1を実画像で示しており、データ適用領域R1をエッジとセグメントの組み合わせで示している。
図4Cは、第2ラベル情報L2の一例を示す。本例の第2ラベル情報L2は、セグメントと実画像の組み合わせによって表現されている。本例では、非対象領域Rr1を実画像で示しており、データ適用領域R1をセグメントで示している。
図4Dは、第2ラベル情報L2の一例を示す。本例の第2ラベル情報L2は、セグメントのみによって表現されている。即ち、本例では、非対象領域Rr1およびデータ適用領域R1の両方をセグメントで示している。
以上の通り、第2ラベル情報L2は、データ適用領域R1をセグメンテーションしているので、任意の元データから拡張した画像データを生成することができる。これにより、元画像のアイデンティティを残しつつ、より自然な拡張画像を生成することができる。
図5は、本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作又は当該装置の1又は複数のセクションとして機能させることができ、又は当該操作又は当該1又は複数のセクションを実行させることができ、及び/又はコンピュータ2200に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。
本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、及びディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インタフェース2222、ハードディスクドライブ2224、DVD−ROMドライブ2226、及びICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230及びキーボード2242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ2240を介して入/出力コントローラ2220に接続されている。
CPU2212は、ROM2230及びRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等又はそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。
通信インタフェース2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラム及びデータを格納する。DVD−ROMドライブ2226は、プログラム又はデータをDVD−ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、及び/又はコンピュータ2200のハードウェアに依存するプログラムを格納する。入/出力チップ2240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ2220に接続してよい。
プログラムが、DVD−ROM2201又はICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、又はROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ2200の使用に従い情報の操作又は処理を実現することによって構成されてよい。
例えば、通信がコンピュータ2200及び外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース2222に対し、通信処理を命令してよい。通信インタフェース2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD−ROM2201、又はICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
また、CPU2212は、ハードディスクドライブ2224、DVD−ROMドライブ2226(DVD−ROM2201)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
上で説明したプログラム又はソフトウェアモジュールは、コンピュータ2200上又はコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバーシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
11・・・第1ラベル情報取得部、12・・・第2ラベル情報取得部、20・・・セグメント情報取得部、30・・・画像データ生成部、100・・・画像データ生成システム、150・・・拡張対象物、200・・・学習システム、211・・・第1学習用ラベル情報取得部、212・・・第2学習用ラベル情報取得部、220・・・学習セグメント情報取得部、230・・・学習対象データ取得部、250・・・学習対象物、2200・・・コンピュータ、2201・・・DVD−ROM、2210・・・ホストコントローラ、2212・・・CPU、2214・・・RAM、2216・・・グラフィックコントローラ、2218・・・ディスプレイデバイス、2220・・・入/出力コントローラ、2222・・・通信インタフェース、2224・・・ハードディスクドライブ、2226・・・DVD−ROMドライブ、2230・・・ROM、2240・・・入/出力チップ、2242・・・キーボード

Claims (15)

  1. 拡張対象物に拡張データを適用した画像データを生成する画像データ生成方法であって、
    前記拡張対象物の位置形態情報を特定した第1ラベル情報を取得する段階と、
    前記拡張対象物において拡張データが適用されるデータ適用領域を特定したセグメント情報を取得する段階と、
    前記第1ラベル情報と前記セグメント情報に基づいて第2ラベル情報を生成する段階と、
    前記第2ラベル情報に基づいて、前記拡張対象物に拡張データを適用した画像データを生成する段階と
    を備え、コンピュータにより実行される画像データ生成方法。
  2. 前記セグメント情報は、前記拡張データのセグメント対象に関する情報を含む
    請求項1に記載の画像データ生成方法。
  3. 前記セグメント情報は、前記データ適用領域の位置情報およびクラス情報を含む
    請求項1または2に記載の画像データ生成方法。
  4. 前記データ適用領域の形状、サイズまたは位置の少なくとも1つを変形する段階と、
    変形された前記データ適用領域に、前記拡張データを適用する段階とを備える
    請求項1から3のいずれか一項に記載の画像データ生成方法。
  5. 前記画像データを生成する段階は、予め定められた学習対象物の学習対象データに基づいて、前記画像データを生成する段階を有する
    請求項1から4のいずれか一項に記載の画像データ生成方法。
  6. 前記セグメント情報を取得する段階は、予め定められたクラス情報を取得する段階を有し、
    画像データを生成する段階は、取得された前記クラス情報に基づいて、前記画像データを生成する段階を有する
    請求項1から4のいずれか一項に記載の画像データ生成方法。
  7. 前記セグメント情報を取得する段階は、予め定められたクラス情報およびセグメント対象を取得する段階を有し、
    画像データを生成する段階は、取得された前記クラス情報および前記セグメント情報に基づいて、前記画像データを生成する段階を有する
    請求項1から4のいずれか一項に記載の画像データ生成方法。
  8. 学習対象データを取得するための学習対象物の位置形態情報を特定した第1学習用ラベル情報を取得する段階と、
    前記学習対象物において前記学習対象データが取得される学習データ取得領域を特定したセグメント情報を取得する段階と、
    前記第1学習用ラベル情報と前記セグメント情報に基づいて生成された第2学習用ラベル情報を取得する段階と、
    前記第2学習用ラベル情報に基づいて、前記学習対象データを取得するモデルの学習処理を実行する段階と
    を備える
    コンピュータにより実行される画像データ生成の学習方法。
  9. 前記セグメント情報は、学習対象とするセグメント対象に関する情報と、前記学習データ取得領域の位置情報とを含む
    請求項8に記載の画像データ生成の学習方法。
  10. 前記セグメント情報は、学習対象のクラス情報に関する情報を含む
    請求項8または9に記載の画像データ生成の学習方法。
  11. 予め定められた第1学習対象物からセグメント対象に関する第1学習対象データを取得する段階と、
    前記第1学習対象物と異なる第2学習対象物から、前記セグメント対象と同一のセグメント対象に関する第2学習対象データを取得する段階と
    を備え、
    前記第1学習対象データおよび前記第2学習対象データは、異なるセグメント情報に対応づけられる
    請求項8または9に記載の画像データ生成の学習方法。
  12. コンピュータに請求項1から7のいずれか一項に記載の画像データ生成方法を実行させるためのプログラム。
  13. コンピュータに請求項8から11のいずれか一項に記載の画像データ生成の学習方法を実行させるためのプログラム。
  14. 拡張対象物に拡張データを適用した画像データを生成する画像データ生成システムであって、
    前記拡張対象物の位置形態情報を特定した第1ラベル情報を取得する第1ラベル情報取得部と、
    前記拡張対象物において拡張データが適用されるデータ適用領域を特定したセグメント情報を取得するセグメント情報取得部と、
    前記第1ラベル情報と前記セグメント情報に基づいて第2ラベル情報を取得する第2ラベル情報取得部と、
    前記第2ラベル情報に基づいて、前記拡張対象物に拡張データを適用した画像データを生成する画像データ生成部と
    を備える画像データ生成システム。
  15. 学習対象データを取得するための学習対象物の位置形態情報を特定した第1学習用ラベル情報を取得する第1学習用ラベル情報取得部と、
    前記学習対象物において前記学習対象データが取得される学習データ取得領域を特定したセグメント情報を取得する学習セグメント情報取得部と、
    前記第1学習用ラベル情報と前記セグメント情報に基づいて生成された第2学習用ラベル情報を取得する第2学習用ラベル情報取得部と、
    前記第2学習用ラベル情報に基づいて、前記学習対象データを取得する学習データ取得部と
    を備える画像データ生成の学習システム。
JP2021036263A 2021-03-08 2021-03-08 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム Active JP6955734B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021036263A JP6955734B1 (ja) 2021-03-08 2021-03-08 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム
JP2021154694A JP7398127B2 (ja) 2021-03-08 2021-09-22 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021036263A JP6955734B1 (ja) 2021-03-08 2021-03-08 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021154694A Division JP7398127B2 (ja) 2021-03-08 2021-09-22 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP6955734B1 true JP6955734B1 (ja) 2021-10-27
JP2022136583A JP2022136583A (ja) 2022-09-21

Family

ID=78119255

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021036263A Active JP6955734B1 (ja) 2021-03-08 2021-03-08 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム
JP2021154694A Active JP7398127B2 (ja) 2021-03-08 2021-09-22 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021154694A Active JP7398127B2 (ja) 2021-03-08 2021-09-22 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム

Country Status (1)

Country Link
JP (2) JP6955734B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019079114A (ja) * 2017-10-20 2019-05-23 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2020005202A (ja) * 2018-06-29 2020-01-09 日本放送協会 映像処理装置
JP2020187735A (ja) * 2019-05-13 2020-11-19 富士通株式会社 表面欠陥識別方法及び装置
JP2020197833A (ja) * 2019-05-31 2020-12-10 楽天株式会社 データ拡張システム、データ拡張方法、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6573226B2 (ja) 2017-12-15 2019-09-11 オムロン株式会社 データ生成装置、データ生成方法及びデータ生成プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019079114A (ja) * 2017-10-20 2019-05-23 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2020005202A (ja) * 2018-06-29 2020-01-09 日本放送協会 映像処理装置
JP2020187735A (ja) * 2019-05-13 2020-11-19 富士通株式会社 表面欠陥識別方法及び装置
JP2020197833A (ja) * 2019-05-31 2020-12-10 楽天株式会社 データ拡張システム、データ拡張方法、及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TONG ZHOU, ET AL.: "Learning Oracle Attention for High-fidelity Face Completion", ARXIV, JPN6021010963, 31 March 2020 (2020-03-31), ISSN: 0004576802 *
ZHANG XIAN, ET AL.: "Domain Embedded Multi-model Generative Adversarial Networks", ARXIV, JPN6021010965, 20 June 2020 (2020-06-20), ISSN: 0004576803 *

Also Published As

Publication number Publication date
JP2022136957A (ja) 2022-09-21
JP2022136583A (ja) 2022-09-21
JP7398127B2 (ja) 2023-12-14

Similar Documents

Publication Publication Date Title
US11176415B2 (en) Assisted image annotation
US11928592B2 (en) Visual sign language translation training device and method
Lin et al. Face parsing with roi tanh-warping
US11727688B2 (en) Method and apparatus for labelling information of video frame, device, and storage medium
US9349076B1 (en) Template-based target object detection in an image
WO2017035966A1 (zh) 用于人脸图像处理的方法和装置
CN112287187A (zh) 利用对象属性检测模型来自动地选择图像中所检测的对象的实例
CN113689436B (zh) 图像语义分割方法、装置、设备及存储介质
JP7173309B2 (ja) 学習方法、学習プログラム、および、学習装置
CN109241973A (zh) 一种纹理背景下的字符全自动软分割方法
CN111292334B (zh) 一种全景图像分割方法、装置及电子设备
CN109120994A (zh) 一种视频文件自动剪辑方法、装置及计算机可读介质
Syahputra et al. Finger recognition as interaction media in Augmented Reality for historical buildings in Matsum and Kesawan regions of Medan City
CN114022748A (zh) 目标识别方法、装置、设备及存储介质
CN110192225B (zh) 无序像素着色器导出
JP6955734B1 (ja) 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム
US20180144536A1 (en) Identifying duplicate indices in an input index stream
US11715197B2 (en) Image segmentation method and device
US11086889B2 (en) Content-aware tutorial recommendation
CN109509262B (zh) 基于人工智能的智能增强建模方法及装置
CN112529988A (zh) 一种头像的生成方法、装置、电子设备、介质及产品
US9715624B1 (en) Document image segmentation based on pixel classification
JP7395767B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US11741657B2 (en) Image processing method, electronic device, and storage medium
CN112801030B (zh) 一种目标文本区域的定位方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210308

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210308

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210922

R150 Certificate of patent or registration of utility model

Ref document number: 6955734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150