JP7736062B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラムInfo
- Publication number
- JP7736062B2 JP7736062B2 JP2023525231A JP2023525231A JP7736062B2 JP 7736062 B2 JP7736062 B2 JP 7736062B2 JP 2023525231 A JP2023525231 A JP 2023525231A JP 2023525231 A JP2023525231 A JP 2023525231A JP 7736062 B2 JP7736062 B2 JP 7736062B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- original image
- information processing
- class
- new image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—Two-dimensional [2D] image generation
- G06T11/60—Creating or editing images; Combining images with text
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Description
本発明の第1の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。
本例示的実施形態に係る情報処理装置1の構成について、図1を参照して説明する。図1は、情報処理装置1の構成を示すブロック図である。図1に示すように、情報処理装置1は、取得部11、決定部12、画像生成部13、及びデータ生成部14を備えている。
次に、本例示的実施形態に係る情報処理装置1が実行する情報処理方法S1について、図2を参照して説明する。図2は、情報処理方法S1の流れを示すフロー図である。図2に示すように、情報処理方法S1は次のステップを含む。
ステップS11において、少なくとも1つのプロセッサ(取得部11)は、複数のクラスのいずれかに属する元画像を取得する。
ステップS12において、少なくとも1つのプロセッサ(決定部12)は、画像生成方法を規定するパラメータを決定する。
ステップS13において、少なくとも1つのプロセッサ(画像生成部13)は、当該元画像から、決定部12が決定したパラメータを用いて新たな画像を生成する。
ステップS14において、少なくとも1つのプロセッサ(データ生成部14)は、新たな画像と、新たな画像に付与されたラベルであって、元画像が属するクラスとは異なるクラスのラベルとを含むデータを生成する。生成されたデータは、所定のデータベースに記録される。
次に、本例示的実施形態に係る情報処理システム2について、図面を参照して説明する。図3は、本例示的実施形態に係る情報処理システム2の構成を示すブロック図である。
本発明の第2の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。本例示的実施形態では、一例として、商品のクラスを識別する情報処理装置3について説明する。
図4は、例示的実施形態2に係る情報処理装置3の構成を示すブロック図である。情報処理装置3は、取得部11、決定部12、画像生成部13、データ生成部14、及び相違度判定部35を備えている。
次に、画像生成部13が、元画像から新たな画像を生成する方法について、図面を参照して説明する。図5は、情報処理装置3の画像生成部13が実行する、新たな画像を生成する方法例を示す図である。画像生成部13は、少なくとも一部の色の変換、少なくとも一部の文字の置換、スタイル変換、画像生成モデルによる内挿、画像の一部の置換又は重畳、のうちの少なくとも1つを用いて新たな画像を生成する。具体的には、画像生成部13は、決定部12が決定したパラメータを用いて新たな画像を生成する。パラメータには、新たな画像を生成する方法を特定する方法パラメータMと、その方法Mを用いて新たな画像を生成する場合に、その方法Mによる画像変換の変換値、もしくは変換程度又は変換範囲等を特定する変換パラメータTとが含まれる。
次に、相違度の導出方法と第1の閾値について説明する。相違度は、数値として導出され、その数値が予め設定された第1の閾値と比較される。相違度の導出方法は限定されないが、例えば以下のような方法を用いることができる。
以上のように、本例示的実施形態に係る情報処理装置3においては、上述の情報処理装置1又は2に係る構成に加えて、元画像と、新たな画像との相違度を導出して第1の閾値と比較する相違度判定手段を更に備えている、という構成が採用されている。このため、本例示的実施形態に係る情報処理装置3によれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、元画像とほとんど同じ新たな画像が生成される可能性を低減することができるという効果が得られる。
次に、本例示的実施形態に係る情報処理装置3が実行する情報処理方法S2について、図6を参照して説明する。図6は、情報処理方法S2の流れを示すフロー図である。図6に示すように、情報処理方法S2は次のステップを含む。
ステップS21において、取得部11は、複数の登録クラスのうち、いずれかのクラスに属する元画像を取得する。
ステップS22において、決定部12は、画像生成方法を規定するパラメータを決定(又は変更)する。
ステップS23において、画像生成部13は、元画像から、決定部12が決定(又は変更)したパラメータを用いて新たな画像を生成する。
ステップS24において、相違度判定部35は、元画像と新たな画像との相違度が第1の閾値よりも小さいか否かを判定する。ステップS24において、相違度が第1の閾値よりも小さいと判定された場合(ステップS24:Y)は、ステップS22に戻り、決定部12はパラメータを変更する。一方、ステップS24において、相違度が第1の閾値よりも小さくないと判定された場合(ステップS24:N)は、ステップS25に移行する。
ステップS25において、データ生成部14は、新たな画像と、新たな画像に付与されたラベルであって、元画像が属するクラスとは異なるクラスのラベルとを含むデータを生成する。生成されたデータは、所定のデータベースに記録される。
以上のように、本例示的実施形態に係る情報処理方法S2においては、例示的実施形態1に係る情報処理方法S1の構成に加えて、相違度判定部35が元画像と新たな画像との相違度が第1の閾値よりも小さいか否かを判定するステップS24を備えるという構成が採用されている。このため、本例示的実施形態に係る情報処理方法S2によれば、例示的実施形態1に係る情報処理方法S1の奏する効果に加えて、元画像とほとんど同じ新たな画像が生成される可能性を低減することができるという効果が得られる。
本発明の第3の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1~2にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。
図7は、例示的実施形態3に係る情報処理装置4の構成を示すブロック図である。情報処理装置4は、取得部11、決定部12、画像生成部13、データ生成部14、相違度判定部35、識別部45、及び出力部46を備えている。取得部11、決定部12、画像生成部13、データ生成部14は、実施形態2で説明した各部と同じであるので説明は省略する。
以上のように、本例示的実施形態3に係る情報処理装置4においては、上述の情報処理装置1~3の構成に加えて、画像を識別するモデル451に新たな画像を入力することにより識別結果を導出する識別部45を更に備えている、という構成が採用されている。このため、本例示的実施形態3に係る情報処理装置4によれば、例示的実施形態1に係る情報処理装置1~3の奏する効果に加えて、適切な学習をするために必要な様々な種類の画像を生成することができるという効果が得られる。
次に、情報処理装置4が実行する情報処理方法S3について図面を参照して説明する。図8は、本例示的実施形態に係る情報処理方法S3の流れを示すフローチャートである。図8に示すように、情報処理方法S3のうち、ステップS31、ステップS32、ステップS33、及びステップS34は、前述の情報処理方法S2のステップS21、ステップS22、ステップS23、及びステップS24と同じである。
ステップS35において、識別部45は、モデル451による識別結果が、新たな画像と元画像との類似度が第2の閾値よりも小さいか否かを判定する。
ステップS36において、データ生成部14は、新たな画像に対して、元画像が属するクラスとは異なるクラスのラベルを付与したデータを生成する。生成されたデータは、所定のデータベースに記録される。
ステップS44において、相違度が第1の閾値以上であると判定された場合(ステップS44:N)は、ステップS45に移行する。ステップS45において、識別部45は、モデル451による識別結果が、新たな画像は元画像の属するクラスとは異なるクラスに分類されたか否かを判定する。
ステップS46において、データ生成部14は、新たな画像に対して、元画像が属するクラスとは異なるクラスのラベルを付与したデータを生成する。生成されたデータは、所定のデータベースに記録される。
ステップS54において、相違度が第1の閾値以上であると判定された場合(ステップS54:N)は、ステップS55に移行する。ステップS55において、識別部45は、モデル451による識別結果が、新たな画像は元画像の属するクラスとは異なるクラスに分類され、当該異なるクラスへの分類に関する信頼度が第3の閾値よりも大きいか否かを判定する。
ステップS56において、データ生成部14は、新たな画像に対して、元画像が属するクラスとは異なるクラスのラベルを付与したデータを生成する。生成されたデータは、所定のデータベースに記録される。
以上のように、本例示的実施形態に係る情報処理方法S3~S5においては、例示的実施形態1に係る情報処理方法S1の構成に加えて、識別部45は、モデル451による識別結果が、新たな画像と元画像との類似度が第2の閾値よりも小さいか否かを判定するステップS35、ステップS45、ステップS55を備えるという構成が採用されている。このため、本例示的実施形態に係る情報処理方法S3~S5によれば、例示的実施形態1に係る情報処理方法S1の奏する効果に加えて、適切な学習をするために必要な様々な種類の画像を生成することができるという効果が得られる。
本発明の第4の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1~3にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。
図11は、例示的実施形態4に係る情報処理装置5の構成を示すブロック図である。情報処理装置5は、取得部11、決定部12、画像生成部13、データ生成部14、学習部55、及びデータベース56を備えている。取得部11、決定部12、画像生成部13、及びデータ生成部14は、実施形態2~3で説明した各部と同様である。
以上のように、本例示的実施形態4に係る情報処理装置5においては、上述の情報処理装置1~4の構成に加えて、データ生成部14が生成したデータを参照して対象モデル551を学習させる学習部55を更に備えている、という構成が採用されている。このため、本例示的実施形態4に係る情報処理装置5によれば、例示的実施形態1~3に係る情報処理装置1~4の奏する効果に加えて、生成した新たな画像を用いて対象モデルを学習させることができるという効果が得られる。
本発明の第5の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1~4にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。
図13は、例示的実施形態5に係る情報処理装置6の構成を示すブロック図である。情報処理装置6は、識別対象画像取得部61、決定部12、画像生成部13、データ生成部14、学習部55、第2識別部66、データベース67、及び入出力部68を備えている。決定部12、画像生成部13、データ生成部14、学習部55、データベース67は、実施形態4で説明した各部と同様である。
以上のように、本例示的実施形態5に係る情報処理装置6においては、上述の情報処理装置1~5の構成に加えて、識別対象画像取得部61が取得した識別対象画像を、学習部55によって学習された対象モデル551(学習済モデル661)に入力することによって、識別対象画像に関する識別処理を行う第2識別部66を更に備えている、という構成が採用されている。このため、本例示的実施形態5に係る情報処理装置6によれば、例示的実施形態1~4に係る情報処理装置1~5の奏する効果に加えて、学習された対象モデルを用いて画像を識別することができるという効果が得られる。
本発明の第6の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1~5にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。
図14は、例示的実施形態6に係る情報処理装置7の構成を示すブロック図である。情報処理装置7は、取得部71、学習部72、データベース73を備えている。取得部71は、複数の画像と、当該複数の画像の各々に付与されたクラスラベルと、当該複数の画像の少なくとも一部の画像に付与された識別情報であって、当該少なくとも一部の画像に関する画像生成処理を識別するための識別情報とを含む学習用データを取得する。取得部71は、一例として、学習用データをデータベース73から取得する。学習部72は、学習させるモデルである対象モデル721を備えている。学習部72は、取得部71が取得した学習用データを参照して対象モデル721を学習させる。つまり、学習部72は、学習用データを対象モデル721に入力し、出力された識別結果のロス値が小さくなるように対象モデル721を学習させる。データベース73は、学習用データを記録している。
以上のように、本例示的実施形態に係る情報処理装置7においては、複数の画像と、当該複数の画像の各々に付与されたクラスラベルと、当該複数の画像の少なくとも一部の画像に付与された識別情報であって、当該少なくとも一部の画像に関する画像生成処理を識別するための識別情報とを含む学習用データを取得する取得部71と、取得部71が取得した学習用データを参照して対象モデル721を学習させる学習部72とを備え、対象モデル721は、識別情報に依らずに適用される共通レイヤ7211と、識別情報に応じて選択的に適用される分岐レイヤ7212,7213と、を備えているという構成が採用されている。このため、本例示的実施形態に係る情報処理装置7によれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、画像の特性に応じて画像処理経路を変更することにより、識別精度を向上させることができるという効果が得られる。
本発明の第7の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1~6にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。
図16は、例示的実施形態7に係る情報処理装置8の構成を示すブロック図である。情報処理装置8は、識別対象画像取得部81、識別部82、出力部83を備えている。識別対象画像取得部81は、識別対象画像を取得する。識別対象画像取得部81は、識別対象画像を図示しないメモリ、又は図示しない外部のデータベースから取得してもよい。識別部82は、学習済モデル821を備えており、学習済モデル821に、識別対象画像取得部81が取得した識別対象画像を入力することによって、識別対象画像に関する識別処理を行い、識別処理の結果を出力する。出力部83は、学習済モデル821が出力した識別処理の結果を外部に出力するインタフェースである。
次に、情報処理装置8が実行する画像のクラスの情報処理方法(推論方法)S6の流れについて、図面を参照して説明する。図17は、情報処理方法S6の流れを示すフローチャートである。図17に示すように、情報処理方法S6は次のステップを含む。
ステップS61において、識別対象画像取得部81は、識別対象画像を取得する。
ステップS62において、識別部82は、学習済モデル821に、識別対象画像取得部81が取得した識別対象画像を入力することによって、識別対象画像に関する識別処理を行う。学習済モデル821は前述の通りである。
ステップS63において、識別部82(又は出力部83)は、識別部82が識別処理した結果を出力する。さらに、出力部83が識別結果を外部に出力してもよい。
本例示的実施形態7に係る情報処理装置8は、識別対象画像を取得する識別対象画像取得部81と、学習済モデル821に、識別対象画像取得部81が取得した識別対象画像を入力することによって、識別対象画像に関する識別処理を行う識別部82を備えている。また、推論方法S6は、識別対象画像を取得すること、学習済モデル821に、識別対象画像取得部81が取得した識別対象画像を入力することによって、識別対象画像に関する識別処理を行うこと、を含んでいる。
情報処理装置1,3~8及び情報処理システム2(以上をまとめて「情報処理装置1等という。」)の一部又は全部の機能は、集積回路(ICチップ)等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。
また、プログラムPは、コンピュータCが読み取り可能な、一時的でない有形の記録媒体Mに記録することができる。このような記録媒体Mとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータCは、このような記録媒体Mを介してプログラムPを取得することができる。また、プログラムPは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータCは、このような伝送媒体を介してプログラムPを取得することもできる。
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。
複数のクラスのいずれかに属する元画像を取得する取得手段と、画像生成方法を規定するパラメータを決定する決定手段と、当該元画像から、前記決定手段が決定したパラメータを用いて新たな画像を生成する画像生成手段と、前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成するデータ生成手段とを備えている、ことを特徴とする情報処理装置。
上記の構成によれば、画像の認識において、未登録の物体の画像が登録済の物体の画像に誤認識されることを抑制することができる。
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較する相違度判定手段を更に備えている、ことを特徴とする付記1に記載の情報処理装置。
上記の構成によれば、元画像とほとんど同じ新たな画像が生成される可能性を低減することができる。
前記相違度判定手段が導出した相違度が前記第1の閾値よりも小さい場合に、前記決定手段は、前記パラメータを変更する、ことを特徴とする付記2に記載の情報処理装置。
上記の構成によれば、相違度が小さい新たな画像が生成される可能性を低減することができる。
前記決定手段は、前記相違度が前記第1の閾値よりも小さい場合に、前記相違度が大きくなるように、前記パラメータを変更する、ことを特徴とする付記3に記載の情報処理装置。
上記の構成によれば、相違度が小さい新たな画像が生成される可能性を低減することができる。
前記決定手段は、前記相違度が前記第1の閾値よりも小さい場合に、前記パラメータをランダムに変更する、ことを特徴とする付記3に記載の情報処理装置。
上記の構成によれば、相違度が小さい新たな画像が生成される可能性を低減することができる。
画像を識別するモデルに前記新たな画像を入力することにより識別結果を導出する識別手段を更に備えている、ことを特徴とする付記1から5のいずれか1つに記載の情報処理装置。
上記の構成によれば、適切な学習をするために必要な様々な種類の画像を生成することができる。
前記識別結果が、前記新たな画像と前記元画像との類似度が第2の閾値よりも小さいとの結果である場合に、前記決定手段は、前記新たな画像と前記元画像との類似度が大きくなるように前記パラメータを変更する、ことを特徴とする付記6に記載の情報処理装置。
上記の構成によれば、適切な学習をするために必要な様々な種類の画像を生成することができる。
前記識別結果には、前記新たな画像が分類されたクラスが含まれており、
前記識別結果が、前記新たな画像は前記元画像の属するクラスとは異なるクラスに分類されたとの結果である場合に、前記決定手段は、前記新たな画像と前記元画像との類似度が大きくなるように前記パラメータを変更する、ことを特徴とする付記6に記載の情報処理装置。
上記の構成によれば、適切な学習をするために必要な様々な種類の画像を生成することができる。
前記識別結果には、前記新たな画像が分類されたクラスと、当該クラスへの分類に関する信頼度が含まれており、前記識別結果が、前記新たな画像は前記元画像の属するクラスとは異なるクラスに分類され、当該異なるクラスへの分類に関する前記信頼度が第3の閾値よりも大きいとの結果である場合に、前記決定手段は、前記新たな画像と前記元画像との類似度が大きくなるように前記パラメータを変更する、ことを特徴とする付記8に記載の情報処理装置。
上記の構成によれば、適切な学習をするために必要な様々な種類の学習用画像を生成することができる。
前記画像生成手段は、少なくとも一部の色の変換、少なくとも一部の文字の置換、スタイル変換、画像生成モデルによる内挿、画像の一部の置換又は重畳、のうちの少なくとも1つを用いて前記新たな画像を生成する、ことを特徴とする付記1から9のいずれか1つに記載の情報処理装置。
上記の構成によれば、元画像から様々な方法により新たな画像を生成することができる。
前記データ生成手段が生成したデータを参照して対象モデルを学習させる学習手段を備えている、ことを特徴とする付記1から10のいずれか1つに記載の情報処理装置。
上記の構成によれば、生成した新たな画像を用いて対象モデルを学習させることができる。
識別対象画像を取得する識別対象画像取得手段と、前記識別対象画像取得手段が取得した識別対象画像を、前記学習手段によって学習された前記対象モデルに入力することによって、前記識別対象画像に関する識別処理を行う第2識別手段とを備えている、ことを特徴とする付記11に記載の情報処理装置。
上記の構成によれば、学習された対象モデルを用いて識別対象画像を識別することができる。
複数の画像と、当該複数の画像の各々に付与されたクラスラベルと、当該複数の画像の少なくとも一部の画像に付与された識別情報であって、当該少なくとも一部の画像に関する画像生成処理を識別するための識別情報とを含む学習用データを取得する取得手段と、前記取得手段が取得した学習用データを参照して対象モデルを学習させる学習手段とを備え、前記対象モデルは、前記識別情報に依らずに適用される共通レイヤと、前記識別情報に応じて選択的に適用される分岐レイヤとを備えている、ことを特徴とする情報処理装置。
上記の構成によれば、画像の特性に応じて画像処理経路を変更することにより、識別精度を向上させることができる。
識別対象画像を取得する識別対象画像取得手段と、第1のクラスのラベルが付与された画像と、当該第1のクラスのラベルが付与された画像から生成された画像であって、当該第1のクラスとは異なる1又は複数の第2のクラスの何れかのラベルが付与された画像とを含む学習用データを用いて学習されたモデルに、前記識別対象画像取得手段が取得した識別対象画像を入力することによって、前記識別対象画像に関する識別処理を行う識別手段と、を備えていることを特徴とする情報処理装置。
上記の構成によれば、情報処理装置は、新たな画像を用いて学習させた学習済モデルを用いて識別対象画像を識別することができる。
前記識別手段は、前記識別処理の結果として、前記識別対象画像が、前記第1のクラス、及び前記1又は複数の第2のクラスの何れに属するのかに関する情報を出力する、ことを特徴とする、付記14に記載の情報処理装置。
この構成により、可能性のある複数のクラスをその信頼度を出力させることができる。
前記識別手段は、前記モデルの出力が、前記識別対象画像が前記1又は複数の第2のクラスの何れかに属することを示している場合に、前記識別処理の結果として、前記識別対象画像が前記第1のクラスに属することを示す情報を出力する、ことを特徴とする付記14に記載の情報処理装置。
上記の構成によれば、シンプルな出力結果を出力することができる。
少なくとも1つのプロセッサが、複数のクラスのいずれかに属する元画像を取得すること、画像生成方法を規定するパラメータを決定すること、当該元画像から、決定された前記パラメータを用いて新たな画像を生成すること、前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成すること、を含む情報処理方法。
上記の構成によれば、物品の画像を識別する識別器を学習させることができる学習データを生成することができ、従って、画像の認識において、未登録の物体の画像が登録済の物体の画像に誤認識されることを抑制することができる。
少なくとも1つのプロセッサが、複数のクラスのいずれかに属する元画像を取得すること、画像生成方法を規定するパラメータを決定すること、当該元画像から、決定された前記パラメータを用いて新たな画像を生成すること、前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成すること、を含むデータ製造方法。
上記の構成によれば、物品の画像を識別する識別器を学習させることができる学習データを製造することができ、従って、画像の認識において、未登録の物体の画像が登録済の物体の画像に誤認識されることを抑制することができる。
コンピュータを付記1~16の何れか一に記載の情報処理装置として動作させるためのプログラムであって、前記コンピュータを前記各手段として機能させる、ことを特徴とするプログラム。
付記19に記載のプログラムを記録した、コンピュータ読み取り可能な非一時的記録媒体。
識別対象画像を取得すること、第1のクラスのラベルが付与された画像と、当該第1のクラスのラベルが付与された画像から生成された画像であって、当該第1のクラスとは異なる1又は複数の第2のクラスの何れかのラベルが付与された画像とを含む学習用データを用いて学習されたモデルに、取得された前記識別対象画像を入力することによって、前記識別対象画像に関する識別処理を行うこと、を含むことを特徴とする情報処理方法。
上記の構成によれば、新たな画像を用いて学習させた学習済モデルを用いて識別対象画像を識別することができる。
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。
少なくとも1つのプロセッサを備え、前記プロセッサは、複数のクラスのいずれかに属する元画像を取得する取得処理と、画像生成方法を規定するパラメータを決定する決定処理と、当該元画像から、前記決定手段が決定したパラメータを用いて新たな画像を生成する画像生成処理と、前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成するデータ生成処理と、を実行する情報処理装置。
2・・・情報処理システム
11,71・・・取得部
12・・・決定部
13・・・画像生成部
14・・・データ生成部
25,56,67,73・・・データベース
35・・・相違度判定部
45,82・・・識別部
46,83・・・出力部
55,72・・・学習部
61,81・・・識別対象画像取得部
66・・・第2識別部
68・・・入出力部
Claims (9)
- 複数のクラスのいずれかに属する元画像を取得する取得手段と、
画像生成方法を規定するパラメータを決定する決定手段と、
当該元画像から、前記決定手段が決定したパラメータを用いて新たな画像を生成する画像生成手段と、
前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成するデータ生成手段と、
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較する相違度判定手段と、を備え、
前記決定手段は、前記相違度が前記第1の閾値よりも小さい場合に、前記相違度が大きくなるように、前記パラメータを変更する
情報処理装置。 - 複数のクラスのいずれかに属する元画像を取得する取得手段と、
画像生成方法を規定するパラメータを決定する決定手段と、
当該元画像から、前記決定手段が決定したパラメータを用いて新たな画像を生成する画像生成手段と、
前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成するデータ生成手段と、
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較する相違度判定手段と、を備え、
前記決定手段は、前記相違度が前記第1の閾値よりも小さい場合に、前記パラメータをランダムに変更する
情報処理装置。 - 画像を識別するモデルに前記新たな画像を入力することにより識別結果を導出する第1識別手段を更に備えている
請求項1又は2に記載の情報処理装置。 - 前記識別結果が、前記新たな画像と前記元画像との類似度が第2の閾値よりも小さいとの結果である場合に、前記決定手段は、前記新たな画像と前記元画像との類似度が大きくなるように前記パラメータを変更する
請求項3に記載の情報処理装置。 - 前記識別結果には、前記新たな画像が分類されたクラスが含まれており、
前記識別結果が、前記新たな画像は前記元画像の属するクラスとは異なるクラスに分類されたとの結果である場合に、前記決定手段は、前記新たな画像と前記元画像との類似度が大きくなるように前記パラメータを変更する
請求項3に記載の情報処理装置。 - 少なくとも1つのプロセッサが、
複数のクラスのいずれかに属する元画像を取得すること、
画像生成方法を規定するパラメータを決定すること、
当該元画像から、決定された前記パラメータを用いて新たな画像を生成すること、
前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成すること、
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較すること、を含み、
前記比較することにおいて、導出した前記相違度が前記第1の閾値よりも小さい場合に、前記決定することにおいて、前記相違度が大きくなるように、前記パラメータを変更すること
を含む情報処理方法。 - 少なくとも1つのプロセッサが、
複数のクラスのいずれかに属する元画像を取得すること、
画像生成方法を規定するパラメータを決定すること、
当該元画像から、決定された前記パラメータを用いて新たな画像を生成すること、
前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成すること、
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較すること、を含み、
前記比較することにおいて、導出した前記相違度が前記第1の閾値よりも小さい場合に、前記決定することにおいて前記パラメータをランダムに変更すること
を含む情報処理方法。 - コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
複数のクラスのいずれかに属する元画像を取得する取得手段、
画像生成方法を規定するパラメータを決定する決定手段、
当該元画像から、前記決定手段が決定したパラメータを用いて新たな画像を生成する画像生成手段、
前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成するデータ生成手段、及び
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較する相違度判定手段、として機能させ、
前記相違度判定手段が導出した相違度が前記第1の閾値よりも小さい場合に、前記決定手段は、前記相違度が大きくなるように、前記パラメータを変更する
プログラム。 - コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
複数のクラスのいずれかに属する元画像を取得する取得手段、
画像生成方法を規定するパラメータを決定する決定手段、
当該元画像から、前記決定手段が決定したパラメータを用いて新たな画像を生成する画像生成手段、
前記新たな画像と、前記新たな画像に付与されたラベルであって、前記元画像が属する前記クラスとは異なるクラスのラベルとを含むデータを生成するデータ生成手段、及び
前記元画像と、前記新たな画像との相違度を導出して第1の閾値と比較する相違度判定手段、として機能させ、
前記相違度判定手段が導出した相違度が前記第1の閾値よりも小さい場合に、前記決定手段は、前記パラメータをランダムに変更する
プログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/020960 WO2022254600A1 (ja) | 2021-06-02 | 2021-06-02 | 情報処理装置、情報処理方法、データ製造方法、及びプログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2022254600A1 JPWO2022254600A1 (ja) | 2022-12-08 |
| JPWO2022254600A5 JPWO2022254600A5 (ja) | 2024-03-04 |
| JP7736062B2 true JP7736062B2 (ja) | 2025-09-09 |
Family
ID=84322891
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023525231A Active JP7736062B2 (ja) | 2021-06-02 | 2021-06-02 | 情報処理装置、情報処理方法及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20240257424A1 (ja) |
| JP (1) | JP7736062B2 (ja) |
| WO (1) | WO2022254600A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023168366A2 (en) * | 2022-03-03 | 2023-09-07 | Siemens Healthcare Diagnostics Inc. | Diagnostic laboratory systems and methods of imaging tube assemblies |
| JP2025017111A (ja) * | 2023-07-24 | 2025-02-05 | 株式会社東芝 | 機械学習装置、方法及びプログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015095212A (ja) | 2013-11-14 | 2015-05-18 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
| WO2019077854A1 (ja) | 2017-10-17 | 2019-04-25 | 株式会社日立製作所 | オンライン認識装置、オンライン認識方法、及びそれに用いる設定画面 |
| JP2020046883A (ja) | 2018-09-18 | 2020-03-26 | 株式会社東芝 | 分類装置、分類方法およびプログラム |
-
2021
- 2021-06-02 JP JP2023525231A patent/JP7736062B2/ja active Active
- 2021-06-02 WO PCT/JP2021/020960 patent/WO2022254600A1/ja not_active Ceased
- 2021-06-02 US US18/564,802 patent/US20240257424A1/en active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015095212A (ja) | 2013-11-14 | 2015-05-18 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
| WO2019077854A1 (ja) | 2017-10-17 | 2019-04-25 | 株式会社日立製作所 | オンライン認識装置、オンライン認識方法、及びそれに用いる設定画面 |
| JP2020046883A (ja) | 2018-09-18 | 2020-03-26 | 株式会社東芝 | 分類装置、分類方法およびプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2022254600A1 (ja) | 2022-12-08 |
| WO2022254600A1 (ja) | 2022-12-08 |
| US20240257424A1 (en) | 2024-08-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20230137931A1 (en) | Method for augmenting data for document classification and apparatus thereof | |
| Sun et al. | A robust approach for text detection from natural scene images | |
| Chagas et al. | Evaluation of convolutional neural network architectures for chart image classification | |
| US20150278710A1 (en) | Machine learning apparatus, machine learning method, and non-transitory computer-readable recording medium | |
| CN112272838B (zh) | 商品确定装置、记录介质和学习方法 | |
| CN107480682B (zh) | 一种商品包装生产日期检测方法 | |
| JP7736062B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| TWI792560B (zh) | 資訊處理裝置及資訊處理方法 | |
| WO2021034841A1 (en) | Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks | |
| US20220092448A1 (en) | Method and system for providing annotation information for target data through hint-based machine learning model | |
| Li et al. | Multiple kernel-based multi-instance learning algorithm for image classification | |
| JPWO2022254600A5 (ja) | ||
| CN109800768A (zh) | 半监督gan的散列特征表示学习方法 | |
| CN116935140A (zh) | 基于油墨的奢侈品鉴定模型训练方法、鉴定方法及装置 | |
| US8131077B2 (en) | Systems and methods for segmenting an image based on perceptual information | |
| CN118334672A (zh) | 电子价签识别方法及装置 | |
| CN114155598B (zh) | 一种图像处理模型的训练方法、装置及电子设备 | |
| Guo et al. | MalFSLDF: A Few‐Shot Learning‐Based Malware Family Detection Framework | |
| Bonilla-Rivas et al. | Adapting YOLO to recognition of real numbers in 7-segment digits | |
| Fitriyah et al. | Traffic sign recognition using edge detection and eigen-face: Comparison between with and without color pre-classification based on Hue | |
| CN106157284B (zh) | 图像中文字区域的定位方法及装置 | |
| KR102868560B1 (ko) | 표 인식 방법 및 장치 | |
| CN111694567A (zh) | 一种数据处理方法及装置、存储介质 | |
| CN113343832B (zh) | 视频封面判别方法、装置、设备及计算机可读介质 | |
| JP7835119B2 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231201 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231201 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250212 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250404 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20250425 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20250425 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250729 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250811 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7736062 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |