JP7626243B2 - データセット作成装置、データセット作成方法、及び、プログラム - Google Patents

データセット作成装置、データセット作成方法、及び、プログラム Download PDF

Info

Publication number
JP7626243B2
JP7626243B2 JP2023553850A JP2023553850A JP7626243B2 JP 7626243 B2 JP7626243 B2 JP 7626243B2 JP 2023553850 A JP2023553850 A JP 2023553850A JP 2023553850 A JP2023553850 A JP 2023553850A JP 7626243 B2 JP7626243 B2 JP 7626243B2
Authority
JP
Japan
Prior art keywords
images
image
dataset
sample images
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023553850A
Other languages
English (en)
Other versions
JPWO2023062784A5 (ja
JPWO2023062784A1 (ja
Inventor
智一 金子
真 寺尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2023062784A1 publication Critical patent/JPWO2023062784A1/ja
Publication of JPWO2023062784A5 publication Critical patent/JPWO2023062784A5/ja
Application granted granted Critical
Publication of JP7626243B2 publication Critical patent/JP7626243B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Description

本開示は、学習用データセットの作成に関する。
店舗などにおいて、商品を撮影して画像認識を行うことにより商品を識別する手法が知られている。商品の画像認識を行うためには、対象となる商品について認識モデルを学習する必要がある。また、新商品が発売されたような場合、その新商品を認識できるように既存の認識モデルを学習する必要がある。認識モデルの学習を行うには、対象となる商品について学習用のデータセットを用意する必要がある。
特許文献1は、機械学習に用いるデータセットを作成する際の品質向上のために、ラベリング担当者の評価を行う手法を記載している。
国際公開2019/187421号公報
学習用のデータセットの作成時には、対象となる商品などの物体の外観を様々な方向から撮影し、得られた撮影画像から学習用のサンプル画像が生成される。しかし、学習に有効なデータを効率良く作成できるような画像を撮影するには、経験が必要となる。具体的に、経験の浅い者には、認識モデルの学習に必要なデータ数が分からない、学習に有用な見えのバリエーションが収集できないなどの課題があった。
本開示の1つの目的は、特に経験の無い者であっても、学習データの生成に適した画像を撮影し、品質の高い学習用データセットを作成することが可能なデータセット作成装置を提供することにある。
本開示の一つの観点では、データセット作成装置は、
物体の撮影画像を取得する取得手段と、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成するデータ処理手段と、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定するデータ品質推定手段と、
前記データセットの品質情報と、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む撮影支援情報を表示装置に表示する表示制御手段と、
を備える。
また、本開示の一つの観点では、データセット作成装置は、
物体の撮影画像を取得する取得手段と、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成するデータ処理手段と、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定するデータ品質推定手段と、
前記データセットの品質情報と、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度と、を含む撮影支援情報を表示装置に表示する表示制御手段と、
を備える。
本開示の他の観点では、データセット作成方法は、
コンピュータにより実行されるデータセット作成方法であって、
物体の撮影画像を取得し、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
前記データセットの品質情報と、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む撮影支援情報を表示装置に表示する。
また、本開示の他の観点では、データセット作成方法は、
コンピュータにより実行されるデータセット作成方法であって、
物体の撮影画像を取得し、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
前記データセットの品質情報と、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度と、を含む撮影支援情報を表示装置に表示する。
本開示のさらに他の観点では、プログラムは、
物体の撮影画像を取得し、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
前記データセットの品質情報と、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む撮影支援情報を表示装置に表示する処理をコンピュータに実行させる。
また、本開示のさらに他の観点では、プログラムは、
物体の撮影画像を取得し、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
前記データセットの品質情報と、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度と、を含む撮影支援情報を表示装置に表示する処理をコンピュータに実行させる。
本開示によれば、特に経験の無い者であっても、学習データの生成に適した画像を撮影し、品質の高い学習用データセットを作成することが可能となる。
第1実施形態に係るデータセット作成システムの概略構成を示す。 第1実施形態のデータセット作成装置のハードウェア構成を示すブロック図である。 第1実施形態のデータセット作成装置の機能構成を示すブロック図である。 第1実施例に係るデータ品質推定部の構成を示すブロック図である。 第1実施例による撮影支援画面の例を示す。 撮影支援情報の表示処理のフローチャートである。 第2実施例に係るデータ品質推定部の構成を示すブロック図である。 第2実施例による撮影支援画面の例を示す。 第2実施形態のデータセット作成装置の機能構成を示すブロック図である。 第2実施形態のデータセット作成装置による処理のフローチャートである。
以下、図面を参照して、本開示の好適な実施形態について説明する。
<第1実施形態>
[全体構成]
図1は、第1実施形態に係るデータセット作成システムの概略構成を示す。データセット作成システム1は、撮影画像から商品を認識する認識モデルの学習を行う際に使用される学習用のデータセットを作成するシステムである。
図示のように、データセット作成システム1は、データセット作成装置100と、カメラ2と、表示装置5とを備える。カメラ2と表示装置5は、それぞれデータセット作成装置100に接続されている。カメラ2は、例えば棚などの所定位置に固定配置されている。作業者は、データセットの作成の対象となる物体(商品)をカメラ2の撮影範囲に持っていき、カメラ2により物体を撮影する。この際、作業者は、物体を回転させたり、持ち替えたりして、物体の様々な方向からの外観を撮影する。カメラ2は、撮影した物体の撮影画像(動画)をデータセット作成装置100へ出力する。
データセット作成装置100は、カメラ2から入力された撮影画像に基づいて、対象となる物体の学習用のデータセットを作成する。作成されたデータセットは、物体を認識する認識モデルの学習に使用される。作成したデータセットを用いて認識モデルを学習することにより、認識モデルがその物体を認識することが可能となる。
データセット作成装置100は、作業者がカメラ2により物体を撮影しているときに、撮影支援情報を生成し、表示装置5に表示する。撮影支援情報は、現在どのように物体の撮影やデータセットの作成が行われているかを作業者に伝え、必要であれば物体の撮影方法についての指示やアドバイスなどを行う情報である。データセット作成装置100は、カメラ2により撮影された撮影画像と、その撮影画像に基づいて作成したデータの数や品質などの分析結果とに基づいて撮影支援情報を生成し、表示装置5へ出力する。なお、撮影支援情報の詳細については後述する。
このように、作業者による物体の撮影中に撮影支援情報を表示して現在の撮影状態やデータ作成状態を作業者にフィードバックすることにより、十分な経験の無い作業者であっても、認識モデルの学習に適した画像を撮影し、品質の高いデータセットを効率的に作成することが可能となる。
[ハードウェア構成]
図2は、第1実施形態のデータセット作成装置100のハードウェア構成を示すブロック図である。図示のように、データセット作成装置100は、インタフェース(I/F)11と、プロセッサ12と、メモリ13と、記録媒体14と、データベース(DB)15と、を備える。
インタフェース11は、外部装置との間でデータの入出力を行う。具体的に、インタフェース11は、作業者による撮影中にカメラ2から撮影画像を取得し、撮影支援情報を表示装置5へ出力する。また、インタフェース11は、作成された学習用のデータセットを、認識モデルの学習を行う学習装置へ出力する。
プロセッサ12は、CPU(Central Processing Unit)などのコンピュータであり、予め用意されたプログラムを実行することによりデータセット作成装置100の全体を制御する。なお、プロセッサ12は、GPU(Graphics Processing Unit)またはFPGA(Field-Programmable Gate Array)であってもよい。プロセッサ12は、後述する撮影支援情報の表示処理を実行する。
メモリ13は、ROM(Read Only Memory)、RAM(Random Access Memory)などにより構成される。メモリ13は、プロセッサ12による各種の処理の実行中に作業メモリとしても使用される。
記録媒体14は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、データセット作成装置100に対して着脱可能に構成される。記録媒体14は、プロセッサ12が実行する各種のプログラムを記録している。データセット作成装置100が各種の処理を実行する際には、記録媒体14に記録されているプログラムがメモリ13にロードされ、プロセッサ12により実行される。DB15は、カメラ2から入力された撮影画像や、作成されたデータセットを記憶する。
[機能構成]
図3は、第1実施形態のデータセット作成装置100の機能構成を示すブロック図である。データセット作成装置100は、撮影画像入力部21と、データ処理部22と、記憶部23と、データ品質推定部24と、表示制御部25と、を備える。なお、撮影画像入力部21はインタフェース11により構成され、データ処理部22、データ品質推定部24及び表示制御部25は主としてプロセッサ12により構成され、記憶部23はDB15により構成される。
撮影画像入力部21は、作業者が撮影した物体の撮影画像をカメラ2から取得し、データ処理部22へ出力する。撮影画像は、物体を連続的に撮影した動画像である。
データ処理部22は、入力された撮影画像を用いて、認識モデルの学習のための学習データを生成する。具体的には、データ処理部22は、物体検知モデルなどを用いて撮影画像から物体を検出し、その物体の部分の画像を切り出して物体の画像(以下、「サンプル画像」と呼ぶ。)を生成する。物体検知モデルは、撮影画像から物体を検出し、物体を含む矩形の位置情報、及び、物体としての確からしさを示すスコアを出力する。データ処理部22は、物体検知モデルにより検出された矩形の領域を撮影画像から抽出してサンプル画像とする。そして、データ処理部22は、生成したサンプル画像を、撮影画像とともに記憶部23へ出力する。
記憶部23は、カメラ2により生成された撮影画像と、その撮影画像から抽出された複数のサンプル画像とをデータ処理部22から受け取り、記憶する。
データ品質推定部24は、データ処理部22が生成したサンプル画像の品質を推定し、予め決められた基準を満たすサンプル画像を有効サンプル画像として選択し、学習データとして記憶部23に記憶する。こうして、基準を満たすと判定された複数の有効サンプル画像を収集し、学習用データセットが作成される。なお、データ処理部22が生成したサンプル画像のうち、上記の基準を満たさないものは、学習データとしては採用されず、破棄される。
また、データ品質推定部24は、撮影画像と、サンプル画像の品質の推定結果とに基づいて撮影支援情報を生成し、表示制御部25へ出力する。撮影支援情報は、カメラ2が撮影した撮影画像、有効サンプル画像などを含むが、その詳細は後述する。表示制御部25は、データ品質推定部24から入力された撮影支援情報を用いて撮影支援画面を作成し、表示装置5に表示する。
[第1実施例]
(データ品質推定部の構成)
次に、データセット作成装置100の第1実施例について説明する。第1実施例では、データ品質推定部24は、サンプル画像の品質として、サンプル画像の学習における重要度を推定する。図4は、第1実施例に係るデータ品質推定部24aの構成を示すブロック図である。図示のように、データ品質推定部24aは、重要度推定部26を備える。
重要度推定部26には、記憶部23からサンプル画像が入力される。重要度推定部26は、入力されたサンプル画像の重要度を、重要度推定モデルを用いて推定する。1つの例では、重要度推定モデルとして、物体検知モデルを用いることができる。物体検知モデルは、入力されたサンプル画像に基づいて、検出された物体の物体らしさのスコアを出力するので、重要度推定部26はこのスコアを重要度として使用する。物体らしさのスコアが高いほど、そのサンプル画像に物体が含まれている確率が高く、学習データとしての適性が高いと考えられる。よって、データ品質推定部24aは、物体らしさのスコアが所定値より高いサンプル画像を有効サンプル画像として選択する。
他の例では、重要度推定モデルとして、画像としての画質を推定するモデルを用いることができる。画質を推定するモデルとしては、例えば、画像の手ブレ、ボケ、明るさ、対象物の隠れ度合い(対象物が他の物体の陰に隠れている割合)などを推定するモデルを用いることができる。具体的には、重要度推定部26は、上記のモデルによる推定結果に基づき、手ブレが少ないほど、ボケが少ないほど、適正な明るさであるほど、対象物の隠れ度合いが小さいほど、重要度を高くする。
サンプル画像の画質が良くない場合、具体的に手ブレが多い、画像がぼけている、画像が暗い、対象物の大部分が隠れてしまっているなどの場合、そのサンプル画像は学習データとしての適性が低いと考えられる。よって、データ品質推定部24aは、上記のような画質を推定するモデルによって画質が基準レベル以上であると判定されたサンプル画像を有効サンプル画像として選択する。
なお、上記の物体らしさのスコアと画質の両方を組み合わせて重要度として用いてもよい。例えば、物体らしさのスコアと、手ブレや明るさなどの程度を示す値とを所定の重みを用いて加算して重要度を算出することとしてもよい。
データ品質推定部24aは、上記のようにして選択した有効サンプル画像を、記憶部23に記憶する。こうして蓄積された有効サンプル画像の集合が学習用のデータセットとなる。
また、データ品質推定部24aは、記憶部23から入力された撮影画像、重要度推定部26が選択した有効サンプル画像、及び、有効サンプル画像の数に基づいて算出した到達度や有効画像率などの情報を、撮影支援情報として表示制御部25へ出力する。表示制御部25は、入力された撮影支援情報を用いて撮影支援画面を生成し、表示装置5に表示する。
(撮影支援画面)
図5は、第1実施例による撮影支援画面の例を示す。図示のように、撮影支援画面は、大別して、撮影画像表示エリア30と、有効画像表示エリア40とを備える。図5の例では、撮影画像表示エリア30は、撮影画像31と、矩形32と、重要度33と、到達度34とが表示されている。
撮影画像31は、カメラ2で撮影された撮影画像(動画像)をリアルタイムで表示したものである。矩形32は、撮影画像31から物体検知モデルが検出した物体の位置を示す。前述のように、物体を囲む矩形32の部分が、撮影画像31からサンプル画像として切り出される。重要度33は、検出された物体の重要度であり、具体的には前述の重要度推定部26により算出された重要度の値である。よって、第1実施例では、重要度の値は、前述のように物体らしさのスコア又はサンプル画像の画質の推定値となる。
到達度34は、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合である。なお、学習に必要な総画像数は、経験などに基づいて予め決定される。図5の例では、学習に必要な総画像数「300(フレーム)」に対して、現在「120(フレーム)」の有効なサンプル画像が取得済みであることが示されている。これにより、作業者は学習に必要なサンプル画像がどの程度取得できたのか、あとどのくらい必要か、などを知ることができる。なお、必要な総画像数の有効なサンプル画像が取得できたときに、その旨を表示や音声で作業者に通知してもよい。
一方、有効画像表示エリア40には、サムネイル表示エリア41と、有効画像率42とが表示されている。サムネイル表示エリア41には、撮影画像31から切り出された複数の有効なサンプル画像のサムネイルが並べて表示されている。即ち、各サムネイル画像43は、撮影画像表示エリア30の矩形32に示すように、撮影画像31から切り出されたサンプル画像のうち、前述のデータ品質推定部24aにより所定の基準を満たすと判定されたサンプル画像である。なお、図5のように有効なサンプル画像のみを表示する代わりに、撮影画像31から切り出された全てのサンプル画像をサムネイル表示エリア41に表示した上で、有効なサンプル画像を、例えば枠の色を変えるなどして強調して表示することとしてもよい。
有効画像率42は、撮影画像31から切り出されたサンプル画像の総数に対する、有効なサンプル画像の割合である。図5の例では、有効画像率が90%となっているので、現在までに撮影画像31から切り出されたサンプル画像のうちの90%が有効なサンプル画像として採用されていることを示している。また、ブレ5%、照明条件3%、物体の隠れ2%のように、有効でない画像の主な判定要因を表示してもよい。なお、有効画像率が所定の基準より低い場合、表示や音声などによりその旨を作業者に通知してもよい。これにより、物体がカメラ2の撮影範囲に入っていないなどの不具合に作業者が気づくことができる。さらには、有効画像率が所定の基準より低い場合、作業者に指示やアドバイスを行うこととしてもよい。例えば、サンプル画像の手ブレが多く、有効画像率が下がっている場合、「もう少しゆっくり動かして下さい。」などのメッセージを表示したり、音声出力したりしてもよい。
なお、図5の例では、到達度34及び有効画像率42を数値で表示しているが、その代わりに、グラフやメーターなどで表示してもよい。
また、全ての物体についての撮影が終了した時点で、全ての物体について十分な有効サンプル画像が取得できているか否かを作業者に通知してもよい。例えば、撮影の中断などによって有効サンプル画像が不足している物体について、「商品X:30枚不足」などの表示を行い、必要なサンプル画像数に達していないことを作業者に通知してもよい。これにより、作業者は不足しているサンプル画像の追加撮影を行うことができる。
(表示処理)
次に、撮影支援情報の表示処理について説明する。図6は、撮影支援情報の表示処理のフローチャートである。この処理は、図2に示すプロセッサ12が、予め用意されたプログラムを実行し、図3及び図4に示す各要素として動作することにより実現される。
まず、撮影画像入力部21は、カメラ2から撮影画像を取得する(ステップS11)。次に、データ処理部22は、撮影画像から物体の部分を切り出してサンプル画像を生成する(ステップS12)。次に、データ品質推定部24aは、各サンプル画像の重要度を推定し、所定基準を満たすサンプル画像を有効サンプル画像として抽出する。また、データ品質推定部24aは、有効サンプル画像の数に基づいて、到達度や有効画像率などを算出する。そして、データ品質推定部24aは、撮影画像、有効サンプル画像、到達度、有効画像率などを含む撮影支援情報を生成して表示制御部25へ出力する(ステップS13)。
次に、表示制御部25は、入力された撮影支援情報を用いて、撮影支援画面を生成し(ステップS14)、撮影支援画面を表示装置5に表示する(ステップS15)。こうして、図5に例示するような撮影支援画面が表示装置5に表示される。
次に、データセット作成装置100は、撮影を終了するか否かを判定する(ステップS16)。例えば、表示装置5に対して撮影終了指示を入力した場合、又は、到達度が100%になった場合、データセット作成装置100は、撮影を終了すると判定する。撮影を終了しないと判定された場合(ステップS16:No)、処理はステップS11へ戻り、ステップS11~S16が繰り返される。一方、撮影を終了すると判定された場合(ステップS16:Yes)、表示処理は終了する。
[第2実施例]
(データ品質推定部の構成)
次に、データセット作成装置100の第2実施例について説明する。第2実施例では、データ品質推定部24は、サンプル画像の品質として、既存物体類似度を推定する。図7は、第2実施例に係るデータ品質推定部24bの構成を示すブロック図である。図示のように、データ品質推定部24bは、既存物体類似度推定部27を備える。既存物体類似度推定部27は、既存認識モデルを用いてサンプル画像の品質を推定する。
「既存物体類似度」とは、既存認識モデルにおいて学習済みの既存物体に対する、サンプル画像の類似度を言う。即ち、既存物体類似度は、サンプル画像が、既に認識モデルに登録済みの他の物体(商品)と類似している度合いを示す。類似度の計算は、例えば、事前学習した特徴抽出モデルを用いて抽出した特徴量に対するコサイン類似度で計算する。ある新商品Aを認識できるように認識モデルを学習する場合に、その新商品Aが既に認識モデルに登録済の商品Bと類似していることがある。この場合、認識モデルの学習には、既存の商品Bと類似していない、即ち、識別性のある新商品Aのサンプル画像を用いる必要がある。
データ品質推定部24bは、記憶部23から入力された撮影画像、既存物体類似度推定部27が選択した有効サンプル画像、及び、有効サンプル画像の数に基づいて算出した到達度や有効画像率などの情報を、撮影支援情報として表示制御部25へ出力する。また、既存物体類似度推定部27は、既存物体に対する類似度が所定の基準より高いサンプル画像については、その類似度が高いと判定された既存物体の画像(以下、「類似物体画像」とも呼ぶ。)を撮影支援情報として表示制御部25へ出力する。表示制御部25は、入力された撮影支援情報を用いて撮影支援画面を生成し、表示装置5に表示する。
(撮影支援画面)
図8は、第2実施例による撮影支援画面の例を示す。図5に示す第1実施例と同様に、撮影支援画面は、撮影画像表示エリア30と、有効画像表示エリア40とを備える。有効画像表示エリア40の表示内容は第1実施例と同様であるので説明を省略する。撮影画像表示エリア30には、第1実施例と同様に、撮影画像31と、矩形32と、到達度34とが表示されている。
また、第2実施例では、既存物体類似度推定部27により、サンプル画像の既存物体に対する類似度が所定基準より高いと判定された場合、その既存物体の画像、即ち、類似物体画像35が表示される。図8の例では、類似物体画像35が、サンプル画像に対応する矩形32と並べて表示されている。さらに、既存物体類似度推定部27により算出された、サンプル画像と類似物体画像との類似度36が類似物体画像35の近傍に表示される。
これにより、作業者は、現在作成されているサンプル画像と類似する既存物体があること、その既存物体の画像、その既存物体との類似度などを見ることができる。よって、作業者は、現在撮影中の物体について、類似度の高い既存物体との識別性の高い面や部分を積極的に撮影することができるので、より既存物体との識別性の高い学習データを効率的に作成することが可能となる。具体的には、作業者は、表示された類似度の値が下がるように商品の撮影箇所を変化させて撮影を行えばよい。なお、類似度の高い既存物体が複数ある場合には、類似度が高い方から所定数の既存物体について類似物体画像35を表示してもよい。
また、類似物体画像35の近傍に、その類似物体画像35が示す商品の商品名などを表示してもよい。さらに、サンプル画像と既存物体との類似度が所定値より高い場合に、現在撮影している商品が既に登録済である可能性が高いことなどを作業者に通知してもよい。これにより、既存認識モデルに登録済の物体(商品)を重複登録してしまうこと防止できる。
(表示処理)
次に、撮影支援情報の表示処理について説明する。第2実施例における撮影支援情報の表示処理は、基本的に図6に示す第1実施例と同様である。但し、第2実施例では、ステップS13において、既存物体類似度推定部27が上記の類似物体画像35や、既存物体との類似度36などを含む撮影支援情報を生成し、表示制御部25へ出力する。
[変形例]
次に、第1実施形態に係るデータセット作成装置100の変形例を説明する。この変形例は、上記の第1実施例又は第2実施例に適用することができる。上記の第1実施例では、データ品質推定部24aは、サンプル画像の重要度を推定し、重要度が基準を満たすサンプル画像を有効サンプル画像としてデータセットに加えている。この際、変形例では、推定された重要度を属性情報として有効サンプル画像に付加する。これにより、記憶部23に蓄積されるデータセットに含まれるサンプル画像には、その重要度が属性情報として付属している状態となる。よって、そのデータセットを用いて認識モデルを学習する際に、サンプル画像に付加された重要度を用いて、学習に使用するサンプル画像の選択や優先度の決定を行うことができる。具体的には、重要度の高いサンプル画像から優先的に選択して認識モデルを学習することにより、学習の効率化が期待できる。
同様に、第2実施例では、データ品質推定部24bは、サンプル画像の既存物体類似度を推定している。この際、変形例では、推定された既存物体類似度を属性情報として有効サンプル画像に付加してデータセットに加える。これにより、記憶部23に蓄積されるデータセットに含まれるサンプル画像には、その既存物体類似度が属性情報として付属している状態となる。よって、そのデータセットを用いて認識モデルを学習する際に、サンプル画像に付加された既存物体類似度を用いて、学習に使用するサンプル画像際の選択や優先度の決定を行うことができる。具体的には、既存物体類似度の低いサンプル画像から優先的に選択して認識モデルを学習することにより、学習の効率化が期待できる。
<第2実施形態>
図9は、第2実施形態のデータセット作成装置の機能構成を示すブロック図である。データセット作成装置70は、取得手段71と、データ処理手段72と、データ品質推定手段73と、表示制御手段74とを備える。
図10は、第2実施形態のデータセット作成装置70による処理のフローチャートである。まず、取得手段71は、物体の撮影画像を取得する(ステップS21)。次に、データ処理手段72は、撮影画像から物体の部分の画像であるサンプル画像を生成し、サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成する(ステップS22)。次に、データ品質推定手段73は、撮影画像及びデータセットに基づいて、データセットの品質を推定する(ステップS23)。そして、表示制御手段74は、データセットの品質情報を含む撮影支援情報を表示装置に表示する(ステップS24)。そして、処理は終了する。
第2実施形態のデータセット作成装置70によれば、特に経験の無い者であっても、学習に適した画像を撮影し、品質の高い学習用データセットを作成することが可能となる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
物体の撮影画像を取得する取得手段と、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成するデータ処理手段と、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定するデータ品質推定手段と、
前記データセットの品質情報を含む撮影支援情報を表示装置に表示する表示制御手段と、
を備えるデータセット作成装置。
(付記2)
前記品質情報は、前記データセットに含まれるサンプル画像の重要度を含む付記1に記載のデータセット作成装置。
(付記3)
前記重要度は、前記サンプル画像から検出された物体の物体らしさのスコアを含む付記2に記載のデータセット作成装置。
(付記4)
前記重要度は、前記サンプル画像の画質に関する情報を含む付記2又は3に記載のデータセット作成装置。
(付記5)
前記品質情報は、前記データセットに含まれるサンプル画像を既存認識モデルで認識した結果の、既存物体に対する類似度を含む付記1に記載のデータセット作成装置。
(付記6)
前記品質情報は、前記データセットに含まれるサンプル画像と既存物体との類似度を含む付記1に記載のデータセット作成装置。
(付記7)
前記撮影支援情報は、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む付記1乃至6のいずれか一項に記載のデータセット作成装置。
(付記8)
前記撮影支援情報は、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度を含む付記1乃至7のいずれか一項に記載のデータセット作成装置。
(付記9)
前記有効なサンプル画像に、当該サンプル画像に基づいて推定された品質情報を付加して前記データセットを記憶する記憶手段を備える付記1乃至8のいずれか一項に記載のデータセット作成装置。
(付記10)
物体の撮影画像を取得し、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
前記データセットの品質情報を含む撮影支援情報を表示装置に表示するデータセット作成方法。
(付記11)
物体の撮影画像を取得し、
前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
前記データセットの品質情報を含む撮影支援情報を表示装置に表示する処理をコンピュータに実行させるプログラムを記録した記録媒体。
以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
1 データセット作成システム
12 プロセッサ
21 撮影画像入力部
22 データ処理部
23 記憶部
24、24a、24b データ品質推定部
25 表示制御部
26 重要度推定部
27 既存物体類似度推定部
100 データセット作成装置

Claims (10)

  1. 物体の撮影画像を取得する取得手段と、
    前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成するデータ処理手段と、
    前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定するデータ品質推定手段と、
    前記データセットの品質情報と、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む撮影支援情報を表示装置に表示する表示制御手段と、
    を備えるデータセット作成装置。
  2. 物体の撮影画像を取得する取得手段と、
    前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成するデータ処理手段と、
    前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定するデータ品質推定手段と、
    前記データセットの品質情報と、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度と、を含む撮影支援情報を表示装置に表示する表示制御手段と、
    を備えるデータセット作成装置。
  3. 前記品質情報は、前記データセットに含まれるサンプル画像の重要度を含む請求項1又は2に記載のデータセット作成装置。
  4. 前記重要度は、前記サンプル画像から検出された物体の物体らしさのスコアを含む請求項に記載のデータセット作成装置。
  5. 前記重要度は、前記サンプル画像の画質に関する情報を含む請求項に記載のデータセット作成装置。
  6. 前記品質情報は、前記データセットに含まれるサンプル画像を既存認識モデルで認識した結果の、既存物体に対する類似度を含む請求項1又は2に記載のデータセット作成装置。
  7. コンピュータにより実行されるデータセット作成方法であって、
    物体の撮影画像を取得し、
    前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
    前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
    前記データセットの品質情報と、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む撮影支援情報を表示装置に表示するデータセット作成方法。
  8. コンピュータにより実行されるデータセット作成方法であって、
    物体の撮影画像を取得し、
    前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
    前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
    前記データセットの品質情報と、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度と、を含む撮影支援情報を表示装置に表示するデータセット作成方法。
  9. 物体の撮影画像を取得し、
    前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
    前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
    前記データセットの品質情報と、前記撮影画像と、前記撮影画像において前記サンプル画像が切り出される位置を示す情報と、前記データセットに含まれている有効なサンプル画像と、前記サンプル画像の総数に対する有効なサンプル画像の割合である有効画像率と、を含む撮影支援情報を表示装置に表示する処理をコンピュータに実行させるプログラム。
  10. 物体の撮影画像を取得し、
    前記撮影画像から前記物体の部分の画像であるサンプル画像を生成し、前記サンプル画像のうち、所定の基準を満たす有効なサンプル画像を含む学習用のデータセットを生成し、
    前記撮影画像及び前記データセットに基づいて、前記データセットの品質を推定し、
    前記データセットの品質情報と、学習に必要な総画像数に対する、既に得られた有効なサンプル画像数の割合を示す到達度と、を含む撮影支援情報を表示装置に表示する処理をコンピュータに実行させるプログラム。
JP2023553850A 2021-10-14 2021-10-14 データセット作成装置、データセット作成方法、及び、プログラム Active JP7626243B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/038080 WO2023062784A1 (ja) 2021-10-14 2021-10-14 データセット作成装置、データセット作成方法、及び、記録媒体

Publications (3)

Publication Number Publication Date
JPWO2023062784A1 JPWO2023062784A1 (ja) 2023-04-20
JPWO2023062784A5 JPWO2023062784A5 (ja) 2024-06-25
JP7626243B2 true JP7626243B2 (ja) 2025-02-04

Family

ID=85987348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023553850A Active JP7626243B2 (ja) 2021-10-14 2021-10-14 データセット作成装置、データセット作成方法、及び、プログラム

Country Status (2)

Country Link
JP (1) JP7626243B2 (ja)
WO (1) WO2023062784A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018180646A (ja) 2017-04-04 2018-11-15 日本電信電話株式会社 物体候補領域推定装置、物体候補領域推定方法、及び物体候補領域推定プログラム
JP2020008904A (ja) 2018-07-02 2020-01-16 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
JP2021033489A (ja) 2019-08-21 2021-03-01 富士通株式会社 画像認識アプリケーション構築支援システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018180646A (ja) 2017-04-04 2018-11-15 日本電信電話株式会社 物体候補領域推定装置、物体候補領域推定方法、及び物体候補領域推定プログラム
JP2020008904A (ja) 2018-07-02 2020-01-16 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
JP2021033489A (ja) 2019-08-21 2021-03-01 富士通株式会社 画像認識アプリケーション構築支援システム

Also Published As

Publication number Publication date
JPWO2023062784A1 (ja) 2023-04-20
WO2023062784A1 (ja) 2023-04-20

Similar Documents

Publication Publication Date Title
TWI709091B (zh) 圖像處理方法和裝置
TWI351620B (en) Information processing apparatus and method, and a
JP5227911B2 (ja) 監視映像検索装置及び監視システム
CN105052123B (zh) 摄像装置、构图辅助装置、构图辅助方法及存储介质
JP5589548B2 (ja) 撮像装置、画像処理方法、及びプログラム記憶媒体
JP5699432B2 (ja) 画像処理装置
JP2008537380A5 (ja)
JP2009187482A (ja) 棚割再現方法、棚割再現プログラム、棚割評価方法、棚割評価プログラム及び記録媒体
CN102842110A (zh) 图像处理设备和图像处理方法
TWI586160B (zh) 利用行動電話及雲端可視化搜尋引擎之即時物體掃描
JP2008165701A (ja) 画像処理装置、電子機器、画像処理方法、及び、プログラム
JP2021111228A (ja) 学習装置、学習方法、及びプログラム
JP2017204838A (ja) 情報処理装置および情報処理方法
JP2011040993A (ja) 被写体追尾プログラム、およびカメラ
JP2007094990A (ja) 画像分類装置および方法並びにプログラム
JP7626243B2 (ja) データセット作成装置、データセット作成方法、及び、プログラム
JP2006053666A (ja) 画像処理プログラム、画像処理方法、画像処理装置及び記録媒体
WO2020217369A1 (ja) オブジェクト特徴量抽出装置、オブジェクト特徴量抽出方法及び非一時的なコンピュータ可読媒体
US20250148749A1 (en) Image processing device, image processing method, and program
JP2008310392A (ja) 人物属性識別装置及びその方法
JP4635742B2 (ja) 撮像装置および撮像プログラム
JP7643063B2 (ja) データ生成装置、データ生成方法、及びプログラム
JP2006332789A (ja) 映像撮影方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2023024263A5 (ja)
JP2006050076A (ja) 映像の代表画像選出方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240403

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250106

R150 Certificate of patent or registration of utility model

Ref document number: 7626243

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150