JP2021149166A - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP2021149166A
JP2021149166A JP2020045428A JP2020045428A JP2021149166A JP 2021149166 A JP2021149166 A JP 2021149166A JP 2020045428 A JP2020045428 A JP 2020045428A JP 2020045428 A JP2020045428 A JP 2020045428A JP 2021149166 A JP2021149166 A JP 2021149166A
Authority
JP
Japan
Prior art keywords
image
cutout
target
image data
cut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020045428A
Other languages
English (en)
Inventor
奏馬 白壁
Soma Shirokabe
奏馬 白壁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020045428A priority Critical patent/JP2021149166A/ja
Publication of JP2021149166A publication Critical patent/JP2021149166A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】切り出し対象を含む画像から切り出し対象を切り出す場合、切り出し対象を切り出し線により指定して予め定められたアルゴリズムにより切り出すものと比較して、容易に切り出し画像を出力することができる画像処理装置及びプログラムを提供する。【解決手段】画像処理装置は、プロセッサを備え、前記プロセッサは、切り出し対象を含む画像データ、前記切り出し対象内の指定された位置データ及び切り出し画像データを取得し、前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成する。【選択図】図2

Description

本発明は、画像処理装置及びプログラムに関する。
非特許文献1や特許文献1では、ユーザが画像内に、その画素が前景あるいは背景のいずれに属するのかを表すシードを付与し、両者の境界をエネルギー最小化問題として求めることで求める領域を切り抜く技術が開示されている。ここで、シードとは、領域を指定するために描画される線又は点である。
非特許文献2では、ユーザに前景を包括するような短形領域を指定させ、前景・背景の画素値分布を混合正規分布(GMM)によってモデル化する技術が開示され、また、特許文献2では、ユーザに対して画像情報を表示し、受け入れた画像情報内の点から初期領域を形成する技術が開示されている。
uri Y. Boykov, Marie-Pierre Jolly, "Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D Images", Proceedings of "International Conference on Computer Vision", Vancouver, Canada, July 2001,vol.I.p.105 特許第6089886号公報 Rother, C., Kolmogorov, V., & Blake, A. (2004). "GrabCut" − Interactive Foreground Extraction using Iterated Graph Cuts. Conference on Computer Graphics and Interactive Techniques (SIGGRAPH) 特開2013―29930号公報
画像編集の分野において、画像を切り出し対象とそれ以外の画像領域とに分離する技術は、目的とする切り出し対象を加工・調整する際の前工程として基本的なものである。
本発明は、切り出し対象を含む画像から切り出し対象を切り出す場合、切り出し対象を切り出し線により指定して予め定められたアルゴリズムにより切り出すものと比較して、容易に切り出し画像を出力することができる画像処理装置及びプログラムを提供することを目的とする。
請求項1に係る本発明は、プロセッサを備え、前記プロセッサは、切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及び切り出し画像データを取得し、前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成する、画像処理装置である。
請求項2に係る本発明は、前記プロセッサは、該切り出し対象内の指定された複数の位置データを取得する請求項1記載の画像処理装置である。
請求項3に係る本発明は、前記プロセッサは、切り出し対象以外の領域内の指定された位置データを取得する請求項1又は2記載の画像処理装置である。
請求項4に係る本発明は、前記プロセッサは、切り出し対象の種別データをさらに取得し、前記切り出し対象を含む画像データ、該切り出し対象内の位置データ及び切り出し対象の種別データを入力、前記切り出し画像を出力と学習モデルを生成する請求項1から3いずれか記載の画像処理装置である。
請求項5に係る本発明は、プロセッサを備え、前記プロセッサは、切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及切り出し画像データを取得し、前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成し、新たに切り出し対象を含む画像データ及び該切り出し対象内の指定された位置データを取得し、前記学習モデルから切り出し画像データを出力する、画像処理装置である。
請求項6に係る本発明は、切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及切り出し画像データを取得するステップと、前記切り出し対象を含む画像データ及び該画切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成するステップと、をコンピュータに実行させるためのプログラムである。
請求項7に係る本発明は、切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及切り出し画像データを取得するステップと、前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成するステップと、新たに切り出し対象を含む画像データ及び該切り出し対象内の指定された位置データを取得し、前記学習モデルから切り出し画像データを出力するステップと、をコンピュータに実行させるためのプログラムである。
請求項1、5〜7に係る本発明によれば、切り出し対象画像を含む画像から切り出し対象画像を切り出す場合、切り出し対象画像を切り出し線により指定して予め定められたアルゴリズムにより切り出し対象画像を切り出すものと比較して、容易に切り出し対象画像を切り出すことができる。
請求項2に係る本発明によれば、請求項1に係る本発明の効果に加えて、1つの位置データを取得するものと比較して、正確に切り出し画像を切り出すことができる。
請求項3に係る本発明によれば、請求項1又は2に係る本発明の効果に加えて、切り出し対象のみの位置データを取得するものと比較して、正確に切り出し対象画像を切り出すことができる。
請求項4に係る発明によれば、切り出し対象の種別を問わないで学習モデルを生成するものと比較して、正確に切り出し画像を生成することができる。
請求項5に係る本発明によれば、請求項1から3いずれかに係る本発明の効果に加えて、切り出し対象の種別に関係なく学習させるものと比較して、正確に切り出し対象画像を切り出しことができる。
本発明の実施形態に係る画像処理装置のハードウエアを示すブロック図である。 本発明の実施形態に係る画像処理装置のソフトウエアの構成を示すブロック図である。 本発明の実施形態に係る画像処理装置において、入力画像、前景距離画像、背景距離画像及び切り出し画像の第1例を示す画面図である。 本発明の実施形態に係る画像処理装置において、入力画像、前景距離画像、背景距離画像及び切り出し画像の第2例を示す画面図である。 本発明の実施形態に係る画像処理装置において、入力画像、前景距離画像、背景距離画像及び切り出し画像の第3例を示す画面図である。 本発明の実施形態に係る画像処理装置において、入力画像、前景距離画像、背景距離画像及び切り出し画像の第4例を示す画面図である。 本発明の実施形態に係る画像処理装置において、入力画像、前景距離画像、背景距離画像及び切り出し画像の第5例を示す画面図である。 本発明の実施形態に係る画像処理装置において、切り出し画像を変化させる場合の一例を示す画面図である。
次に、本発明の実施形態について図面を参照して詳細に説明する。
図1には、本発明の実施形態に係る画像処理装置10のハードウエア構成が示されている。
画像処理装置10は、プロセッサ12、メモリ14、記憶装置16、操作表示装置インターフェイス18、通信インターフェイス20及び入力インターフェイス22を有し、これらプロセッサ12、メモリ14、記憶装置16、操作表示装置インターフェイス18通信インターフェイス20及び入力インターフェイス22がバス24を介して接続されている。
プロセッサ12は、メモリ14に格納された制御プログラムに基づいて予め定められた処理を実行する。記憶装置16は、例えばハードディスクから構成され、必要とされるソフトウエアやデータが記憶されている。操作表示装置インターフェイス18には、操作表示装置26が接続されている。操作表示装置26は、タッチパネル28及びディスプレイ30が設けられ、タッチパネル28から操作データを受け付け、ディスプレイ30に表示データを送るようになっている。
通信インターフェイス20は、LAN(ローカル・エリア・ネットワークのこと)32を介して端末装置やサーバに接続されており、端末装置やサーバから画像の画像を受信し、あるいは端末装置やサーバに画像を送信したりする。LANに限らず、インターネットを介して端末装置やサーバに接続するようにしてもよい。
入力インターフェイス22には、マウス34及びキーボード36に接続されており、マウス34及びキーボード36からの操作信号や操作データが入力される。
図2には、画像処理装置10の機能を実現するためのソフトウエア構成が示されている。
画像処理装置10は、学習モデル生成部38と実行部40とを有する。
学習モデル生成部38は、学習モデルを生成する。この学習モデル生成部38は、学習データ取得部42、学習部44及び学習モデル記憶部46から構成されている。
学習データ取得部42は、図3(a)に示すように、切り出し対象48(以下、前景48という。)及びその他の領域(以下、背景50という。)を含む入力画像52、及びユーザが指定する位置データを取得する。また、図3(d)に示すように、切り出し画像である前景マスク画像54を取得する。位置データは、前述したタッチパネル28、マウス34等から入力される。この実施形態においては、○で示す前景48に対する位置データは、例えばマウス34の左ボタンをクリックし、×で示す背景50に対する位置データはマウス34の右ボタンをクリックすることにより入力される。
位置データは、図3(b),(c)に示すように、後述する学習部44において扱いやすくするために前景距離画像56と背景距離画像58に変換される。ここでは、前景距離画像56と背景距離画像58は、位置データの点から放射状に画素値が大きくする距離画像とする場合を示しているが、位置データの座標情報を保持する形式として適切なものがあればいかなるものでもよい。
学習部44は、ニューラルネットワークであり、好ましくは、深層学習である。入力画像52、前景距離画像56及び背景距離画像58を入力、前景マスク画像54を教師データである出力とする学習モデルを生成する。即ち、一枚の入力画像52に対し、前景距離画像56、背景距離画像58及び前景マスク画像54との4つを組として学習する。
図3においては、前景には1つの位置が指定されているが、図4に示すように、前景48に対して複数の位置を指定するようにしてもよい。ここでは、図4(a)に示すように、足と足との間の部分を前景として指定しているので、図4(d)に示すように、足と足との間が前景となる前景マスク画像54が教師データとなる。また、図5(a)に示すように、足と足との間の部分を背景として指定した場合は、図5(d)に示すように、足と足との間が背景となる前景マスク画像54が教師データとなる。
また、図6に示すように、図3と同じ入力画像52の前景48に3つの位置データを与え、背景50に位置データを与えないようにしてもよい。この場合は、図6(c)に示すように、背景距離画像58は、全体が「白」として扱われる。この図6の例では、図3と同じ前景マスク画像54が教師データとなる。
人全体について、学習モデルが生成されるものではなく、例えば図7(a)に示すように、人の頭を前景48と指定し、頭以外を背景50として指定した場合は、図7(d)に示すように、頭のみが前景マスク画像54となる教師データを与えるようにしてもよい。
上記のように多数の入力データと出力データから学習モデルが生成され、生成された学習モデルが学習モデル記憶部46に記憶される。
実行部40は、画像データ受付部60、ユーザ指示受付部62、識別部64及び出力部66を有する。画像データ受付部60は、ユーザにより切り出したい画像を含む画像データを受け付ける。ユーザ指示受付部15は、画像データ受付部60で受け付けた画像データに対してユーザが入力した前景領域の位置及び背景領域の位置のデータを受け付ける。
識別部64は、入力された画像データ及び位置データから、学習モデル記憶部46に記憶された学習モデルに従って、前景マスク画像54を抽出する。
出力部66は、識別部64で抽出された前景マスク画像54とユーザが入力した画像とを合成し、前景マスク画像54によりマスクされた出力画像を表示するように出力する。
図8には、出力部66から出力される切り出し画像の一例が示されている。図8(a)がユーザにより入力された入力画像である。この入力画像に対して例えば図8(b)に示すように、前景の中央を位置データとして指定した場合は、人全体が切り出される。ここで、図8(c)に示すように、図8(b)で切り出された人の上半身を背景として指定すると、顔を含む上半身だけが切り出し画像として抽出される。さらに、図8(d)に示すように、腕の部分を背景として指定すると、腕及び顔の部分が除かれた切り出し画像を得る。このように、対話形式により望むべき切り出し画像が得られる。
なお、上記実施形態においては、人を切り出し対象とする例について説明したが、本発明は、これに限らず、動物、建物、車両、船舶等、あらゆる種類の画像を切り出し対象とすることができる。この場合、切り出し対象の種類を教師データとしてもよい。即ち、切り出し対象を含む入力画像を入力とし、切り出し対象の種類及び切り出し画像を出力とする学習モデルを生成するようにしてもよい。
また、学習モデルは、切り出し対象の種類により複数生成してもよい。この場合、切り出し対象の種類により学習モデルを選択し、該学習モデル毎に切り出し画像を取得するようにしてもよい。
上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス等)を含むものである。
また上記実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
10 画像処理装置
12 プロセッサ
14 メモリ
16 記憶装置
18 操作表示装置インターフェイス
20 通信インターフェイス
22 入力インターフェイス
24 バス
26 操作表示装置
28 タッチパネル
30 ディスプレイ
32 LAN
34 マウス
36 キーボード
38 学習モデル生成部
40 実行部
42 学習データ入力部
44 学習部
46 学習モデル記憶部
48 前景
50 背景
52 入力画像
54 切り出し対象画像
56 前景距離画像
58 背景距離画像
60 画像データ受付部
62 ユーザ指示受付部
64 識別部
66 出力部



Claims (7)

  1. プロセッサを備え、
    前記プロセッサは、
    切り出し対象を含む画像データ、前記切り出し対象内の指定された位置データ及び切り出し画像データを取得し、
    前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成する、
    画像処理装置。
  2. 前記プロセッサは、該切り出し対象内の指定された複数の位置データを取得する請求項1記載の画像処理装置。
  3. 前記プロセッサは、切り出し対象以外の領域内の指定された位置データを取得する請求項1又は2記載の画像処理装置。
  4. 前記プロセッサは、切り出し対象の種別データをさらに取得し、前記切り出し対象を含む画像データ、該切り出し対象内の位置データ及び切り出し対象の種別データを入力、前記切り出し画像を出力と学習モデルを生成する請求項1から3いずれか記載の画像処理装置。
  5. プロセッサを備え、
    前記プロセッサは、
    切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及切り出し画像データを取得し、
    前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成し、
    新たに切り出し対象を含む画像データ及び該切り出し対象内の指定された位置データを取得し、前記学習モデルから切り出し画像データを出力する、
    画像処理装置。
  6. 切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及切り出し画像データを取得するステップと、
    前記切り出し対象を含む画像データ及び該画切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成するステップと、
    をコンピュータに実行させるためのプログラム。
  7. 切り出し対象を含む画像データ、該切り出し対象内の指定された位置データ及切り出し画像データを取得するステップと、
    前記切り出し対象を含む画像データ及び該切り出し対象内の位置データを入力、前記切り出し画像データを出力とする学習モデルを生成するステップと、
    新たに切り出し対象を含む画像データ及び該画像の切り出し対象内の指定された位置データを取得し、前記学習モデルから切り出し画像データを出力するステップと、
    をコンピュータに実行させるためのプログラム。
JP2020045428A 2020-03-16 2020-03-16 画像処理装置及びプログラム Pending JP2021149166A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020045428A JP2021149166A (ja) 2020-03-16 2020-03-16 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020045428A JP2021149166A (ja) 2020-03-16 2020-03-16 画像処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2021149166A true JP2021149166A (ja) 2021-09-27

Family

ID=77848725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020045428A Pending JP2021149166A (ja) 2020-03-16 2020-03-16 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2021149166A (ja)

Similar Documents

Publication Publication Date Title
KR102328349B1 (ko) 인체 윤곽 키 포인트 검출 방법, 이미지 처리 방법, 장치 및 기기
KR20210103435A (ko) 가상 객체 이미지 합성 방법, 장치, 전자 기기 및 저장 매체
EP2880633B1 (en) Animating objects using the human body
JP4998637B1 (ja) 画像処理装置、情報生成装置、画像処理方法、情報生成方法、制御プログラムおよび記録媒体
US11508107B2 (en) Additional developments to the automatic rig creation process
WO2019071976A1 (zh) 基于区域增长和眼动模型的全景图像显著性检测方法
US11282257B2 (en) Pose selection and animation of characters using video data and training techniques
US20220044413A1 (en) Systems and methods for segmenting images
JP5935849B2 (ja) 画像処理装置、画像処理方法及びプログラム
Ozbay et al. A hybrid method for skeleton extraction on Kinect sensor data: Combination of L1-Median and Laplacian shrinking algorithms
US20230237777A1 (en) Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium
JP2019191874A (ja) データ処理装置及びデータ処理方法
IL299465A (en) An object recognition neural network for predicting a missing visual information center
CN111353069A (zh) 一种人物场景视频生成方法、系统、装置及存储介质
US20230290132A1 (en) Object recognition neural network training using multiple data sources
CN113706709A (zh) 文本特效生成方法及相关装置、设备、存储介质
CN112714337A (zh) 视频处理方法、装置、电子设备和存储介质
JP2021149166A (ja) 画像処理装置及びプログラム
EP4290452A1 (en) Data generation method and apparatus, and electronic device
Khattab et al. Modified GrabCut for human face segmentation
AU2019431568B2 (en) Method and product for processing of vrds 4d medical images
Bhatla et al. Development of Anatomy Learning System based on Augmented Reality
CN111368853A (zh) 一种标签的构建方法、系统、装置及存储介质
JP2023527438A (ja) リアルタイム深度マップを用いたジオメトリ認識拡張現実効果
KR102358145B1 (ko) 표준 이미지 생성을 이용한 아이 얼굴 변환 방법

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20201102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240625