JP2019153057A - 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム - Google Patents
画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム Download PDFInfo
- Publication number
- JP2019153057A JP2019153057A JP2018037567A JP2018037567A JP2019153057A JP 2019153057 A JP2019153057 A JP 2019153057A JP 2018037567 A JP2018037567 A JP 2018037567A JP 2018037567 A JP2018037567 A JP 2018037567A JP 2019153057 A JP2019153057 A JP 2019153057A
- Authority
- JP
- Japan
- Prior art keywords
- image
- background
- difference
- foreground
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
・SIFT(Scale-Invariant Feature Transform): David G.Lowe, “Distinctive image features from scale-invariant keypoints”, Int.Journal of Computer Vision,Vol.60, No.2, pp.91-110, 2004.
・SURF (Speeded-Up Robust Features): H. Bay, T. Tuytelaars, and L. Van Gool, “SURF: Speeded Up Robust. Features”, In ECCV , pp.404-417, 2006.
・BRIEF (Features from Accelerated Segment Test): M.Calonder, V.Lepetit and C.Strecha and P.Fua, “BRIEF: Binary Robust Independent Elementary Features”, In Proc. European Conference on Computer Vision, pp.778-792, 2010.
・ORB (Oriented FAST and Rotated BRIEF): E.Rublee, V.Rabaud, K.Konolige and G.Bradski “ORB: an efficient alternative to SIFT or SURF”, In Proc. International Conference on Computer Vision, 2011.
・AlexNet: Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Advances in neural information processing systems. 2012.
・GoogLeNet: Szegedy, Christian, et al. "Going deeper with convolutions." Cvpr, 2015.
・VGG: Simonyan, Karen, and Andrew Zisserman. "Very deep convolutional networks for large-scale image recognition." arXiv preprint arXiv:1409.1556 (2014).
・ResNet: He, Kaiming, et al. "Deep residual learning for image recognition." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.
・FCN(Fully Convolutional Networks):Long, Jonathan, Evan Shelhamer, and Trevor Darrell. "Fully convolutional networks for semantic segmentation." Proceedings of the IEEE conference on computer vision and pattern recognition. 2015.
・U-Net:Ronneberger, Olaf, et al. "U-net: Convolutional networks for biomedical image segmentation." International Conference on Medical image computing and computer-assisted intervention. Springer, Cham, 2015.
・Momentum付きのSGD(stocastic gradient descent): Goodfellow, Ian, et al. Deep learning. Vol. 1. Cambridge: MIT press, 2016.
・RMSProp: Geoffrey Hinton, Nitish Srivastava, Kevin Swersky. 2014. Lecture 6e: Rmsprop: Divide the gradient by a running average of its recent magnitude (CSC321 Winter 2014).
・Adam: Diederik Kingma, Jimmy Ba. 2015. Adam: a method for stochastic optimization. the 3rd International Conference for Learning Representations (ICLR 2015).
前記対象画像から前記背景および前記前景を区別するマップ画像と、前記差分画像との差を示す残差をニューラル・ネットワークを用いて推定する推定部と、
生成された前記差分画像と、推定された前記残差とに基づくマップ画像を出力する出力部と、
を有することを特徴とする画像処理装置。
ことを特徴とする付記1に記載の画像処理装置。
ことを特徴とする付記2に記載の画像処理装置。
ことを特徴とする付記1乃至3のいずれか一に記載の画像処理装置。
算出された前記誤差に基づいて前記ニューラル・ネットワークにかかるパラメータを更新する更新部と、
を有することを特徴とする学習装置。
ことを特徴とする付記5に記載の学習装置。
ことを特徴とする付記6に記載の学習装置。
前記対象画像から前記背景および前記前景を区別するマップ画像と、前記差分画像との差を示す残差をニューラル・ネットワークを用いて推定し、
生成された前記差分画像と、推定された前記残差とに基づくマップ画像を出力する、
処理をコンピュータが実行することを特徴とする画像処理方法。
ことを特徴とする付記8に記載の画像処理方法。
ことを特徴とする付記9に記載の画像処理方法。
ことを特徴とする付記8乃至10のいずれか一に記載の画像処理方法。
算出された前記誤差に基づいて前記ニューラル・ネットワークにかかるパラメータを更新する、
処理をコンピュータが実行することを特徴とする学習方法。
ことを特徴とする付記12に記載の学習方法。
ことを特徴とする付記13に記載の学習方法。
前記対象画像から前記背景および前記前景を区別するマップ画像と、前記差分画像との差を示す残差をニューラル・ネットワークを用いて推定し、
生成された前記差分画像と、推定された前記残差とに基づくマップ画像を出力する、
処理をコンピュータに実行させることを特徴とする画像処理プログラム。
ことを特徴とする付記15に記載の画像処理プログラム。
ことを特徴とする付記16に記載の画像処理プログラム。
ことを特徴とする付記15乃至17のいずれか一に記載の画像処理プログラム。
算出された前記誤差に基づいて前記ニューラル・ネットワークにかかるパラメータを更新する、
処理をコンピュータに実行させることを特徴とする学習プログラム。
ことを特徴とする付記19に記載の学習プログラム。
ことを特徴とする付記20に記載の学習プログラム。
2…学習装置
3…コンピュータ
10…差分生成部
11…残差推定部
11a、200、200a、200b…ニューラル・ネットワーク
12…出力部
20…誤差算出部
21…勾配算出部
22…更新部
101…CPU
102…入力装置
103…モニタ
104…スピーカ
105…媒体読取装置
106…インタフェース装置
107…通信装置
108…RAM
109…ハードディスク装置
110…バス
111…プログラム
112…各種データ
201…入力層
202…中間層
203…出力層
C1、C2…ケース
G1…対象画像
G2…背景画像
G3…差分画像
G4…残差
G4a…判別結果
G5…前景マップ
G6…教師画像
G10…入力画像
G11…判別結果
H…人物
R1…前景領域
Claims (9)
- 背景および前景の判別対象となる対象画像と、前記背景にかかる背景画像との差分画像を生成する生成部と、
前記対象画像から前記背景および前記前景を区別するマップ画像と、前記差分画像との差を示す残差をニューラル・ネットワークを用いて推定する推定部と、
生成された前記差分画像と、推定された前記残差とに基づくマップ画像を出力する出力部と、
を有することを特徴とする画像処理装置。 - 前記ニューラル・ネットワークは、中間層を多層とするディープ・ニューラル・ネットワークである、
ことを特徴とする請求項1に記載の画像処理装置。 - 前記ニューラル・ネットワークは、畳み込みニューラル・ネットワークである、
ことを特徴とする請求項2に記載の画像処理装置。 - 前記生成部は、前記対象画像および前記背景画像それぞれの各画素に基づく特徴量の差分をもとに前記差分画像を生成する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の画像処理装置。 - 背景および前景の判別対象となる対象画像と前記背景にかかる背景画像との差分画像、および、前記差分画像との差を示す残差に基づいて、ニューラル・ネットワークによって推定された、前記対象画像から前記背景および前記前景を区別するマップ画像を受け付け、当該マップ画像と、教師データとの誤差を算出する算出部と、
算出された前記誤差に基づいて前記ニューラル・ネットワークにかかるパラメータを更新する更新部と、
を有することを特徴とする学習装置。 - 背景および前景の判別対象となる対象画像と、前記背景にかかる背景画像との差分画像を生成し、
前記対象画像から前記背景および前記前景を区別するマップ画像と、前記差分画像との差を示す残差をニューラル・ネットワークを用いて推定し、
生成された前記差分画像と、推定された前記残差とに基づくマップ画像を出力する、
処理をコンピュータが実行することを特徴とする画像処理方法。 - 背景および前景の判別対象となる対象画像と前記背景にかかる背景画像との差分画像、および、前記差分画像との差を示す残差に基づいて、ニューラル・ネットワークによって推定された、前記対象画像から前記背景および前記前景を区別するマップ画像を受け付け、当該マップ画像と、教師データとの誤差を算出し、
算出された前記誤差に基づいて前記ニューラル・ネットワークにかかるパラメータを更新する、
処理をコンピュータが実行することを特徴とする学習方法。 - 背景および前景の判別対象となる対象画像と、前記背景にかかる背景画像との差分画像を生成し、
前記対象画像から前記背景および前記前景を区別するマップ画像と、前記差分画像との差を示す残差をニューラル・ネットワークを用いて推定し、
生成された前記差分画像と、推定された前記残差とに基づくマップ画像を出力する、
処理をコンピュータに実行させることを特徴とする画像処理プログラム。 - 背景および前景の判別対象となる対象画像と前記背景にかかる背景画像との差分画像、および、前記差分画像との差を示す残差に基づいて、ニューラル・ネットワークによって推定された、前記対象画像から前記背景および前記前景を区別するマップ画像を受け付け、当該マップ画像と、教師データとの誤差を算出し、
算出された前記誤差に基づいて前記ニューラル・ネットワークにかかるパラメータを更新する、
処理をコンピュータに実行させることを特徴とする学習プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018037567A JP2019153057A (ja) | 2018-03-02 | 2018-03-02 | 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム |
JP2022126701A JP7405198B2 (ja) | 2018-03-02 | 2022-08-08 | 画像処理装置、画像処理方法および画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018037567A JP2019153057A (ja) | 2018-03-02 | 2018-03-02 | 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022126701A Division JP7405198B2 (ja) | 2018-03-02 | 2022-08-08 | 画像処理装置、画像処理方法および画像処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019153057A true JP2019153057A (ja) | 2019-09-12 |
Family
ID=67946521
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018037567A Pending JP2019153057A (ja) | 2018-03-02 | 2018-03-02 | 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム |
JP2022126701A Active JP7405198B2 (ja) | 2018-03-02 | 2022-08-08 | 画像処理装置、画像処理方法および画像処理プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022126701A Active JP7405198B2 (ja) | 2018-03-02 | 2022-08-08 | 画像処理装置、画像処理方法および画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP2019153057A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021100483A1 (ja) * | 2019-11-21 | 2021-05-27 | オムロン株式会社 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
EP4174788A1 (en) | 2021-10-26 | 2023-05-03 | Fujitsu Limited | Learning program, learning method, and information processing apparatus |
EP4174796A1 (en) | 2021-10-26 | 2023-05-03 | Fujitsu Limited | Inference program, learning program, inference method, and learning method |
JP7475959B2 (ja) | 2020-05-20 | 2024-04-30 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111508038B (zh) * | 2020-04-17 | 2024-09-24 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008165792A (ja) * | 2006-12-22 | 2008-07-17 | Canon Inc | 画像処理方法及び装置 |
JP6276901B1 (ja) * | 2017-05-26 | 2018-02-07 | 楽天株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
-
2018
- 2018-03-02 JP JP2018037567A patent/JP2019153057A/ja active Pending
-
2022
- 2022-08-08 JP JP2022126701A patent/JP7405198B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008165792A (ja) * | 2006-12-22 | 2008-07-17 | Canon Inc | 画像処理方法及び装置 |
JP6276901B1 (ja) * | 2017-05-26 | 2018-02-07 | 楽天株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021100483A1 (ja) * | 2019-11-21 | 2021-05-27 | オムロン株式会社 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
JP2021082155A (ja) * | 2019-11-21 | 2021-05-27 | オムロン株式会社 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
JP7434829B2 (ja) | 2019-11-21 | 2024-02-21 | オムロン株式会社 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
JP7475959B2 (ja) | 2020-05-20 | 2024-04-30 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
EP4174788A1 (en) | 2021-10-26 | 2023-05-03 | Fujitsu Limited | Learning program, learning method, and information processing apparatus |
EP4174796A1 (en) | 2021-10-26 | 2023-05-03 | Fujitsu Limited | Inference program, learning program, inference method, and learning method |
KR20230059711A (ko) | 2021-10-26 | 2023-05-03 | 후지쯔 가부시끼가이샤 | 학습 프로그램, 학습 방법 및 정보 처리 장치 |
KR20230059712A (ko) | 2021-10-26 | 2023-05-03 | 후지쯔 가부시끼가이샤 | 추론 프로그램, 학습 프로그램, 추론 방법 및 학습 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2022145825A (ja) | 2022-10-04 |
JP7405198B2 (ja) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7405198B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
Wang et al. | Detect globally, refine locally: A novel approach to saliency detection | |
CN111754596B (zh) | 编辑模型生成、人脸图像编辑方法、装置、设备及介质 | |
US11222239B2 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
CN112446270B (zh) | 行人再识别网络的训练方法、行人再识别方法和装置 | |
EP3333768A1 (en) | Method and apparatus for detecting target | |
CN109977757B (zh) | 一种基于混合深度回归网络的多模态的头部姿态估计方法 | |
CN111563601A (zh) | 使用联合语义向量进行表示学习 | |
US20180157892A1 (en) | Eye detection method and apparatus | |
CN111860414B (zh) | 一种基于多特征融合检测Deepfake视频方法 | |
KR20160096460A (ko) | 복수의 분류기를 포함하는 딥 러닝 기반 인식 시스템 및 그 제어 방법 | |
CN105229697A (zh) | 多模态前景背景分割 | |
CN111667001B (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
JP7228961B2 (ja) | ニューラルネットワークの学習装置およびその制御方法 | |
KR20170038622A (ko) | 영상으로부터 객체를 분할하는 방법 및 장치 | |
CN111047543A (zh) | 图像增强方法、装置和存储介质 | |
CN102708572A (zh) | 更新场景模型的方法和系统、使用该方法的照相机系统 | |
Wu et al. | Facial emotion recognition using deep learning | |
Lecca et al. | Comprehensive evaluation of image enhancement for unsupervised image description and matching | |
Wang et al. | Crowd counting with density adaption networks | |
JP7437918B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN116612355A (zh) | 人脸伪造识别模型训练方法和装置、人脸识别方法和装置 | |
JP2021056960A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2024516016A (ja) | 入力画像の処理方法、入力画像の処理装置及びプログラム | |
CN115376213A (zh) | 活体检测网络的训练及活体检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211224 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220510 |