JP6892557B2 - 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム - Google Patents
学習装置、画像生成装置、学習方法、画像生成方法及びプログラム Download PDFInfo
- Publication number
- JP6892557B2 JP6892557B2 JP2020520935A JP2020520935A JP6892557B2 JP 6892557 B2 JP6892557 B2 JP 6892557B2 JP 2020520935 A JP2020520935 A JP 2020520935A JP 2020520935 A JP2020520935 A JP 2020520935A JP 6892557 B2 JP6892557 B2 JP 6892557B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- input
- data
- learning
- view
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 54
- 230000011218 segmentation Effects 0.000 claims description 54
- 230000004044 response Effects 0.000 claims description 25
- 238000010801 machine learning Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 description 52
- 230000006870 function Effects 0.000 description 16
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/2163—Partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
以下、本発明の一実施形態である第1実施形態について図面に基づき詳細に説明する。
以下、本発明の別の一実施形態である第2実施形態について図面に基づき詳細に説明する。
Claims (7)
- 入力画像を取得する画像取得部と、
前記入力画像に対するセマンティックセグメンテーションの実行結果を示す結果データを取得する結果データ取得部と、
前記入力画像と前記結果データとが結合された入力データを生成する入力データ生成部と、
画像と当該画像に対するセマンティックセグメンテーションの実行結果とを結合したデータの入力に応じて当該画像よりも画角が広い画像を生成する画像生成部の学習を、前記入力データを入力として用いることで実行する学習部と、
を含むことを特徴とする学習装置。 - 前記画像取得部は、前記入力画像と前記結果データとが結合された前記入力データの入力に応じて前記画像生成部が生成する画像とは異なる、当該入力画像よりも画角が広い学習画像をさらに取得し、
前記学習部は、前記入力画像と前記結果データとが結合された前記入力データの入力に応じて前記画像生成部が生成する画像と、前記学習画像と、に基づいて、前記画像生成部の学習を実行する、
ことを特徴とする請求項1に記載の学習装置。 - 入力画像を取得する画像取得部と、
前記入力画像に対するセマンティックセグメンテーションの実行結果を示す結果データを取得する結果データ取得部と、
前記入力画像と前記結果データとが結合された入力データを生成する入力データ生成部と、
学習入力画像と、当該学習入力画像に対するセマンティックセグメンテーションの実行結果を示す学習結果データと、が結合された学習入力データを入力として用いることで学習が実行された学習済の機械学習モデルである、前記入力データの入力に応じて前記入力画像よりも画角が広い画像を生成する画像生成部と、
を含むことを特徴とする画像生成装置。 - 入力画像を取得するステップと、
前記入力画像に対するセマンティックセグメンテーションの実行結果を示す結果データを取得するステップと、
前記入力画像と前記結果データとが結合された入力データを生成するステップと、
画像と当該画像に対するセマンティックセグメンテーションの実行結果とを結合したデータの入力に応じて当該画像よりも画角が広い画像を生成する画像生成部の学習を、前記入力データを入力として用いることで実行するステップと、
を含むことを特徴とする学習方法。 - 入力画像を取得するステップと、
前記入力画像に対するセマンティックセグメンテーションの実行結果を示す結果データを取得するステップと、
前記入力画像と前記結果データとが結合された入力データを生成するステップと、
学習入力画像と、当該学習入力画像に対するセマンティックセグメンテーションの実行結果を示す学習結果データと、が結合された学習入力データを入力として用いることで学習が実行された学習済の機械学習モデルが、前記入力データの入力に応じて前記入力画像よりも画角が広い画像を生成するステップと、
を含むことを特徴とする画像生成方法。 - 入力画像を取得する手順、
前記入力画像に対するセマンティックセグメンテーションの実行結果を示す結果データを取得する手順、
前記入力画像と前記結果データとが結合された入力データを生成する手順、
画像と当該画像に対するセマンティックセグメンテーションの実行結果とを結合したデータの入力に応じて当該画像よりも画角が広い画像を生成する画像生成部の学習を、前記入力データを入力として用いることで実行する手順、
をコンピュータに実行させることを特徴とするプログラム。 - 入力画像を取得する手順、
前記入力画像に対するセマンティックセグメンテーションの実行結果を示す結果データを取得する手順、
前記入力画像と前記結果データとが結合された入力データを生成する手順、
学習入力画像と、当該学習入力画像に対するセマンティックセグメンテーションの実行結果を示す学習結果データと、が結合された学習入力データを入力として用いることで学習が実行された学習済の機械学習モデルが、前記入力データの入力に応じて前記入力画像よりも画角が広い画像を生成する手順、
をコンピュータに実行させることを特徴とするプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/019853 WO2019224947A1 (ja) | 2018-05-23 | 2018-05-23 | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019224947A1 JPWO2019224947A1 (ja) | 2021-02-12 |
JP6892557B2 true JP6892557B2 (ja) | 2021-06-23 |
Family
ID=68615776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020520935A Active JP6892557B2 (ja) | 2018-05-23 | 2018-05-23 | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11900258B2 (ja) |
JP (1) | JP6892557B2 (ja) |
WO (1) | WO2019224947A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7375666B2 (ja) * | 2020-04-20 | 2023-11-08 | オムロン株式会社 | 推定装置、学習装置、教師データ作成装置、推定方法、学習方法、教師データ作成方法、及びプログラム |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4686200B2 (ja) * | 2005-01-27 | 2011-05-18 | パナソニック株式会社 | 画像変換方法および装置 |
JP5199992B2 (ja) * | 2009-12-28 | 2013-05-15 | シャープ株式会社 | 画像処理装置 |
US11094137B2 (en) * | 2012-02-24 | 2021-08-17 | Matterport, Inc. | Employing three-dimensional (3D) data predicted from two-dimensional (2D) images using neural networks for 3D modeling applications and other applications |
US20140267587A1 (en) * | 2013-03-14 | 2014-09-18 | Microsoft Corporation | Panorama packet |
US20150130799A1 (en) * | 2013-11-12 | 2015-05-14 | Fyusion, Inc. | Analysis and manipulation of images and video for generation of surround views |
JP2016057918A (ja) * | 2014-09-10 | 2016-04-21 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
KR102288280B1 (ko) * | 2014-11-05 | 2021-08-10 | 삼성전자주식회사 | 영상 학습 모델을 이용한 영상 생성 방법 및 장치 |
JP6427042B2 (ja) * | 2015-03-06 | 2018-11-21 | 株式会社沖データ | 画像処理装置 |
US10360572B2 (en) * | 2016-03-07 | 2019-07-23 | Ricoh Company, Ltd. | Image processing system, method and computer program product for evaluating level of interest based on direction of human action |
US9916522B2 (en) * | 2016-03-11 | 2018-03-13 | Kabushiki Kaisha Toshiba | Training constrained deconvolutional networks for road scene semantic segmentation |
JP6759692B2 (ja) * | 2016-05-10 | 2020-09-23 | トヨタ自動車株式会社 | 画像認識システム |
US10282815B2 (en) * | 2016-10-28 | 2019-05-07 | Adobe Inc. | Environmental map generation from a digital image |
WO2018092379A1 (ja) * | 2016-11-17 | 2018-05-24 | ソニー株式会社 | 画像処理装置と画像処理方法 |
US10430978B2 (en) * | 2017-03-02 | 2019-10-01 | Adobe Inc. | Editing digital images utilizing a neural network with an in-network rendering layer |
US10607329B2 (en) * | 2017-03-13 | 2020-03-31 | Adobe Inc. | Illumination estimation from a single image |
US10609286B2 (en) * | 2017-06-13 | 2020-03-31 | Adobe Inc. | Extrapolating lighting conditions from a single digital image |
JP7026456B2 (ja) * | 2017-07-05 | 2022-02-28 | キヤノン株式会社 | 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム |
US11144786B2 (en) * | 2017-11-02 | 2021-10-12 | Canon Kabushiki Kaisha | Information processing apparatus, method for controlling information processing apparatus, and storage medium |
JP7149707B2 (ja) * | 2018-01-15 | 2022-10-07 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム、並びに、運転制御システム |
-
2018
- 2018-05-23 JP JP2020520935A patent/JP6892557B2/ja active Active
- 2018-05-23 US US17/052,599 patent/US11900258B2/en active Active
- 2018-05-23 WO PCT/JP2018/019853 patent/WO2019224947A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US11900258B2 (en) | 2024-02-13 |
US20210158482A1 (en) | 2021-05-27 |
WO2019224947A1 (ja) | 2019-11-28 |
JPWO2019224947A1 (ja) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846836B2 (en) | View synthesis using deep convolutional neural networks | |
JP7051267B2 (ja) | 画像検出方法、装置、電子設備、記憶媒体、及びプログラム | |
US20150215590A1 (en) | Image demosaicing | |
WO2014187223A1 (en) | Method and apparatus for identifying facial features | |
CN113688907B (zh) | 模型训练、视频处理方法,装置,设备以及存储介质 | |
WO2023160513A1 (zh) | 3d素材的渲染方法、装置、设备及存储介质 | |
CN111179159A (zh) | 消除视频中目标影像的方法、装置、电子设备及存储介质 | |
CN107766803B (zh) | 基于场景分割的视频人物装扮方法、装置及计算设备 | |
JP6980913B2 (ja) | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム | |
US20240161391A1 (en) | Relightable neural radiance field model | |
CN109065001B (zh) | 一种图像的降采样方法、装置、终端设备和介质 | |
CN114663570A (zh) | 贴图生成方法、装置、电子装置及可读存储介质 | |
JP6892557B2 (ja) | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム | |
CN108734712B (zh) | 背景分割的方法、装置及计算机存储介质 | |
CN115222859A (zh) | 图像动画化 | |
JPWO2018211602A1 (ja) | 学習装置、推定装置、学習方法及びプログラム | |
JP6967150B2 (ja) | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム | |
CN115272575B (zh) | 图像生成方法及装置、存储介质和电子设备 | |
CN116468745A (zh) | 图像处理方法、相关设备及计算机可读存储介质 | |
CN111986083A (zh) | 一种图像自动组合的方法和装置 | |
CN113592875A (zh) | 数据处理方法、图像处理方法、存储介质及计算设备 | |
TWI831552B (zh) | 圖像識別模型訓練方法、圖像深度識別方法及相關設備 | |
US12100096B2 (en) | Method, electronic device, and computer program product for rendering target scene | |
WO2024007968A1 (en) | Methods and system for generating an image of a human | |
KR20240049098A (ko) | 뷰 증강 기반의 뉴럴 렌더링 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6892557 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |