JP2023110921A - 画像拡張ニューラルネットワーク - Google Patents
画像拡張ニューラルネットワーク Download PDFInfo
- Publication number
- JP2023110921A JP2023110921A JP2023068765A JP2023068765A JP2023110921A JP 2023110921 A JP2023110921 A JP 2023110921A JP 2023068765 A JP2023068765 A JP 2023068765A JP 2023068765 A JP2023068765 A JP 2023068765A JP 2023110921 A JP2023110921 A JP 2023110921A
- Authority
- JP
- Japan
- Prior art keywords
- image
- neural network
- training
- augmented
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 205
- 238000000034 method Methods 0.000 claims abstract description 74
- 230000008569 process Effects 0.000 claims abstract description 29
- 238000003860 storage Methods 0.000 claims abstract description 22
- 230000003190 augmentative effect Effects 0.000 claims description 145
- 238000012549 training Methods 0.000 claims description 132
- 238000012545 processing Methods 0.000 claims description 40
- 230000004044 response Effects 0.000 claims description 34
- 230000003416 augmentation Effects 0.000 claims description 28
- 238000010606 normalization Methods 0.000 claims description 6
- 230000001143 conditioned effect Effects 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 238000011524 similarity measure Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 abstract description 14
- 238000009826 distribution Methods 0.000 description 50
- 230000006870 function Effects 0.000 description 37
- 230000005540 biological transmission Effects 0.000 description 19
- 238000010801 machine learning Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000013515 script Methods 0.000 description 8
- 230000003750 conditioning effect Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000026676 system process Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000009334 Singa Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
Description
D=DO+<DN,S> (2)
式中、DOは、弁別ニューラルネットワークの最終ニューラルネットワーク層のスカラー出力であり、DNは、弁別ニューラルネットワークの中間出力(たとえば、中間層218によって生成される)であり、Sは、ターゲット拡張画像の意味表現であり、<・, ・>は、ドット積演算を指す。
102 画像
104 拡張画像
106 列
108 生成ネットワーク入力
110 生成ニューラルネットワーク
112 ベースライン画像
114 マスク画像
116 敵対的訓練システム
200 データフロー
202 弁別ニューラルネットワーク
204 敵対的損失目的関数
206 ターゲット拡張画像
208 ベースライン画像
210 マスク画像
212 訓練拡張画像
214 正規化エンジン
216 ニューラルネットワーク層
218 中間層
220 再構成目的関数
300 拡張画像
302 元の画像
400 環境
402 ネットワーク
404 電子ドキュメントサーバ
406 クライアントデバイス
408 デジタルコンポーネントサーバ
410 デジタルコンポーネント配信システム
412 コンポーネント要求
414 複数のコンピューティングデバイスのセット
416 デジタルコンポーネントデータベース
417a~417c タスク
418a~418c 結果
420 応答データ
421 サーバ要求(SR)
422 デジタルコンポーネントデータ(DCデータ)
450 検索システム
452 検索インデックス
502 ロゴ
504 テキストのセグメント
506 対話型要素
508 第1の部分
510 第2の部分
602 追加の要素
604 第1の部分
606 第2の部分
700 ユーザインターフェース
702 画像
704-A~C 拡張画像
706 マウス
900 コンピュータシステム
910 プロセッサ
920 メモリ
930 記憶デバイス
940 入出力デバイス
950 システムバス
960 表示デバイス
Claims (20)
複数の生成ニューラルネットワークパラメータを有する生成ニューラルネットワークに、提供された画像を含む入力を提供するステップを含み、
前記生成ニューラルネットワークは、拡張画像を生成するために、前記複数の生成ニューラルネットワークパラメータの訓練された値に従って前記入力を処理し、
前記拡張画像は、(i)前記提供された画像よりも多くの行、多くの列、または両方を有し、(ii)前記提供された画像の現実的な拡張であると予測され、
前記生成ニューラルネットワークは、敵対的損失目的関数を使用して訓練されている、
方法。
前記提供された画像が前記要求に応答していると決定するステップと、
前記拡張画像を生成した後、前記要求に応答して前記拡張画像を提供するステップと
をさらに含む請求項1に記載の方法。
をさらに含む請求項2に記載の方法。
前記要求に応答して前記拡張画像を提供するステップは、前記拡張画像の拡張部分上に前記追加要素をオーバーレイするステップを含む、
請求項2~4のいずれか一項に記載の方法。
前記拡張画像と同じ数の行および列を有するベースライン画像であり、(i)前記提供された画像に対応する第1の部分、および(ii)デフォルトの画素値を有する第2の部分を含む、ベースライン画像と、
前記拡張画像と同じ数の行および列を有するマスク画像であり、前記ベースライン画像の前記第1の部分および前記第2の部分を識別する、マスク画像と
を含む、請求項1~9のいずれか一項に記載の方法。
請求項10に記載の方法。
訓練画像を拡張する訓練拡張画像を生成するために、前記生成ニューラルネットワークを使用し、前記生成ニューラルネットワークパラメータの現在の値に従って、前記訓練画像を含む訓練入力を処理するステップと、
前記訓練拡張画像に基づいて弁別ニューラルネットワーク入力を生成するステップと、
前記生成ニューラルネットワークを使用して前記弁別ニューラルネットワーク入力が生成された可能性を特徴付ける弁別出力を生成するために、前記弁別ニューラルネットワークを使用し、前記弁別ニューラルネットワークパラメータの現在の値に従って、前記弁別ニューラルネットワーク入力を処理するステップと、
前記敵対的損失目的関数に基づいて前記生成ニューラルネットワークパラメータの現在値を調整するステップであり、前記敵対的損失目的関数は、前記生成ニューラルネットワークを使用して前記弁別ニューラルネットワーク入力が生成された前記可能性を特徴付ける前記弁別出力に依存する、調整するステップと
を含む、請求項12に記載の方法。
前記訓練画像に対応する前記訓練拡張画像の一部を前記訓練画像で上書きするステップを含む、
請求項13に記載の方法。
をさらに含む請求項13または14に記載の方法。
に基づく、請求項16または17に記載の方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962852949P | 2019-05-24 | 2019-05-24 | |
US62/852,949 | 2019-05-24 | ||
US201962854833P | 2019-05-30 | 2019-05-30 | |
US62/854,833 | 2019-05-30 | ||
JP2021558609A JP7267453B2 (ja) | 2019-05-24 | 2019-07-19 | 画像拡張ニューラルネットワーク |
PCT/US2019/042509 WO2020242508A1 (en) | 2019-05-24 | 2019-07-19 | Image extension neural networks |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021558609A Division JP7267453B2 (ja) | 2019-05-24 | 2019-07-19 | 画像拡張ニューラルネットワーク |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023110921A true JP2023110921A (ja) | 2023-08-09 |
JP7477682B2 JP7477682B2 (ja) | 2024-05-01 |
Family
ID=67515178
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021558609A Active JP7267453B2 (ja) | 2019-05-24 | 2019-07-19 | 画像拡張ニューラルネットワーク |
JP2023068765A Active JP7477682B2 (ja) | 2019-05-24 | 2023-04-19 | 画像拡張ニューラルネットワーク |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021558609A Active JP7267453B2 (ja) | 2019-05-24 | 2019-07-19 | 画像拡張ニューラルネットワーク |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220148299A1 (ja) |
EP (1) | EP3762873A1 (ja) |
JP (2) | JP7267453B2 (ja) |
CN (1) | CN113646773A (ja) |
WO (1) | WO2020242508A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11455531B2 (en) * | 2019-10-15 | 2022-09-27 | Siemens Aktiengesellschaft | Trustworthy predictions using deep neural networks based on adversarial calibration |
US20210192684A1 (en) * | 2019-12-24 | 2021-06-24 | Nvidia Corporation | Panorama generation using one or more neural networks |
CN113034348A (zh) * | 2021-03-24 | 2021-06-25 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、存储介质及设备 |
CN115100472B (zh) * | 2022-06-20 | 2023-06-27 | 北京达佳互联信息技术有限公司 | 展示对象识别模型的训练方法、装置和电子设备 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7154538B1 (en) * | 1999-11-15 | 2006-12-26 | Canon Kabushiki Kaisha | Image processing system, image processing method, image upload system, storage medium, and image upload server |
US11074495B2 (en) * | 2013-02-28 | 2021-07-27 | Z Advanced Computing, Inc. (Zac) | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
KR101508977B1 (ko) * | 2012-08-16 | 2015-04-08 | 네이버 주식회사 | 이미지 분석에 의한 이미지 자동 편집 장치, 방법 및 컴퓨터 판독 가능한 기록 매체 |
JP2015041138A (ja) * | 2013-08-20 | 2015-03-02 | 昭芳 村岡 | インターネットを用いた地域対応型の共同広告方法及びサイトシステム |
US9990712B2 (en) * | 2015-04-08 | 2018-06-05 | Algotec Systems Ltd. | Organ detection and segmentation |
US10319076B2 (en) * | 2016-06-16 | 2019-06-11 | Facebook, Inc. | Producing higher-quality samples of natural images |
US20180349526A1 (en) * | 2016-06-28 | 2018-12-06 | Cognata Ltd. | Method and system for creating and simulating a realistic 3d virtual world |
US11188783B2 (en) | 2017-10-19 | 2021-11-30 | Nokia Technologies Oy | Reverse neural network for object re-identification |
JP2019079114A (ja) | 2017-10-20 | 2019-05-23 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
US11741693B2 (en) | 2017-11-15 | 2023-08-29 | Palo Alto Research Center Incorporated | System and method for semi-supervised conditional generative modeling using adversarial networks |
CN108197525B (zh) * | 2017-11-20 | 2020-08-11 | 中国科学院自动化研究所 | 人脸图像生成方法及装置 |
CN108875510B (zh) * | 2017-11-28 | 2020-12-01 | 北京旷视科技有限公司 | 图像处理的方法、装置、系统及计算机存储介质 |
CN109360232B (zh) * | 2018-09-10 | 2021-04-06 | 南京邮电大学 | 基于条件生成对抗网络的室内场景布局估计方法和装置 |
-
2019
- 2019-07-19 WO PCT/US2019/042509 patent/WO2020242508A1/en unknown
- 2019-07-19 JP JP2021558609A patent/JP7267453B2/ja active Active
- 2019-07-19 US US17/438,687 patent/US20220148299A1/en active Pending
- 2019-07-19 CN CN201980095109.9A patent/CN113646773A/zh active Pending
- 2019-07-19 EP EP19749105.3A patent/EP3762873A1/en active Pending
-
2023
- 2023-04-19 JP JP2023068765A patent/JP7477682B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP7267453B2 (ja) | 2023-05-01 |
JP2022533519A (ja) | 2022-07-25 |
US20220148299A1 (en) | 2022-05-12 |
CN113646773A (zh) | 2021-11-12 |
WO2020242508A1 (en) | 2020-12-03 |
JP7477682B2 (ja) | 2024-05-01 |
EP3762873A1 (en) | 2021-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7267453B2 (ja) | 画像拡張ニューラルネットワーク | |
US20210081796A1 (en) | Neural architecture search for dense image prediction tasks | |
CN110458918B (zh) | 用于输出信息的方法和装置 | |
US20100312608A1 (en) | Content advertisements for video | |
US9678928B1 (en) | Webpage partial rendering engine | |
CN110692054A (zh) | 预测数字分量的不可观察参数 | |
JP7457800B2 (ja) | 画像置換修復 | |
CN110071938B (zh) | 虚拟形象互动方法、装置、电子设备及可读存储介质 | |
US10783408B2 (en) | Identification of fonts in an application | |
CN111866610A (zh) | 用于生成信息的方法和装置 | |
US11257217B2 (en) | Image segmentation using neural networks | |
CN111800671A (zh) | 用于对齐段落和视频的方法和装置 | |
JP7299327B2 (ja) | ビデオの生成 | |
US10339469B2 (en) | Self-adaptive display layout system | |
WO2020154537A1 (en) | Convolutional neural networks with soft kernel selection | |
CN111897950A (zh) | 用于生成信息的方法和装置 | |
US20150046270A1 (en) | System and Method of Using Artificial Intelligence to Valuate Advertisements Embedded Within Images | |
US20120323702A1 (en) | System and method for client-server cooperation in selecting content for display | |
US20220004849A1 (en) | Image processing neural networks with dynamic filter activation | |
CN109472028B (zh) | 用于生成信息的方法和装置 | |
CN116521990A (zh) | 物料处理的方法、装置、电子设备和计算机可读介质 | |
JP7014928B1 (ja) | コンテキスト適応型スキャン | |
US20220172248A1 (en) | Method and a system for selecting a targeted message to be included within a web resource | |
US10740571B1 (en) | Generating neural network outputs using insertion operations | |
US10902479B2 (en) | Programmatic generation and optimization of images for a computerized graphical advertisement display |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230508 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230508 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240321 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7477682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |