JPWO2020091891A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2020091891A5 JPWO2020091891A5 JP2021512501A JP2021512501A JPWO2020091891A5 JP WO2020091891 A5 JPWO2020091891 A5 JP WO2020091891A5 JP 2021512501 A JP2021512501 A JP 2021512501A JP 2021512501 A JP2021512501 A JP 2021512501A JP WO2020091891 A5 JPWO2020091891 A5 JP WO2020091891A5
- Authority
- JP
- Japan
- Prior art keywords
- image
- geometry
- style
- network
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Claims (19)
- コンピュータ実装方法であって、
第1の画像ドメインから第2の画像ドメインへのジオメトリ変形用の第1の学習ネットワークを、前記第1及び第2の画像ドメイン内の画像が異なるスタイルを有し、前記画像内の対象が互いにジオメトリ変形を受けている、前記第1の画像ドメイン内の第1の画像及び前記第2の画像ドメイン内の第2の画像に基づいて決定することと、
前記第2の画像ドメインから前記第1の画像ドメインへのジオメトリ変形を前記第2の画像に対して実行して、前記第2の画像と同じスタイルを継承する中間画像を生成することと、
前記第1の画像及び前記中間画像に基づいて前記第1の画像ドメインから前記第2の画像ドメインへのスタイル変換用の第2の学習ネットワークを決定することと、
を含む方法。 - 前記第1の学習ネットワークを決定することが、
前記第1の画像内の対象のジオメトリの第1の目標点及び前記第2の画像内の対象のジオメトリの第2の目標点を抽出することと、
前記第1の目標点の第1の主成分分析(PCA)表現及び前記第2の目標点の第2のPCA表現を決定することと、
前記第1及び第2のPCA表現に基づいて前記第1の学習ネットワークを決定することと、
を含む、請求項1に記載の方法。 - 前記第1の学習ネットワークが第1の敵対的生成ネットワーク(GAN)に基づいており、前記第1の学習ネットワークを決定することが、
前記第1のGANの第1のサブネットワークを用いて、前記第1の画像ドメインから前記第2の画像ドメインへのジオメトリ変形を前記第1の画像に対して実行して、前記第1の画像内の対象の第1のジオメトリを第1の変形されたジオメトリに変形することと、
第1の平均ジオメトリを前記第1の画像ドメイン内の複数の画像内の対象のジオメトリの平均とし、第2の平均ジオメトリを前記第2の画像ドメイン内の複数の画像内の対象のジオメトリの平均として、前記第1のジオメトリと前記第1の平均ジオメトリとの第1の差異及び前記第1の変形されたジオメトリと前記第2の平均ジオメトリとの第2の差異を決定することと、
前記第1と第2の差異間の差異が減少するように前記第1のGANの前記第1のサブネットワークを更新することとを含み、
前記更新された第1のサブネットワークを前記第1の学習ネットワークとして決定する、請求項1に記載の方法。 - 前記第1のGANの前記第1のサブネットワークを更新することが更に、
前記第1のGANの第2のサブネットワークを用いて、前記第2の画像ドメインから前記第1の画像ドメインへの前記ジオメトリ変形を前記第2の画像に対して実行して、前記第2の画像内の対象の第2のジオメトリを第2の変形されたジオメトリに変形することと、
前記第2のジオメトリと前記第2の平均ジオメトリとの第3の差異及び前記第2の変形されたジオメトリと前記第1の平均ジオメトリとの第4の差異を決定することと、
前記第3と第4の差異間の差異も減少するように前記第1のGANの前記第1及び第2のサブネットワークを共同更新することとを含む、請求項3に記載の方法。 - 前記第2の画像ドメインから前記第1の画像ドメインへの前記ジオメトリ変形を実行することが、
前記更新された第2のサブネットワークを用いて、前記第2の画像ドメインから前記第1の画像ドメインへの前記ジオメトリ変形を実行することを含む、請求項4に記載の方法。 - 前記第2の学習ネットワークが第2の敵対的生成ネットワーク(GAN)に基づいており、前記第2の学習ネットワークを決定することが、
前記第2のGANの第1のサブネットワークを用いて、前記第1の画像ドメインから前記第2の画像ドメインへのスタイル変換を前記第1の画像に対して実行して、第1のスタイルの前記第1の画像を、第2のスタイルであって、前記第2の画像ドメイン内の複数のスタイルからランダムに選択された、第2のスタイルの第1の予測画像に変換することと、
前記第1の予測画像と前記第1の画像とのコンテンツの差異が減少するように前記第2のGANの前記第1のサブネットワークを更新することとを含み、
前記更新された第1のサブネットワークを前記第2の学習ネットワークとして決定する、請求項1に記載の方法。 - 前記第2のGANの前記第1のサブネットワークを更新することが更に、
前記第2のGANの第2のサブネットワークを用いて、前記第2の画像ドメインから前記第1の画像ドメインへのスタイル変換を前記中間画像に対して実行して、第3のスタイルの前記中間画像を、第4のスタイルであって、前記第1の画像ドメイン内の複数のスタイルからランダムに選択された、第4のスタイルの第2の予測画像に変換することと、
前記第2の予測画像と前記中間画像とのコンテンツの差異が減少するように前記第2のGANの前記第1及び第2のサブネットワークを共同更新することとを含む、請求項6に記載の方法。 - コンピュータ実装方法であって、
原画像に対してジオメトリ変形を実行して前記原画像内の対象の第1のジオメトリを第2のジオメトリに変形することと、
前記原画像に対してスタイル変換を実行して第1のスタイルの前記原画像を第2のスタイルの中間画像に変換することと、
前記第2のジオメトリに基づいて前記中間画像内の対象を変換して前記中間画像と同じ第2のスタイルを継承する目標画像を生成することと、
を含む方法。 - コンピュータ実装方法であって、
原画像に対してジオメトリ変形を実行して前記原画像内の対象の第1のジオメトリを第2のジオメトリに変形することと、
前記第2のジオメトリに基づいて前記原画像内の前記対象を変換して前記原画像と同じ第1のスタイルを継承する中間画像を生成することと、
前記中間画像に対してスタイル変換を実行して前記第1のスタイルの前記中間画像を第2のスタイルの目標画像に変換することと、
を含む方法。 - 前記ジオメトリ変形を実行することが、
前記第1のジオメトリを表す前記原画像の目標点を決定することと、
前記目標点の主成分分析(PCA)表現を生成することと、
前記PCA表現に対して前記ジオメトリ変形を実行することと、
変形された前記PCA表現に基づいて前記第2のジオメトリを表す変形された目標点を決定することと、
を含む、請求項8に記載の方法。 - 前記ジオメトリ変形を実行することが、
前記対象の変形程度の指標を取得することと、
前記変形程度に基づいて前記第1のジオメトリを前記第2のジオメトリに変換することと、
を含む、請求項8に記載の方法。 - 前記原画像に対してスタイル変換を実行することが、
前記原画像のコンテンツ関連特徴表現を抽出することと、
前記第2のスタイルに関連付けられた外観関連特徴表現を決定することと、
前記コンテンツ関連特徴表現及び前記外観関連特徴表現に基づいて前記中間画像を生成することと、
を含む、請求項8に記載の方法。 - 前記外観関連特徴表現を決定することが、
複数の所定の外観関連特徴表現から前記外観関連特徴表現をランダムに選択すること、又は
前記第2のスタイルに関係する取得指標又は前記第2のスタイルの基準画像に基づいて前記外観関連特徴表現を決定することを含む、請求項12に記載の方法。 - 前記ジオメトリ変形を実行することが、
第1の学習ネットワークであって、第1の敵対的生成ネットワーク(GAN)に基づいて決定された、第1の学習ネットワークを用いて前記ジオメトリ変形を実行することを含み、又は
前記スタイル変換を実行することが、第2の学習ネットワークであって、第2のGANネットワークに基づいて決定された、第2の学習ネットワークを用いて前記スタイル変換を実行することを含む、請求項8に記載の方法。 - 前記ジオメトリ変形を実行することが、
前記第1のジオメトリを表す前記原画像の目標点を決定することと、
前記目標点の主成分分析(PCA)表現を生成することと、
前記PCA表現に対して前記ジオメトリ変形を実行することと、
変形された前記PCA表現に基づいて前記第2のジオメトリを表す変形された目標点を決定することと、
を含む、請求項9に記載の方法。 - 前記ジオメトリ変形を実行することが、
前記対象の変形程度の指標を取得することと、
前記変形程度に基づいて前記第1のジオメトリを前記第2のジオメトリに変換することと、
を含む、請求項9に記載の方法。 - 前記原画像に対してスタイル変換を実行することが、
前記原画像のコンテンツ関連特徴表現を抽出することと、
前記第2のスタイルに関連付けられた外観関連特徴表現を決定することと、
前記コンテンツ関連特徴表現及び前記外観関連特徴表現に基づいて前記中間画像を生成することと、
を含む、請求項9に記載の方法。 - 前記外観関連特徴表現を決定することが、
複数の所定の外観関連特徴表現から前記外観関連特徴表現をランダムに選択すること、又は
前記第2のスタイルに関係する取得指標又は前記第2のスタイルの基準画像に基づいて前記外観関連特徴表現を決定することを含む、請求項17に記載の方法。 - 前記ジオメトリ変形を実行することが、
第1の学習ネットワークであって、第1の敵対的生成ネットワーク(GAN)に基づいて決定された、第1の学習ネットワークを用いて前記ジオメトリ変形を実行することを含み、又は
前記スタイル変換を実行することが、第2の学習ネットワークであって、第2のGANネットワークに基づいて決定された、第2の学習ネットワークを用いて前記スタイル変換を実行することを含む、請求項9に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811294026.6 | 2018-10-31 | ||
CN201811294026.6A CN111127304B (zh) | 2018-10-31 | 2018-10-31 | 跨域图像转换 |
PCT/US2019/049619 WO2020091891A1 (en) | 2018-10-31 | 2019-09-05 | Cross-domain image translation |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022503647A JP2022503647A (ja) | 2022-01-12 |
JPWO2020091891A5 true JPWO2020091891A5 (ja) | 2022-08-18 |
JP7373554B2 JP7373554B2 (ja) | 2023-11-02 |
Family
ID=67957460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021512501A Active JP7373554B2 (ja) | 2018-10-31 | 2019-09-05 | クロスドメイン画像変換 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11481869B2 (ja) |
EP (1) | EP3874458A1 (ja) |
JP (1) | JP7373554B2 (ja) |
KR (1) | KR102663519B1 (ja) |
CN (1) | CN111127304B (ja) |
WO (1) | WO2020091891A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111127304B (zh) * | 2018-10-31 | 2024-02-20 | 微软技术许可有限责任公司 | 跨域图像转换 |
US20200242736A1 (en) * | 2019-01-29 | 2020-07-30 | Nvidia Corporation | Method for few-shot unsupervised image-to-image translation |
US11556848B2 (en) * | 2019-10-21 | 2023-01-17 | International Business Machines Corporation | Resolving conflicts between experts' intuition and data-driven artificial intelligence models |
US20210141825A1 (en) * | 2019-11-12 | 2021-05-13 | Oath Inc. | Method and system for sketch based search |
US11450008B1 (en) * | 2020-02-27 | 2022-09-20 | Amazon Technologies, Inc. | Segmentation using attention-weighted loss and discriminative feature learning |
US11501107B2 (en) | 2020-05-07 | 2022-11-15 | Adobe Inc. | Key-value memory network for predicting time-series metrics of target entities |
JP7477864B2 (ja) | 2020-05-18 | 2024-05-02 | 国立大学法人山梨大学 | 画像生成方法、プログラム及び画像生成装置 |
CN111508048B (zh) * | 2020-05-22 | 2023-06-20 | 南京大学 | 一种可交互任意形变风格人脸漫画自动生成方法 |
CN111833238B (zh) * | 2020-06-01 | 2023-07-25 | 北京百度网讯科技有限公司 | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 |
CN111738910A (zh) * | 2020-06-12 | 2020-10-02 | 北京百度网讯科技有限公司 | 一种图像处理方法、装置、电子设备和存储介质 |
US11574500B2 (en) * | 2020-09-08 | 2023-02-07 | Samsung Electronics Co., Ltd. | Real-time facial landmark detection |
US20220121932A1 (en) * | 2020-10-16 | 2022-04-21 | Adobe Inc. | Supervised learning techniques for encoder training |
CN112991151B (zh) * | 2021-02-09 | 2022-11-22 | 北京字跳网络技术有限公司 | 图像处理方法、图像生成方法、装置、设备和介质 |
US20240062441A1 (en) * | 2021-02-15 | 2024-02-22 | Carnegie Mellon University | System and method for photorealistic image synthesis using unsupervised semantic feature disentanglement |
US20230070666A1 (en) * | 2021-09-03 | 2023-03-09 | Adobe Inc. | Neural network for image style translation |
US11900519B2 (en) * | 2021-11-17 | 2024-02-13 | Adobe Inc. | Disentangling latent representations for image reenactment |
KR102636217B1 (ko) * | 2023-04-14 | 2024-02-14 | 고려대학교산학협력단 | 가중 국소변환을 이용한 3차원 데이터 증강 방법 및 이를 위한 장치 |
KR102636155B1 (ko) * | 2023-07-18 | 2024-02-13 | 주식회사 젠젠에이아이 | 콘텐츠 코드를 이용한 이미지 생성 방법 및 시스템 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7483553B2 (en) | 2004-03-29 | 2009-01-27 | Microsoft Corporation | Caricature exaggeration |
US7660482B2 (en) * | 2004-06-23 | 2010-02-09 | Seiko Epson Corporation | Method and apparatus for converting a photo to a caricature image |
CN102096934B (zh) | 2011-01-27 | 2012-05-23 | 电子科技大学 | 一种基于机器学习的人脸卡通画生成方法 |
US10366306B1 (en) * | 2013-09-19 | 2019-07-30 | Amazon Technologies, Inc. | Item identification among item variations |
US9646195B1 (en) * | 2015-11-11 | 2017-05-09 | Adobe Systems Incorporated | Facial feature liquifying using face mesh |
CN106548208B (zh) | 2016-10-28 | 2019-05-28 | 杭州米绘科技有限公司 | 一种照片图像快速智能风格化方法 |
KR20230149868A (ko) | 2016-11-21 | 2023-10-27 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
US10916001B2 (en) * | 2016-11-28 | 2021-02-09 | Adobe Inc. | Facilitating sketch to painting transformations |
US10474929B2 (en) * | 2017-04-25 | 2019-11-12 | Nec Corporation | Cyclic generative adversarial network for unsupervised cross-domain image generation |
US10504267B2 (en) * | 2017-06-06 | 2019-12-10 | Adobe Inc. | Generating a stylized image or stylized animation by matching semantic features via an appearance guide, a segmentation guide, and/or a temporal guide |
US10565757B2 (en) * | 2017-06-09 | 2020-02-18 | Adobe Inc. | Multimodal style-transfer network for applying style features from multi-resolution style exemplars to input images |
US10430455B2 (en) * | 2017-06-09 | 2019-10-01 | Adobe Inc. | Sketch and style based image retrieval |
CN109426858B (zh) * | 2017-08-29 | 2021-04-06 | 京东方科技集团股份有限公司 | 神经网络、训练方法、图像处理方法及图像处理装置 |
US10748314B2 (en) * | 2018-02-15 | 2020-08-18 | Microsoft Technology Licensing, Llc | Controllable conditional image generation |
CN108257195A (zh) * | 2018-02-23 | 2018-07-06 | 深圳市唯特视科技有限公司 | 一种基于几何对比生成对抗网络的面部表情合成方法 |
CN108596024B (zh) * | 2018-03-13 | 2021-05-04 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
EP3605465B1 (en) * | 2018-07-30 | 2020-12-30 | Siemens Healthcare GmbH | A method for determining a correspondence between a source image and a reference image |
US11430084B2 (en) * | 2018-09-05 | 2022-08-30 | Toyota Research Institute, Inc. | Systems and methods for saliency-based sampling layer for neural networks |
CN111127304B (zh) * | 2018-10-31 | 2024-02-20 | 微软技术许可有限责任公司 | 跨域图像转换 |
KR20200063289A (ko) * | 2018-11-16 | 2020-06-05 | 삼성전자주식회사 | 영상 처리 장치 및 그 동작방법 |
CN113474654A (zh) * | 2018-12-04 | 2021-10-01 | 伊索普莱克西斯公司 | 用于鉴定、选择性消融和选择以及收集单细胞的系统、装置和方法 |
CN112926372B (zh) * | 2020-08-22 | 2023-03-10 | 清华大学 | 基于序列变形的场景文字检测方法及系统 |
-
2018
- 2018-10-31 CN CN201811294026.6A patent/CN111127304B/zh active Active
-
2019
- 2019-09-05 US US17/278,652 patent/US11481869B2/en active Active
- 2019-09-05 EP EP19769358.3A patent/EP3874458A1/en active Pending
- 2019-09-05 JP JP2021512501A patent/JP7373554B2/ja active Active
- 2019-09-05 KR KR1020217013184A patent/KR102663519B1/ko active IP Right Grant
- 2019-09-05 WO PCT/US2019/049619 patent/WO2020091891A1/en unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2020091891A5 (ja) | ||
JP6647632B2 (ja) | 機械学習用訓練データの生成 | |
US11568270B2 (en) | Non-transitory computer-readable storage medium storing improved generative adversarial network implementation program, improved generative adversarial network implementation apparatus, and learned model generation method | |
JP5446800B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110084193B (zh) | 用于面部图像生成的数据处理方法、设备和介质 | |
JP7106902B2 (ja) | 学習プログラム、学習方法および学習装置 | |
JP6158882B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
JP6962747B2 (ja) | データ合成装置および方法 | |
CN106960420B (zh) | 一种分段迭代匹配追踪算法的图像重构方法 | |
JPH10124535A (ja) | データベースの画像中のサンプルの探索方法 | |
Chetouani | Three-dimensional mesh quality metric with reference based on a support vector regression model | |
JP2008152619A (ja) | データ処理装置およびデータ処理プログラム | |
Gu et al. | Endoscopic single image super-resolution based on transformer and convolutional neural network | |
CN112529772B (zh) | 一种零样本设置下的无监督图像转换方法 | |
JP4883719B2 (ja) | 類似画像検索方法および装置 | |
JP5893318B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
WO2019116496A1 (ja) | 学習装置、学習方法、および記憶媒体 | |
WO2019116497A1 (ja) | 識別装置、識別方法、および記憶媒体 | |
JP2020087570A (ja) | 破面解析装置、学習済みモデル生成装置、破面解析方法、破面解析装置プログラム、および、学習済みモデル | |
JP6789460B1 (ja) | 破面解析装置、学習済みモデル生成装置、破面解析方法、破面解析プログラム、および、学習済みモデル | |
JP4550398B2 (ja) | 一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置 | |
CN114202024A (zh) | 一种多模态解耦生成模型的训练方法、系统及相关设备 | |
JP2011197954A (ja) | 信号処理装置及びプログラム | |
Ye et al. | Music style transfer with vocals based on CycleGAN | |
JP2020144411A (ja) | 属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム |