KR20230146716A - 이미지 매팅 방법 및 그 장치 - Google Patents
이미지 매팅 방법 및 그 장치 Download PDFInfo
- Publication number
- KR20230146716A KR20230146716A KR1020220045443A KR20220045443A KR20230146716A KR 20230146716 A KR20230146716 A KR 20230146716A KR 1020220045443 A KR1020220045443 A KR 1020220045443A KR 20220045443 A KR20220045443 A KR 20220045443A KR 20230146716 A KR20230146716 A KR 20230146716A
- Authority
- KR
- South Korea
- Prior art keywords
- map
- image
- feature map
- foreground
- saliency
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000013135 deep learning Methods 0.000 claims abstract description 18
- 238000009738 saturating Methods 0.000 claims abstract description 6
- 238000011176 pooling Methods 0.000 claims description 16
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 20
- 238000000605 extraction Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 3
- 206010021403 Illusion Diseases 0.000 description 2
- 230000003796 beauty Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G06T5/008—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/94—Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Packaging Of Special Articles (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 딥러닝 기반 모델의 상세 구조를 도시한 도면.
도 3은 본 발명의 일 실시예에 따른 정제 모델의 잔차 모듈과 CBAM 결합 구조를 도시한 도면.
도 4는 본 발명의 일 실시예에 따른 정제 모델의 디코더 업샘플링 구조를 도시한 도면.
도 5는 본 발명의 일 실시예에 따른 정제 모델의 인코더의 다운샘플링 구조를 도시한 도면.
도 6은 본 발명의 일 실시예에 따른 전경 맵과 돌출 맵 추출 결과를 도시한 도면.
도 7은 본 발명의 일 실시예에 따른 각 단계의 이미지 매트화 결과를 도시한 도면.
도 8은 종래와 본 발명의 일 실시예에 따른 돌출 맵 추출 결과를 비교한 도면.
도 9는 본 발명의 일 실시예에 따른 이미지 매트화 결과를 도시한 도면.
도 10은 본 발명의 일 실시예에 따른 이미지 매팅 장치의 내부 구성을 개략적으로 도시한 블록도.
1010: 추출부
1020: 이미지 매팅부
1030: 메모리
1040: 프로세서
Claims (12)
- (a) 입력 이미지를 딥러닝 기반 모델에 적용하여 타겟 객체에 대한 전경 맵과 돌출 맵을 각각 추출하는 단계;
(b) 배경 이미지의 크기를 고려하여 상기 전경 맵과 상기 돌출 맵의 크기를 조절하는 단계;
(c) 상기 크기가 조절된 돌출 맵을 보간(interpolation)하고 제로 패딩(zero padding)하여 상기 배경 이미지의 타겟 위치에 돌출 영역을 생성하는 단계; 및
(d) 상기 돌출 영역에 상기 크기가 조절된 전경 맵을 포화시키는 단계를 포함하는 이미지 매팅 방법.
- 제1 항에 있어서,
상기 돌출 영역은 상기 배경 이미지와 상기 돌출 맵의 채도 계산을 수행한 후 임계치를 기반으로 상기 돌출 맵에 상응하는 영역이 제1 값으로 변경되어 생성되는 것을 특징으로 하는 이미지 매팅 방법.
- 제2 항에 있어서,
상기 임계치 이상인 경우, 상기 돌출 영역 중 어느 하나의 픽셀이 제1 값으로 변경하고, 상기 임계치 미만이면 상기 전경 맵 중 어느 하나의 픽셀값을 제1 값으로 변경하는 것을 특징으로 하는 이미지 매팅 방법.
- 제1 항에 있어서,
상기 딥러닝 기반 모델은,
상기 입력 이미지를 입력받아 조악한(coarse) 특징맵을 생성하는 예측 모델; 및
상기 조악한 특징맵을 정제하여 정제된 특징맵을 생성하는 정제 모델을 포함하되,
상기 정제 모델은 잔차 블록과 컨볼루션 블록 어텐션 모듈을 결합한 구조이되,
상기 잔차 블록은 인코더-디코더 구조를 가지되, 상기 인코더는 맥스 풀링을 적용하여 압축한 제1 결과값과 복수의 컨볼루션 레이어를 통해 압축한 제2 결과값을 더하여 압축된 특징맵을 출력하는 것을 특징으로 하는 이미지 매팅 방법.
- 제4 항에 있어서,
상기 디코더는,
상기 압축된 특징맵을 업샘플링하되, 저 레벨 특징맵은 3 x 3 컨볼루션 연산하고, 고 레벨 특징맵은 글로벌 풀링(Global pooling)을 적용한 후 1 x 1 컨볼루션 연산한 후 상기 저 레벨 특징맵과 곱하며 점진적으로 업샘플링되는 것을 특징으로 하는 이미지 매팅 방법.
- 제1 항에 있어서,
상기 (b) 단계는,
상기 전경 맵과 상기 돌출 맵의 크기를 절반으로 줄이는 것을 특징으로 하는 이미지 매팅 방법.
- 제1 항 내지 제6 항 중 어느 하나의 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체.
- 적어도 하나의 명령어를 저장하는 메모리;
상기 메모리에 저장된 명령어를 실행하는 프로세서를 포함하되,
상기 프로세서에 의해 실행된 명령어는,
(a) 입력 이미지를 딥러닝 기반 모델에 적용하여 타겟 객체에 대한 전경 맵과 돌출 맵을 각각 추출하는 단계;
(b) 배경 이미지의 크기를 고려하여 상기 전경 맵과 상기 돌출 맵의 크기를 조절하는 단계;
(c) 상기 배경 이미지의 타겟 위치에 상기 크기가 조절된 돌출 맵을 보간 (interpolation)하고 제로 패딩(zero padding)하여 돌출 영역을 생성하는 단계; 및
(d) 상기 돌출 영역에 상기 크기가 조절된 전경 맵을 포화시키는 단계를 수행하는 것을 특징으로 하는 이미지 매팅 장치.
- 제8 항에 있어서,
상기 (c) 단계는,
상기 배경 이미지와 상기 돌출 맵의 채도 계산을 수행하여 임계치를 기반으로 상기 돌출 영역을 생성하는 것을 특징으로 하는 이미지 매팅 장치.
- 제9 항에 있어서,
상기 (c) 단계는, 상기 임계치 이상인 경우, 상기 배경 이미지의 돌출 영역 중 어느 하나의 픽셀이 제1 값으로 변경되고, 상기 임계치 미만이면 상기 전경 맵 중 어느 하나의 픽셀값이 제1 값으로 변경되는 것을 특징으로 하는 이미지 매팅 장치.
- 제7 항에 있어서,
상기 딥러닝 기반 모델은,
상기 입력 이미지를 입력받아 조악한(coarse) 특징맵을 생성하는 예측 모델; 및
상기 조악한 특징맵을 정제하여 정제된 특징맵을 생성하는 정제 모델을 포함하되,
상기 정제 모델은 잔차 블록과 컨볼루션 블록 어텐션 모듈을 결합한 구조이되,
상기 잔차 블록은 인코더-디코더 구조를 가지되, 상기 인코더는 맥스 풀링을 적용하여 압축한 제1 결과값과 복수의 컨볼루션 레이어를 통해 압축한 제2 결과값을 더하여 압축된 특징맵을 출력하는 것을 특징으로 하는 이미지 매팅 장치.
- 제11 항에 있어서,
상기 디코더는,
상기 압축된 특징맵을 업샘플링하되, 저 레벨 특징맵은 3 x 3 컨볼루션 연산하고, 고 레벨 특징맵은 글로벌 풀링(Global pooling)을 적용한 후 1 x 1 컨볼루션 연산한 후 상기 저 레벨 특징맵과 곱하며 점진적으로 업샘플링되는 것을 특징으로 하는 이미지 매팅 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220045443A KR102624296B1 (ko) | 2022-04-13 | 2022-04-13 | 이미지 매팅 방법 및 그 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220045443A KR102624296B1 (ko) | 2022-04-13 | 2022-04-13 | 이미지 매팅 방법 및 그 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230146716A true KR20230146716A (ko) | 2023-10-20 |
KR102624296B1 KR102624296B1 (ko) | 2024-01-11 |
Family
ID=88514701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220045443A KR102624296B1 (ko) | 2022-04-13 | 2022-04-13 | 이미지 매팅 방법 및 그 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102624296B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014658A (ja) * | 2010-07-05 | 2012-01-19 | Casio Comput Co Ltd | 画像処理装置及び方法、並びにプログラム |
KR102114738B1 (ko) * | 2019-10-21 | 2020-05-25 | 가천대학교 산학협력단 | 언노운 영역 감지를 통한 알파 매트의 트라이맵 자동 생성 방법 및 그 장치 |
KR20200131417A (ko) * | 2019-05-14 | 2020-11-24 | 경희대학교 산학협력단 | 이미지 세그멘테이션 방법, 장치 및 컴퓨터 프로그램 |
US20210225037A1 (en) * | 2019-05-09 | 2021-07-22 | Disney Enterprises, Inc. | Learning-based sampling for image matting |
-
2022
- 2022-04-13 KR KR1020220045443A patent/KR102624296B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014658A (ja) * | 2010-07-05 | 2012-01-19 | Casio Comput Co Ltd | 画像処理装置及び方法、並びにプログラム |
US20210225037A1 (en) * | 2019-05-09 | 2021-07-22 | Disney Enterprises, Inc. | Learning-based sampling for image matting |
KR20200131417A (ko) * | 2019-05-14 | 2020-11-24 | 경희대학교 산학협력단 | 이미지 세그멘테이션 방법, 장치 및 컴퓨터 프로그램 |
KR102114738B1 (ko) * | 2019-10-21 | 2020-05-25 | 가천대학교 산학협력단 | 언노운 영역 감지를 통한 알파 매트의 트라이맵 자동 생성 방법 및 그 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR102624296B1 (ko) | 2024-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111050219B (zh) | 用于利用空间-时间记忆网络处理视频内容的方法和系统 | |
US11430205B2 (en) | Method and apparatus for detecting salient object in image | |
CN109493350B (zh) | 人像分割方法及装置 | |
CN108010031B (zh) | 一种人像分割方法及移动终端 | |
CN112330574B (zh) | 人像修复方法、装置、电子设备及计算机存储介质 | |
CN106846241B (zh) | 一种图像融合的方法、装置和设备 | |
US12165292B2 (en) | Generating an image mask for a digital image by utilizing a multi-branch masking pipeline with neural networks | |
US11393100B2 (en) | Automatically generating a trimap segmentation for a digital image by utilizing a trimap generation neural network | |
JP2022501662A (ja) | 敵対的生成ネットワークのトレーニング方法、画像処理方法、デバイスおよび記憶媒体 | |
US9202258B2 (en) | Video retargeting using content-dependent scaling vectors | |
US8605118B2 (en) | Matrix generation apparatus, method, and program, and information processing apparatus | |
CN111915627A (zh) | 语义分割方法、网络、设备及计算机存储介质 | |
JP5695257B1 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
CN112330696A (zh) | 人脸分割方法、装置及计算机可读存储介质 | |
US20230053588A1 (en) | Generating synthesized digital images utilizing a multi-resolution generator neural network | |
US20220076119A1 (en) | Device and method of training a generative neural network | |
US20230325985A1 (en) | Systems and methods for inpainting images at increased resolution | |
CN114022497A (zh) | 一种图像处理方法及装置 | |
CN112700460A (zh) | 图像分割方法及系统 | |
CN115049556A (zh) | 一种基于StyleGAN的人脸图像修复方法 | |
KR101795952B1 (ko) | 2d 영상에 대한 깊이 영상 생성 방법 및 장치 | |
KR102166016B1 (ko) | 이미지 대 이미지의 변환을 위한 도메인 인식 기반의 변환 기법 | |
KR102624296B1 (ko) | 이미지 매팅 방법 및 그 장치 | |
KR20210049648A (ko) | 객체와 배경 이미지를 합성하여 실감형 포토 영상을 제공하는 영상 처리 시스템 및 방법 | |
KR101856426B1 (ko) | 3차원 기하 증강 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220413 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20230214 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20220413 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230525 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20231017 |
|
PG1501 | Laying open of application | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240109 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20240109 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |