KR102610330B1 - 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치 - Google Patents

딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치 Download PDF

Info

Publication number
KR102610330B1
KR102610330B1 KR1020220043140A KR20220043140A KR102610330B1 KR 102610330 B1 KR102610330 B1 KR 102610330B1 KR 1020220043140 A KR1020220043140 A KR 1020220043140A KR 20220043140 A KR20220043140 A KR 20220043140A KR 102610330 B1 KR102610330 B1 KR 102610330B1
Authority
KR
South Korea
Prior art keywords
deep learning
exposure image
decomposition
common
image
Prior art date
Application number
KR1020220043140A
Other languages
English (en)
Other versions
KR20230088213A (ko
Inventor
김종옥
김종한
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Publication of KR20230088213A publication Critical patent/KR20230088213A/ko
Application granted granted Critical
Publication of KR102610330B1 publication Critical patent/KR102610330B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06T5/003
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/73Circuitry for compensating brightness variation in the scene by influencing the exposure time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치가 개시된다. 딥러닝 분해 기반 다중 노출 영상 융합 방법은, (a) 각 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분(common component)과 개별 성분(residual component)으로 각각 분해하는 단계; (b) 상기 각각의 개별 성분을 융합하고, 상기 각각의 공통 성분을 융합하는 단계; 및 (c) 상기 융합된 개별 성분과 상기 융합된 공통 성분을 더하여 재건 영상을 생성하는 단계를 포함한다.

Description

딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치{Deep learning decomposition-based multi-exposure image fusion method and apparatus}
본 발명은 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치에 관한 것이다.
육안으로 볼 수 있는 다이내믹 레인지는 상용 카메라 센서보다 훨씬 넓다. 자연스러운 장면의 경우 단일 노출 수준으로 촬영한 이미지는 다이내믹 레인지 측면에서 만족스러운 화질을 얻지 못하는 경우가 많다. 이미징 센서의 낮은 다이내믹 레인지로 인해 장면의 가시성이 낮다.
이미지 센서의 낮은 다이내믹 레이지는 이미지의 세부 사항(detail)과 대비(contrast) 측면에서 장면의 가시성을 낮춘다. 이러한 다이내믹 레인지 문제를 해결하기 위해 Mertens 등은 다중 노출 이미지 융합(MEF, 이하 MEF라 칭하기로 함)을 연구했다. MEF는 다양한 노출 수준을 가진 여러 LDR(Low Dynamic Range, 이하 LDR이라 칭하기로 함)이미지를 고품질 이미지로 병합하기 위해 HDR(High Dynamic Range, 이하 HDR이라 칭하기로 함) 이미징 기술이다. LDR 이미지에서 가시성은 불균일한 조명 환경과 카메라 노출 수준에 의해 크게 영향을 받는다. 예를 들어, 밝은 영역의 세부 정보는 과다 노출로 손실되는 반면 어두운 영역의 세부 정보는 노출 부족으로 손실된다. 이러한 문제를 해결하기 위해 많은 비-딥러닝 기반 연구가 수행되었으며 MEF 성능이 획기적으로 향상되었다.
그럼에도 불구하고, 종래의 방법들은 일부 나쁜 조건(너무 밝거나 너무 어두운)에서 심각한 시각적 부자연스러움(세부 사항 또는 색상 왜곡)을 만드는 문제점들이 존재한다.
본 발명은 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 딥러닝 네트워크상에서 성분을 분해하고, 그 특성을 확인하여 특성에 맞게 융합하여 융합 성능을 향상시킬 수 있는 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 딥러닝 네트워크에서 성분을 분리하고 성분에 맞는 융합 기법을 도입하여 디테일 소실 문제와 해일로 열화 발생 문제를 해결할 수 있는 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 Y-도메인에서의 융합이 아닌 RGB-도메인에서 융합을 도입하여 컬러 복원 측면에서 성능 개선에 기여할 수 있는 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치를 제공하기 위한 것이다.
본 발명의 일 측면에 따르면 딥러닝 분해 기반 다중 노출 영상 융합 방법이 제공된다.
본 발명의 일 실시예에 따르면, (a) 각 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분(common component)과 개별 성분(residual component)으로 각각 분해하는 단계; (b) 상기 각각의 개별 성분을 융합하고, 상기 각각의 공통 성분을 융합하는 단계; 및 (c) 상기 융합된 개별 성분과 상기 융합된 공통 성분을 더하여 재건 영상을 생성하는 단계를 포함하는 딥러닝 분해 기반 다중 노출 영상 융합 방법이 제공될 수 있다.
상기 딥러닝 모델은 동일한 장면에 대해 서로 다른 노출 조건으로 획득된 상기 각 다중 노출 영상이 각각 동일한 공통 성분을 가지도록 등화 손실을 고려하여 학습될 수 있다.
상기 딥러닝 모델은, 상기 분해된 각 공통 성분과 각 개별 성분이 상기 각 다중 노출 영상과 동일한 단일 영상으로 결합되도록 시각화 손실을 고려하여 가중치가 학습될 수 있다.
상기 (b) 단계에서, 공간 어텐션 가중치 맵을 이용하여 상기 각 개별 성분들을 융합할 수 있다.
상기 딥러닝 모델은, 상기 융합된 공통 성분과 상기 융합된 개별 성분으로 재구성된 출력 영상과 상기 다중 노출 영상과의 차이를 고려한 재구성 손실이 최소가 되도록 학습될 수 있다.
본 발명의 다른 측면에 따르면, 딥러닝 분해 기반 다중 노출 영상 융합 장치가 제공된다.
본 발명의 일 실시예에 따르면, 각 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분(common component)과 개별 성분(residual component)으로 각각 분해하는 분해부; 상기 각각의 개별 성분을 융합하고, 상기 각각의 공통 성분을 융합하는 융합부; 및 상기 융합된 개별 성분과 상기 융합된 공통 성분을 이용하여 재구성된 출력 영상을 생성하는 재구성부를 포함하되, 상기 딥러닝 모델은 각 다중 노출 영상을 분해한 각 공통 성분들간의 등화 손실이 최소가 되도록 학습되는 것을 특징으로 하는 딥러닝 분해 기반 다중 노출 영상 융합 장치가 제공될 수 있다.
본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치를 제공함으로써, 딥러닝 네트워크상에서 성분을 분해하고, 그 특성을 확인하여 특성에 맞게 융합하여 융합 성능을 향상시킬 수 있다.
또한, 본 발명은 딥러닝 네트워크에서 성분을 분리하고 성분에 맞는 융합 기법을 도입하여 디테일 소실 문제와 해일로 열화 발생 문제를 해결할 수 있는 이점도 있다.
또한, 본 발명은 Y-도메인에서의 융합이 아닌 RGB-도메인에서 융합을 도입하여 컬러 복원 측면에서 성능 개선에 기여할 수 있는 이점도 있다.
도 1은 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 방법을 나타낸 순서도.
도 2는 본 발명의 일 실시예에 따른 딥러닝 네트워크 아키텍처를 나타낸 도면,
도 3은 본 발명의 일 실시예에 따른 분해 모듈의 상세 구조를 도시한 도면.
도 4는 본 발명의 일 실시예에 따른 시각화 및 손실 함수를 설명하기 위해 도시한 도면.
도 5는 본 발명의 일 실시예에 따른 융합 모듈의 상세 구조를 도시한 도면.
도 6은 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 방법을 설명하기 위해 도시한 도면.
도 7은 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 장치의 내부 구성을 개략적으로 도시한 블록도.
도 8 내지 도 10은 종래와 본 발명의 일 실시예에 따른 다중 노출 영상 융합 결과를 비교한 도면.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 방법을 나타낸 순서도이고, 도 2는 본 발명의 일 실시예에 따른 딥러닝 네트워크 아키텍처를 나타낸 도면이고, 도 3은 본 발명의 일 실시예에 따른 분해 모듈의 상세 구조를 도시한 도면이며, 도 4는 본 발명의 일 실시예에 따른 시각화 및 손실 함수를 설명하기 위해 도시한 도면이며, 도 5는 본 발명의 일 실시예에 따른 융합 모듈의 상세 구조를 도시한 도면이고, 도 6은 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 방법을 설명하기 위해 도시한 도면이다.
단계 110에서 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)는 복수의 다중 노출 영상을 입력받는다.
여기서, 다중 노출 영상은 동일한 장면에 대해 서로 다른 노출 조건에 의해 획득(촬영)된 영상일 수 있다.
예를 들어, 도 2에 도시된 바와 같이, 다중 노출 영상은 저노출 영상, 과 노출 영상일 수 있다. 이와 같이, 다중 노출 영상은 노출 레벨을 달리하여 동일한 장면(scene)에 대해 획득되므로, 노출 시간에 따라 밝기(brightness), 대비(contrast), 가시성(visibility) 측면에서 서로 상이할 수 있다(도 2 참조).
단계 115에서 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)는 복수의 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분(common component)와 개별 성분(residual component)로 각각 분해한다.
도 2에는 딥러닝 모델의 전체 아키텍처가 도시되어 있다.
딥러닝 모델은 복수의 다중 노출 영상을 특징 레벨에서 공통 성분과 개별 성분으로 각각 분해함에 있어, 분해된 각각의 공통 성분들의 등화 손실을 고려할 수 있다.
이에 대해 보다 상세히 설명하기로 한다.
다중 노출 영상은 동일 장면에 대해 노출 시간을 달리하여 획득된 영상으로, 구조적 정보는 동일하며, 구조적 정보 이외의 개별 정보들은 상이할 수 있다. 즉, 장면에 대한 에지 성분과 같은 전체적인 구조 성분은 노출 시간이 달라지더라도 변하지 않는 공통 성분들이다.
본 발명의 일 실시예에서는 이러한 점을 감안하여 복수의 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분과 개별 성분으로 각각 분해할 수 있다.
도 3에는 딥러닝 모델의 분해 블록의 세부 구조가 도시되어 있다. 도 3을 참조하면, 딥러닝 모델의 분해 블록은 복수의 다중 노출 영상을 각각 분해함에 있어, 특징 레벨에서 공통 성분과 개별 성분으로 분해할 수 있다.
복수의 다중 노출 영상의 경우, 공통 성분은 서로 거의 동일하므로 정교하게 융합될 필요가 없으며, 구조 정보(예를 들어, 에지)를 강화하기 위해 여러 컨볼루션 레이어를 통해 융합될 수 있다. 개별 성분은 영상 융합시 상세 복원, 후광 인공물과 같은 융합된 영상의 품질에 크게 기여할 수 있다.
따라서, 공통 성분과 개별 성분간의 정확한 분해를 보정하기 위해 딥러닝 모델은 수학식 1과 같은 제약조건을 고려하여 학습될 수 있다.
여기서, 제약조건은 등화 손실로, 모든 입력 영상(즉, 다중 노출 영상)의 공통 성분은 모두 동일해야 한다는 것이다. 등화 손실을 수학식으로 나타내면 수학식 1과 같다.
여기서, 은 입력 이미지()의 공통 성분을 나타내고, n은 다중 노출 이미지의 개수를 나타낸다. 손실 함수()는 다중 노출 이미지들 사이의 차이를 최소로 하며, 유사한 공통 성분을 가지는 것을 의미한다. 즉, 딥러닝 모델은 등화 손실이 최소가 되도록 학습될 수 있다.
또한, 공통 성분()과 개별 성분()을 시각화하면 도 4와 같이 나타낼 수 있다. 이러한 공통 성분과 개별 성분을 시각적으로 확인하는 것은 매우 어렵다. 따라서, 분해된 공통 성분과 개별 성분을 이용하여 RGB 채널로 매핑하여 시각화할 수 있다.
분해된 공통 성분과 개별 성분을 결합하는 경우, 입력 영상(즉, 다중 노출 영상)과 동일한 단일 영상으로 결합되어야 한다. 이때, 분해된 공통 특징 성분과 개별 특징 성분의 재구성은 평균 제공 오차(MSE: Mean square error)로 측정될 수 있다.
각 공통 성분과 개별 성분은 각각 매핑 블록을 통과하며, 매핑 블록은 복수의 컨볼루션 레이어를 포함할 수 있다. 각 매핑 블록에 포함된 컨볼루션 레이어의 가중치는 각각의 특징에서 공유될 수 있다.
도 4에는 특징 분해 및 시각화와 이에 따른 손실 함수를 개략적으로 도시하고 있다. 도 4를 참조하여 이에 대해 보다 상세히 설명하기로 한다.
예를 들어, 도 4에 도시된 바와 같이, 제1 노출 영상(I1)과 제2 노출 영상(I2)를 가정하여 설명하기로 한다.
제1 노출 영상(I1)은 딥러닝 모델을 통해 특징 레벨에서 제1 공통 성분(C1, vis)과 제1 개별 성분(R1, vis)으로 분해될 수 있다. 또한, 제2 노출 영상(I2)은 딥러닝 모델을 통해 특징 레벨에서 제2 공통 성분(C2, vis)과 제2 개별 성분(R2, vis)으로 분해될 수 있다.
이때, 제1 노출 영상(I1)과 제2 노출 영상(I2)은 동일한 장면에 대해 노출 조건만 달리하여 획득된 영상이므로, 딥러닝 모델을 통해 특징 레벨에서 분해된 제1 공통 성분(C1, vis)과 제2 공통 성분(C2, vis)에 포함된 구조적 정보(예를 들어, 에지 정보)는 동일할 수 있다.
따라서, 딥러닝 모델은 제1 공통 성분(C1, vis)과 제2 공통 성분(C2, vis)의 등화 손실이 최소가 되도록 제1 노출 영상(I1)과 제2 노출 영상(I2)을 분해하도록 학습될 수 있다.
또한, 제1 공통 성분(C1, vis)과 제1 개별 성분(R1, vis)을 재구성한 영상()은 제1 노출 영상과 동일하도록 매핑 블록의 가중치가 조정될 수 있다.
즉, 딥러닝 모델은 시각화 손실이 최소가 되도록 가중치를 조절할 수 있다. 시각화 손실은 수학식 2와 같이 나타낼 수 있다.
여기서, 이다.
여기서, 는 입력 영상을 나타내고, 는 재구성된 영상을 나타내고, 는 공통 성분을 나타내며, 는 개별 성분을 나타낸다.
다시 정리하면, 딥러닝 모델은 등화 손실과 시각화 손실이 최소가 되도록 학습되며, 다중 노출 영상은 학습된 딥러닝 모델을 통해 공통 성분과 개별 성분으로 분해될 수 있다.
단계 120에서 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)는 공통 성분과 개별 성분을 융합한다.
예를 들어, 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)는 개별 성분들은 융합시, 공간 어텐션 가중치 맵을 적용하여 융합할 수 있다. HDR 재구성에 대한 정보의 유용성에 따라 각 입력 영상의 기여도가 다르다. 따라서, 딥러닝 모델은 학습 과정을 통해 픽셀 단위로 공간 어텐션 가중치 맵을 생성할 수 있다. 각각의 개별 성분에 대한 공간 어텐션 가중치 맵은 고품질의 융합을 위해 개별적으로 학습될 수 있다.
도 5에는 개별 성분들을 융합하는 과정이 도시되어 있다. 도 5에 도시된 바와 같이, 개별 성분은 각각 컨볼루션 레이어를 통과하며 공간 어텐션 가중치 맵이 생성될 수 있다.
개별 성분들을 융합한 결과는 수학식 3과 같이 나타낼 수 있다.
여기서, 는 공간 어텐션 가중치 맵을 나타내고, 는 개별 특징 성분을 나타낸다. 이와 같이, 공간 어텐션 가중치 맵을 적용하여 개별 성분들을 융합함으로써 후광 아티팩트를 피할 수 있는 이점이 있다.
공통 성분은 분해 과정에서 서로 동일하도록 제약되어 결과적으로 서로 매우 유사하게 분해될 수 있다. 따라서, 모든 입력(즉, 다중 노출 영상)의 공통 성분은 몇 개의 컨볼루션 레어잉와 연결하여 융합될 수 있다.
단계 125에서 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)는 융합된 공통 성분과 융합된 개별 성분을 이용하여 출력 영상을 재구성한다.
실제 영상과 재구성된 영상을 이용하여 재구성 손실을 계산할 수 있다.
이를 수학식으로 나타내면, 수학식 4와 같다.
여기서, Mout은 재구성된 영상을 나타내고, GT는 실제 영상을 나타낸다. 또한, SSIM(structural similarity index measure)은 시각적 화질 차이 평가 함수이다. SSIM은 공지된 기술이므로 이에 대한 상세한 설명은 생략하기로 한다. 따라서, 딥러닝 모델은 결과적으로 훈련 손실(L)을 고려하여 학습될 수 있다. 여기서, 훈련 손실은 등화 손실, 시각화 손실 및 재구성 손실이되, 이를 수학식으로 나타내면 수학식 5와 같다.
여기서, , , 은 각각 가중치를 나타낸다.
다시 정리하면, 본 발명의 일 실시예에 따르면, 다중 노출 영상은 딥러닝 모델에 의해 특징 레벨에서 공통 성분과 개별 성분으로 분해되고, 특징 레벨에서 융합될 수 있다. 또한, 본 발명의 일 실시예에 따르면, 다중 오늘 영상 융합 방법은 개별 성분들에 대해 공간 어텐션 가중치 맵을 적용하여 융합함으로써 명암 부분의 디테일한 복원이 가능하며 후광 아티팩트를 감소하고 자연스러운 색상으로 복원할 수 있는 이점이 있다.
도 6에는 4개의 다중 노출 영상을 딥러닝 모델을 통해 각각 공통 성분과 개별 성분으로 분해하고, 분해된 공통 성분(C1, vis 내지 C4, vis)을 융합하고(), 분해된 개별 성분(R1, vis 내지 R4, vis)을 융합하며(), 융합된 공통 성분과 융합된 개별 성분을 이용하여 재구성된 출력 영상(Mout)을 생성하는 과정에 대한 설명이 예시되어 있다.
도 7은 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 장치의 내부 구성을 개략적으로 도시한 블록도이고, 도 8 내지 도 10은 종래와 본 발명의 일 실시예에 따른 다중 노출 영상 융합 결과를 비교한 도면이다.
도 7을 참조하면, 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)는 분해부(710), 시각화부(720), 융합부(730), 재구성부(740), 메모리(750) 및 프로세서(760)를 포함하여 구성된다.
분해부(710)는 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분과 개별 성분으로 각각 분해하기 위한 수단이다.
시각화부(720)는 공통 성분과 개별 성분을 결합하여 입력 영상(다중 노출 영상)과 동일한 단일 영상으로 시각화하기 위한 수단이다.
딥러닝 모델은 이미 전술한 바와 같이, 등화 손실과 시각화 손실이 최소가 되도록 학습될 수 있다. 이는 도 1에서 설명한 바와 동일하므로 중복되는 설명은 생략하기로 한다.
융합부(730)는 공통 성분과 개별 성분을 각각 융합하기 위한 수단이다. 융합부(730)는 공통 성분을 융합함에 있어, 복수의 컨볼루션 레이어와 연결하여 융합할 수 있다. 또한, 융합부(730)는 개별 성분을 융합함에 있어, 공간 어텐션 가중치 맵을 적용하여 개별 성분들을 융합할 수 있다.
재구성부(740)는 융합된 공통 성분과 개별 성분을 이용하여 출력 영상을 재구성하기 위한 수단이다. 딥러닝 모델은 재구성 손실이 최소가 되도록 공통 성분과 개별 성분을 분해하도록 학습될 수 있다. 전술한 바와 같이, 딥러닝 모델은 다중 노출 영상을 공통 성분과 개별 성분으로 분해하도록 학습함에 있어, 등화 손실, 시각화 손실 및 재구성 손실을 고려한 손실이 최소가 되도록 학습될 수 있다.
메모리(750)는 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 방법을 수행하기 위한 명령어를 저장하기 위한 수단이다.
프로세서(760)는 본 발명의 일 실시예에 따른 딥러닝 분해 기반 다중 노출 영상 융합 장치(100)의 내부 구성 요소들(예를 들어, 분해부(710), 시각화부(720), 융합부(730), 재구성부(740), 메모리(750) 등)을 제어하기 위한 수단이다.
도 8은 종래와 본 발명의 일 실시예에 따른 다중 노출 영상을 융합한 결과를 나타낸 것이다. 도 8의 (a) 내지 (h)에서 보여지는 바와 같이, 종래의 방법들은 어두운 영역의 디테일을 복원하는데 문제가 있음을 알 수 있으며, 본 발명의 일 실시예에 따른 융합 방법(i)은 어두운 영역의 디테일을 복원하는데 장점이 있는 것을 알 수 있다.
도 9는 다른 입력 영상에 대해 종래와 본 발명의 일 실시예에 따른 다중 노출 영상을 융합한 결과를 나타낸 것이다. 도 9에서 붉은색 박스 영역은 과도한 빛으로 포화된 세부 영역으로, (a) 내지 (h)에서 보여지는 바와 같이 종래의 방법들은 디테일 복원 측면에서 성능이 좋지 않은 것을 알 수 있다. 그러나 본 발명의 일 실시예에 따른 융합 방법(i)은 안정적이고 자연스러운 색상과 최상의 디테일 복원 능력을 보이는 것을 알 수 있다.
도 10은 또 다른 입력 영상에 대해 종래와 본 발명의 일 실시예에 따른 융합 결과와 가중치 맵을 비교한 것이다.
도 10의 (a)에서 보여지는 바와 같이, 종래 방법의 경우 부자연스러운 경계 현상이 관찰되는데, 이는 가중치 맵에서 보여지는 바와 같이, 4개의 입력 가중치 분포가 급격한 변동을 가지며, 대비가 더 높은 것을 알 수 있다. 이로 인해, 특정 입력에 대해 편향된 가중치로 인해 부자연스러운 경계 현상이 나타나는 것을 알 수 있다.
그러나, 본 발명의 경우, 종래와 비교하여 더 부드러운 가중치 분포를 가지는 것을 알 수 있다. 이로 인해, 본 발명의 일 실시예에 따른 융합 결과에서 후광 아티팩트가 더 감소되는 것을 알 수 있다.
본 발명의 실시 예에 따른 장치 및 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야 통상의 기술자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100: 딥러닝 기반 다중 노출 영상 융합 장치
710: 분해부
720: 시각화부
730: 융합부
740: 재구성부
750: 메모리
760: 프로세서

Claims (7)

  1. (a) 각 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분(common component)과 개별 성분(residual component)으로 각각 분해하는 단계;
    (b) 상기 각각의 개별 성분을 융합하고, 상기 각각의 공통 성분을 융합하는 단계; 및
    (c) 상기 융합된 개별 성분과 상기 융합된 공통 성분을 더하여 재건 영상을 생성하는 단계를 포함하되,
    상기 딥러닝 모델은 동일한 장면에 대해 서로 다른 노출 조건으로 획득된 상기 각 다중 노출 영상이 각각 동일한 공통 성분을 가지도록 등화 손실을 고려하여 학습되며,
    상기 (b) 단계에서,
    공간 어텐션 가중치 맵을 이용하여 상기 각 개별 성분들을 융합하는 것을 특징으로 하는 딥러닝 분해 기반 다중 노출 영상 융합 방법.
  2. 삭제
  3. 제1 항에 있어서,
    상기 딥러닝 모델은,
    상기 분해된 각 공통 성분과 각 개별 성분이 상기 각 다중 노출 영상과 동일한 단일 영상으로 결합되도록 시각화 손실을 고려하여 가중치가 학습되는 것을 특징으로 하는 딥러닝 분해 기반 다중 노출 영상 융합 방법.
  4. 삭제
  5. 제3 항에 있어서,
    상기 딥러닝 모델은,
    상기 융합된 공통 성분과 상기 융합된 개별 성분으로 재구성된 출력 영상과 상기 다중 노출 영상과의 차이를 고려한 재구성 손실이 최소가 되도록 학습되는 것을 특징으로 하는 딥러닝 분해 기반 다중 노출 영상 융합 방법.
  6. 제1 항, 제3항 또는 제5 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체.
  7. 각 다중 노출 영상을 딥러닝 모델에 적용하여 특징 레벨에서 공통 성분(common component)과 개별 성분(residual component)으로 각각 분해하는 분해부;
    상기 각각의 개별 성분을 융합하고, 상기 각각의 공통 성분을 융합하는 융합부; 및
    상기 융합된 개별 성분과 상기 융합된 공통 성분을 이용하여 재구성된 출력 영상을 생성하는 재구성부를 포함하되,
    상기 딥러닝 모델은 동일한 장면에 대해 서로 다른 노출 조건으로 획득된 상기 각 다중 노출 영상이 각각 동일한 공통 성분을 가지도록 등화 손실을 고려하여 학습되되,
    상기 융합부는,
    공간 어텐션 가중치 맵을 이용하여 상기 각 개별 성분들을 융합하는 것을 특징으로 하는 딥러닝 분해 기반 다중 노출 영상 융합 장치.


KR1020220043140A 2021-12-10 2022-04-07 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치 KR102610330B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20210176468 2021-12-10
KR1020210176468 2021-12-10

Publications (2)

Publication Number Publication Date
KR20230088213A KR20230088213A (ko) 2023-06-19
KR102610330B1 true KR102610330B1 (ko) 2023-12-06

Family

ID=86988463

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220043140A KR102610330B1 (ko) 2021-12-10 2022-04-07 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR102610330B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290809B (zh) * 2023-11-22 2024-03-12 小舟科技有限公司 多源异构生理信号融合方法及装置、设备、存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102045538B1 (ko) 2018-05-31 2019-11-15 한양대학교 산학협력단 패치 기반 다중 노출 영상 융합 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102045538B1 (ko) 2018-05-31 2019-11-15 한양대학교 산학협력단 패치 기반 다중 노출 영상 융합 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
K.Ram Prabhakar ET AL, DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs, ICCV 2017, 22-29 Oct. 2017(2017.10.22.) 1부.*
Kede Ma ET AL, Robust Multi-Exposure Image Fusion: A Structural Patch Decomposition Approach, IEEE Transactions on Image Processing, Volume: 26, Issue: 5, 20 Feb. 2017(2017.02.20.) 1부.*

Also Published As

Publication number Publication date
KR20230088213A (ko) 2023-06-19

Similar Documents

Publication Publication Date Title
Li et al. Underwater scene prior inspired deep underwater image and video enhancement
Ram Prabhakar et al. Deepfuse: A deep unsupervised approach for exposure fusion with extreme exposure image pairs
JP4367757B2 (ja) 連鎖の1つの機器の欠陥に関係する、特にスミアリングに関係する書式付き情報出力する方法とシステム
CN110021047A (zh) 图像处理方法、图像处理装置和存储介质
CN111669514B (zh) 高动态范围成像方法和装置
DE112010003988T5 (de) Verfahren und System zur Transformation eines digitalen Bildes von einem Bild mitniedrigem Dynamikumfang (Low Dynamic Range, LDR) in ein Bild mit hohem Dynamikumfang (High Dynamic Range, HDR)
JPH05268469A (ja) 画像処理方法
JP2001094778A (ja) 多数のイメージ処理状態におけるデジタルイメージ表示法
KR102610330B1 (ko) 딥러닝 분해 기반 다중 노출 영상 융합 방법 및 그 장치
US7333669B2 (en) Selecting an image processing path to provide desired noise
DE102019205783A1 (de) Systeme und Verfahren für verbesserte 3D-Daten-Rekonstruktion aus stereo-temporalen Bildsequenzen
WO2020210472A1 (en) High-dynamic-range image generation with pre-combination denoising
Ye et al. Progressive and selective fusion network for high dynamic range imaging
JPH06348840A (ja) 画像復元方法
Hu et al. Sensor-realistic synthetic data engine for multi-frame high dynamic range photography
US20220156889A1 (en) Saliency map generation method and image processing system using the same
Chambe et al. HDR-LFNet: inverse tone mapping using fusion network
CN114757844A (zh) 一种图像摩尔纹消除方法及装置
CN110580696A (zh) 一种细节保持的多曝光图像快速融合方法
KR102357350B1 (ko) 딥러닝을 이용한 저선량 ct 영상의 통계적 영상 복원 방법 및 시스템
WO2023246392A1 (zh) 图像获取方法、装置、设备和非瞬态计算机存储介质
KR101341617B1 (ko) 단일 영상의 오차모델을 기반으로 한 고해상도 영상 복원장치 및 방법
Karaduzovic-Hadziabdic et al. Subjective and objective evaluation of multi-exposure high dynamic range image deghosting methods
CN114972130B (zh) 一种去噪神经网络的训练方法、装置及训练设备
CN114283101A (zh) 一种多曝光图像融合的无监督学习方法、装置及电子设备

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right