KR102275498B1 - 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법 - Google Patents
일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법 Download PDFInfo
- Publication number
- KR102275498B1 KR102275498B1 KR1020200126202A KR20200126202A KR102275498B1 KR 102275498 B1 KR102275498 B1 KR 102275498B1 KR 1020200126202 A KR1020200126202 A KR 1020200126202A KR 20200126202 A KR20200126202 A KR 20200126202A KR 102275498 B1 KR102275498 B1 KR 102275498B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- dictionary
- reflectance
- general
- target image
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000002708 enhancing effect Effects 0.000 title 1
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 28
- 238000005286 illumination Methods 0.000 claims description 32
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 39
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000002310 reflectometry Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G06T5/001—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/514—Depth or shape recovery from specularities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2211/00—Image generation
- G06T2211/40—Computed tomography
- G06T2211/416—Exact reconstruction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법은, 컨볼루션 희소 코딩(convolution sparse coding, CSC)과 특이값 분해(singular value decomposition, SVD)를 기반으로 일반 사전(general dictionary)을 구성하고, 일반 사전을 이용하여 영상의 반사율을 재구성하여 영상을 복원함으로써, 사전의 재학습없이 일반 사전을 지속적으로 사용하여 영상을 복원할 수 있고, 이에 따라, 계산 효율을 향상시키며 메모리를 절감할 수 있다.
Description
본 발명은 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법에 관한 것으로서, 더욱 상세하게는 레티넥스 기반으로 영상을 복원하는, 장치 및 방법에 관한 것이다.
레티넥스(Retinex) 이론은 다양한 조명 조건에서 물체의 상대적 반사율을 보여줌으로써 인간 시각 시스템(human visual system)을 나타낸다. 이 인간 시각 시스템의 특징은 색 항상성(color constancy)이며, 레티넥스 이론은 이 특징을 고려하여 설계되었다. 레티넥스 알고리즘은 물체의 조명(illumination) 및 반사율(reflectance)을 효과적으로 분해하기 위해 널리 사용된다.
영상에서 조명의 효과로 인해 기계(machine)는 인간과 달리 조명을 제거한 원래의 색을 인지하지 못한다. 이 때문에 인간과 기계의 인식 차이가 발생하게 되고, 이는 기계가 영상을 처리(pattern recognition, image enhancement, image reconstruction 등)할 때, 올바른 결과를 나타내지 못하게 됨을 의미한다. 따라서, 레티넥스 이론에 따라 조명의 효과를 최소화하여 물체의 본래의 색을 나타낼 수 있는 반사율을 복원함으로써 복원 영상을 다양한 분야에 적용할 수 있게 한다.
종래의 기술은 희소 코딩(sparse coding)을 통해 사전(dictionary)를 구성하고, 이를 통해 레티넥스 이론에 따라 영상을 복원하고 있다. 그러나, 종래 기술의 경우, 희소 코딩의 특성상 각 사전의 패치 간의 중복성이 높고, 각각의 개별적인 패치 별로 알고리즘을 적용하기 때문에 영상에서의 전체 구조를 고려하지 못하는 단점이 있다. 따라서, 영상을 복원함에 있어서 세밀한 부분을 정확하게 표현할 수 없고, 영상마다 개별적인 사전을 구성해야 하기 때문에 일반적인 사전(general dictionary)으로 사용할 수 없는 문제가 있다.
본 발명이 이루고자 하는 목적은, 컨볼루션 희소 코딩(convolution sparse coding, CSC)과 특이값 분해(singular value decomposition, SVD)를 기반으로 일반 사전(general dictionary)을 구성하고, 일반 사전을 이용하여 영상의 반사율을 재구성하여 영상을 복원하는, 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법을 제공하는 데 있다.
본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
상기의 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치는, 조명 성분을 분리할 대상 영상을 입력받는 영상 입력부; 상기 대상 영상을 구성하는 화소의 영상 신호 값으로부터 조명 성분과 반사율 성분을 분리하여 추출하는 영상 신호 분리부; 및 특이값 분해(singular value decomposition)를 이용하여 학습된 일반 사전(general dictionary), 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 비용 함수를 기반으로, 상기 대상 영상으로부터 추출된 반사율 성분을 재구성하여, 상기 대상 영상으로부터 복원 영상을 생성하는 영상 생성부;를 포함한다.
여기서, 상기 반사율 성분은, 컨볼루션 희소 코딩(convolution sparse coding)을 이용하여 표현될 수 있다.
여기서, 상기 컨볼루션 희소 코딩은, 영상의 이미지 α가 사전(dictionary) dk와 계수 맵(coefficient map) zk의 컨볼루션으로 이루어지고, 식 으로 표현되며, 상기 k는, 상기 사전과 상기 계수 맵의 인덱스를 나타내고, 상기 K는, 상기 사전과 상기 계수 맵의 개수를 나타낼 수 있다.
여기서, 상기 일반 사전은, 복수의 데이터 세트로부터 특이값 분해를 기반으로 선택된 데이터를 이용하여 학습된 일반 반사율 함수(general reflectance function)를 나타낼 수 있다.
여기서, 상기 일반 반사율 함수는, 상기 컨볼루션 희소 코딩을 이용하여, 식 으로 표현되며, 상기 r은, 상기 대상 영상으로부터 추출된 반사율 성분을 나타내고, 상기 k는, 상기 사전과 상기 계수 맵의 인덱스를 나타내며, 상기 K는, 상기 사전과 상기 계수 맵의 개수를 나타내고, 상기 β는, 정규화 파라미터(regularization parameter)를 나타낼 수 있다.
여기서, 상기 비용 함수는, 상기 일반 반사율 함수, 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함할 수 있다.
여기서, 상기 비용 함수는, 식 으로 표현되며, 상기 l은, 상기 대상 영상으로부터 추출된 조명 성분을 나타내고, 상기 s는, 상기 대상 영상으로부터 추출된 색상 성분을 나타내며, 상기 α는, 정규화 파라미터를 나타내고, 상기 η은, 정규화 파라미터를 나타낼 수 있다.
상기의 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 방법은, 레티넥스 기반 영상 복원 장치에 의해 수행되는 영상 복원 방법으로서, 조명 성분을 분리할 대상 영상을 입력받는 단계; 상기 대상 영상을 구성하는 화소의 영상 신호 값으로부터 조명 성분과 반사율 성분을 분리하여 추출하는 단계; 및 특이값 분해(singular value decomposition)를 이용하여 학습된 일반 사전(general dictionary), 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 비용 함수를 기반으로, 상기 대상 영상으로부터 추출된 반사율 성분을 재구성하여, 상기 대상 영상으로부터 복원 영상을 생성하는 단계;를 포함한다.
여기서, 상기 반사율 성분은, 컨볼루션 희소 코딩(convolution sparse coding)을 이용하여 표현될 수 있다.
여기서, 상기 컨볼루션 희소 코딩은, 영상의 이미지 α가 사전(dictionary) dk와 계수 맵(coefficient map) zk의 컨볼루션으로 이루어지고, 식 으로 표현되며, 상기 k는, 상기 사전과 상기 계수 맵의 인덱스를 나타내고, 상기 K는, 상기 사전과 상기 계수 맵의 개수를 나타낼 수 있다.
여기서, 상기 일반 사전은, 복수의 데이터 세트로부터 특이값 분해를 기반으로 선택된 데이터를 이용하여 학습된 일반 반사율 함수(general reflectance function)를 나타낼 수 있다.
여기서, 상기 일반 반사율 함수는, 상기 컨볼루션 희소 코딩을 이용하여, 식 으로 표현되며, 상기 r은, 상기 대상 영상으로부터 추출된 반사율 성분을 나타내고, 상기 k는, 상기 사전과 상기 계수 맵의 인덱스를 나타내며, 상기 K는, 상기 사전과 상기 계수 맵의 개수를 나타내고, 상기 β는, 정규화 파라미터(regularization parameter)를 나타낼 수 있다.
상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 컴퓨터 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 저장되어 상기한 일반 사전을 이용한 레티넥스 기반 영상 복원 방법 중 어느 하나를 컴퓨터에서 실행시킨다.
본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법에 의하면, 컨볼루션 희소 코딩(convolution sparse coding, CSC)과 특이값 분해(singular value decomposition, SVD)를 기반으로 일반 사전(general dictionary)을 구성하고, 일반 사전을 이용하여 영상의 반사율을 재구성하여 영상을 복원함으로써, 사전의 재학습없이 일반 사전을 지속적으로 사용하여 영상을 복원할 수 있고, 이에 따라, 계산 효율을 향상시키며 메모리를 절감할 수 있다.
또한, 본 발명은 조명의 변화로 인해 어려움을 겪는 기존의 영상 재구성(image reconstruction), 패턴 인식(pattern recognition), 영상 개선(image enhancement) 등의 다양한 분야에 적용할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 바람직한 실시예에 따른 일반 사전을 설명하기 위한 도면으로, 도 2의 (a)는 단일 이미지를 이용한 희소 코딩 사전을 나타내고, 도 2의 (b)는 단일 이미지를 이용한 컨볼루션 희소 코딩 사전을 나타내며, 도 2의 (c)는 특이값 분해(SVD)를 이용한 컨볼루션 희소 코딩 일반 사전을 나타낸다.
도 3은 본 발명의 바람직한 실시예에 따른 복원 영상을 설명하기 위한 도면으로, 도 3의 (a)는 대상 영상을 나타내고, 도 3의 (b)는 희소 코딩 사전을 통한 복원 영상을 나타내며, 도 3의 (c)는 특이값 분해(SVD)를 이용한 컨볼루션 희소 코딩 일반 사전을 통한 복원 영상을 나타낸다.
도 4는 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 바람직한 실시예에 따른 일반 사전을 설명하기 위한 도면으로, 도 2의 (a)는 단일 이미지를 이용한 희소 코딩 사전을 나타내고, 도 2의 (b)는 단일 이미지를 이용한 컨볼루션 희소 코딩 사전을 나타내며, 도 2의 (c)는 특이값 분해(SVD)를 이용한 컨볼루션 희소 코딩 일반 사전을 나타낸다.
도 3은 본 발명의 바람직한 실시예에 따른 복원 영상을 설명하기 위한 도면으로, 도 3의 (a)는 대상 영상을 나타내고, 도 3의 (b)는 희소 코딩 사전을 통한 복원 영상을 나타내며, 도 3의 (c)는 특이값 분해(SVD)를 이용한 컨볼루션 희소 코딩 일반 사전을 통한 복원 영상을 나타낸다.
도 4는 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 방법을 설명하기 위한 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명의 실시 예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 명세서에서 "제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
본 명세서에서 각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 명세서에서, "가진다", "가질 수 있다", "포함한다" 또는 "포함할 수 있다"등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
또한, 본 명세서에 기재된 '~부'라는 용어는 소프트웨어 또는 FPGA(field-programmable gate array) 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터 구조들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다.
이하에서 첨부한 도면을 참조하여 본 발명에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.
먼저, 도 1을 참조하여 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치에 대하여 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치를 설명하기 위한 블록도이다.
도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 장치(이하 '영상 복원 장치'라 한다)(100)는 컨볼루션 희소 코딩(convolution sparse coding, CSC)과 특이값 분해(singular value decomposition, SVD)를 기반으로 일반 사전(general dictionary)을 구성하고, 물리 기반 레티넥스 알고리즘(Physics-based Retinex algorithm)을 기반으로 일반 사전을 이용하여 영상의 반사율을 재구성하여 영상을 복원한다.
여기서, 물리 기반 레티넥스 알고리즘(Physics-based Retinex algorithm)은 물체의 색(S)이 조명(illumination, L)과 반사율(reflectance, R)의 곱으로 구성된다는 점에 착안하여, 색(S)으로부터 반사율(R)을 분리함으로써 조명에 의해 발생하는 색 항상성(color constancy) 문제를 해결한다. S=LR 식을 로그 도메인(log domain)으로 치환하여 L과 R의 더하기 식으로 변경한 후(s=l+r, s=logS, l=logL, r=logR), l과 r을 모델링하여 최적화 식을 통해 s로부터 r과 l을 구하게 된다.
이를 위해, 영상 복원 장치(100)는 영상 입력부(110), 영상 신호 분리부(130) 및 영상 생성부(150)를 포함할 수 있다.
영상 입력부(110)는 조명 성분을 분리할 대상 영상을 입력받는다.
영상 신호 분리부(130)는 영상 입력부(110)를 통해 입력받은 대상 영상을 구성하는 화소의 영상 신호 값으로부터 조명 성분과 반사율 성분을 분리하여 추출한다.
영상 생성부(150)는 특이값 분해(singular value decomposition, SVD)를 이용하여 학습된 일반 사전(general dictionary), 대상 영상으로부터 추출된 반사율 성분 및 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 비용 함수를 기반으로, 대상 영상으로부터 추출된 반사율 성분을 재구성하여, 대상 영상으로부터 복원 영상을 생성한다.
이때, 반사율 성분은 컨볼루션 희소 코딩(convolution sparse coding, CSC)을 이용하여 표현될 수 있다. 여기서, 컨볼루션 희소 코딩은 영상의 이미지 α가 사전(dictionary) dk와 계수 맵(coefficient map) zk의 컨볼루션으로 이루어지며, 식 으로 표현될 수 있다. k는 사전(dk)과 계수 맵(zk)의 인덱스를 나타내고, K는 사전(dk)과 계수 맵(zk)의 개수를 나타낸다.
그리고, 일반 사전은 복수의 데이터 세트로부터 특이값 분해(SVD)를 기반으로 선택된 데이터를 이용하여 학습된 일반 반사율 함수(general reflectance function)를 나타낼 수 있다. 여기서, 일반 반사율 함수는 컨볼루션 희소 코딩을 이용하여, 식 으로 표현될 수 있다. r은 대상 영상으로부터 추출된 반사율 성분을 나타내고, k는 사전(dk)과 계수 맵(zk)의 인덱스를 나타내며, K는 사전(dk)과 계수 맵(zk)의 개수를 나타내고, β는 정규화 파라미터(regularization parameter)를 나타낸다.
그리고, 비용 함수는 일반 반사율 함수, 대상 영상으로부터 추출된 반사율 성분 및 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하며, 식 으로 표현될 수 있다. l은 대상 영상으로부터 추출된 조명 성분을 나타내고, s는 대상 영상으로부터 추출된 색상 성분을 나타내며, α는 정규화 파라미터를 나타내고, η은 정규화 파라미터를 나타낸다.
그러면, 도 2를 참조하여 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 과정에 대하여 보다 자세하게 설명한다.
도 2는 본 발명의 바람직한 실시예에 따른 일반 사전을 설명하기 위한 도면으로, 도 2의 (a)는 단일 이미지를 이용한 희소 코딩 사전을 나타내고, 도 2의 (b)는 단일 이미지를 이용한 컨볼루션 희소 코딩 사전을 나타내며, 도 2의 (c)는 특이값 분해(SVD)를 이용한 컨볼루션 희소 코딩 일반 사전을 나타낸다.
본 발명에 따른 반사율 함수(Reflectance Function)
본 발명에 따른 레티넥스 모델(retinex model)의 반사율 함수(reflectance function)는 특징들의 좀더 상세한 구조를 보증하는 최적의 기준을 찾는 것을 목표로 한다. 따라서, 본 발명에 따른 반사율 함수는 예제 영상으로부터 가장 적절한 기준 사전을 생성하고, 각각의 사전 패치(dictionary patch) 사이에 무시해도 될만큼의 아주 작은 중복만을 가지게 된다. 컨볼루션 희소 코딩(CSC)은 공간-불변 컨볼루션 특징들로의 영상 분해를 기반으로 한다. 사전의 원자들(atoms)을 비교하면, 본 발명의 컨볼루션 희소 코딩(CSC) 기법에 따른 학습된 필터들(도 2의 (b) 참조)은 훨씬 많은 변화(예컨대, 더 넓은 범위의 방향에 걸쳐 있음)를 보여주고, 이는 더 나은 복원으로 이어지게 된다.
본 발명에 따른 레티넥스 모델의 반사율 함수는 컨볼루션 희소 코딩(CSC)를 사용하고, 아래의 [수학식 1]과 같다.
[수학식 1]
따라서, 본 발명은 컨볼루션 희소 코딩(CSC)를 통해 사전들과 계수 맵들을 학습한다. 반사율은 사전과 계수 맵의 컨볼루션을 통해 생성된다. 반사율 함수의 컴포넌트가 컨볼루션을 통해 생성될 때, 로컬 특징들과 전역 특징들을 포함하는, 영상의 다양한 비선형 형상들이 표현될 수 있다. 이로 인해, 종래의 희소 코딩 방법보다 더 복잡한 영역에서도 반사율을 표현할 수 있으며, 그에 따라, 목적 함수(objective function)에서 조명을 정확하게 분해할 수 있다. 컨볼루션 희소 코딩(CSC)에서 학습은 종래의 방법보다 더 오래 걸릴 수 있지만, 본 발명이 사전을 학습하면, 본 발명은 테스트 단계에서 반사율 함수 컨포넌트를 생성할 때 저장된 사전을 통해 알고리즘을 빠르게 진행할 수 있다.
본 발명은 컨볼루션 희소 코딩(CSC)을 이용하여 많은 데이터 세트으로 일반 사전을 학습하는 것에 의해 반사율 컴포넌트를 재구성할 수 있다. 희소 코딩에서, 각각의 영상 패치(image patch)는 특별히 선택된 사전으로부터 원자들의 선형 조합(linear combination)을 이용하여 표현될 수 있다. 그러나, 이와 같은 선형 조합에서, 표현될 수 있는 개수에 한계가 있고, 희소 코딩의 사전 패치는 중복성이 높기 때문에, 표현될 수 있는 개수는 더욱 줄어들게 된다. 컨볼루션 희소 코딩(CSC)에서, 특별히 선택된 사전으로부터 원자들의 컨볼루션을 이용하여 표현될 수 있다. 컨볼루션은 선형 조합보다 더 많은 케이스들을 표현할 수 있고, 게다가, 컨볼루션 희소 코딩(CSC) 사전의 중복성은 희소 코딩보다 더 낮게 되며, 이것에 의해 도 2에 도시한 바와 같이 더 많은 케이스들의 표현이 가능하다. 따라서, 본 발명이 컨볼루션 희소 코딩(CSC)를 통해 많은 데이터 세트로부터 충분히 학습된 일반 사전을 생성하면, 훈련되지 않은 테스트 영상에서도 적절한 반사율 컴포넌트를 재구성할 수 있다. 이는 각각의 영상에 대해 사전을 생성하는 SCR(Sparse Coding Retinex) 모델과 비교할 때, 매번 사전을 생성할 필요가 없는 장점이 있다. 이를 하기 위해, 본 발명은 도 2의 (c)에 도시된 바와 같이, 특이값 분해(SVD)를 이용하여 기준 사전을 구성한다.
본 발명에 따른 목적 함수(Objective Function)
본 발명에서, 컨볼루션 희소 코딩(CSC)은 영상의 조명과 반사율을 효과적으로 분해하기 위해 레티넥스 모델에 적용된다. 본 발명에 따른 CSC 레티넥스 모델의 주된 아이디어는 반사율 함수에 대해 미리 적절한 기준을 검색하고, 반사율 함수에서 보다 상세한 구조들 또는 특징들을 식벽하는 것에 의해 조명을 분해한다. 따라서, 주된 단계는 대상 영상의 반사율 컴포넌트를 표현하기 위한 사전을 구성하는 것이다.
본 발명에 따른 모델은 아래의 가정에 기초한다.
- 반사율(reflectivity)을 기초로, 제약들(constraints) l≥s 및 r≥0이 추가된다.
본 발명은 HVS(Human Visual System)가 색상을 인식하는 방식을 시뮬레이션하고 설명하기 위해, 레티넥스에 대한 아래의 [수학식 2]와 같은 에너지 함수(energy function)를 고려한다. 여기서, 에너지 함수는 목적 함수 또는 비용 함수를 말한다.
[수학식 2]
여기서, α, β 및 η은 정규화 파라미터(regularization parameter)들을 나타내는 양수이다.
본 발명에 따른 모델에서, 반사율은 SCR 모델보다 훈련된 사전에 의해 더 낫게 표현될 수 있고, [수학식 2]의 첫번째 항과 두번째 항은 반사율 r에 대한 정규화 항들(regularization terms)로 해석될 수 있다. 추가하여, 본 발명에 따른 모델에 반복적인 알고리즘을 적용하는 것에 의해, 본 발명은 알고리즘이 반복될 때마다 최적의 반사율을 도출할 수 있는 사전을 구성한다. 따라서, 아래의 대체 최소화 방법(alternating minimization method)이 [수학식 2]를 푸는데 이용될 수 있다.
본 발명에 따른 레티넥스 모델(Retinex Model)
위에서 언급된 바와 같이, 아래의 대체 최소화 방법(alternating minimization method)이 [수학식 2]를 푸는데 이용될 수 있다. 본 발명에 따른 CSC 레티넥스 모델의 기준 의사-코드(pseudo-code)는 아래의 [알고리즘 1]과 같이 표현된다.
[알고리즘 1]
- 반사율 함수 하부-문제(Reflectance Function Sub-Problem)
[알고리즘 1]의 라인 3으로부터, 반사율 하부-문제는 아래의 [수학식 3]과 같이 작성될 수 있다.
[수학식 3]
여기서, 아래의 [수학식 4]와 같은 컨볼루션 희소 코딩(CSC) 수식을 통해 사전(dk) 및 계수 맵(zk)를 찾기 위한 식은 아래의 [수학식 5]와 같다.
[수학식 4]
[수학식 5]
여기서, r'은 이다. [수학식 5]는 consensus ADMM(alternate direction method of multipliers)를 이용하여 풀 수 있다. Z' 및 r'는 작은 N 블록 매트릭스 Z'=[Z1 ... ZN] 및 r'=[r1 ... rN]으로 표현될 수 있다. 여기서, ri는 각각의 필터 Zi와 함께 i번째 데이터 블록을 나타낸다. ADMM을 통해 필터 d 하부-문제는 아래와 같다.
[알고리즘 2]
알고리즘 2의 계산은 컨볼루션 희소 코딩(CSC)의 ADMM 방법을 따르지만, 특히, 본 발명은 라인 3의 최소-제곱 문제(least-squares problem)를 풀기위해 새로운 방법을 제안한다. 라인 3의 최소-제곱 문제 해결책은 아래의 [수학식 6]과 같다.
[수학식 6]
여기서, +는 켤레 전치(conjugate transpose)를 나타내고, Ⅱ는 항등 행렬(identity matrix)을 나타낸다. 라고 한다. 그러면, 본 발명은 특이값 분해(SVD)를 통해 라인 3의 최소-제곱 문제를 풀 수 있다. ∑i의 대각 엔트리들(diagonal entries) 는 Zi의 특이값들(singular values)이라 부른다. Ui의 컬럼들은 좌측 특이 벡터들(singular vectors)이라 부른다. 또한, 의 컬럼들은 우측 특이 벡터들이라 부른다. 그리고, h는 Zi의 계수(rank)이다. 그러면, 는 로 계산될 수 있다. 본 발명은 많은 데이터 세트의 중요한 부분들만 선택하기 위해 특이값 분해(SVD)를 사용할 수 있고, 그것을 통해 사전을 업데이트할 수 있다. 제한된 메모리(사전 필터 크기 및 개수)로 인해, 많은 데이터 세트로부터 중요한 정보만을 선택하고 압축하는 것이 일반 사정을 구성하는데 특히 중요하다.
특이값 분해(SVD)는 최소-제곱 문제를 풀기 위한 강력하고 신뢰성있는 방법임이 알려져 있지만, 복잡한 계산의 단점을 가지고 있다. 그럼에도 불구하고, 본 발명은 공통되는 기준 사전을 획득하기 위해 특이값 분해(SVD)를 이용한다. 이는 반사율을 구성하는 사전은 특이값 분해(SVD)와 같은 기준 위에서 구성될 수 있다는 것을 의미한다. 따라서, 최선의 반사율 컨포넌트 r'는 컨볼루션 희소 코딩(CSC)에서 사전 및 계수 맵으로부터 획득될 수 있다.
- 조명 함수 하부-문제(Illumination Function Sub-Problem)
[알고리즘 1]의 라인 5로부터, 조명 하부-문제는 아래의 [수학식 7]과 같이 작성될 수 있다.
[수학식 7]
[수학식 7]은 l2-놈(norm) 문제이고, 이는 l에 대하여 미분하고 [수학식 7]의 결과를 0으로 설정하는 것에 의해 전체 영상 영역 Ω의 편미분(partial derivative)을 통해 쉽게 풀 수 있다. 그러면, 이는 FFT(fast Fourier transform)를 통해 효과적으로 풀 수 있다.
그러면, 도 3을 참조하여 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원의 성능에 대하여 설명한다.
도 3은 본 발명의 바람직한 실시예에 따른 복원 영상을 설명하기 위한 도면으로, 도 3의 (a)는 대상 영상을 나타내고, 도 3의 (b)는 희소 코딩 사전을 통한 복원 영상을 나타내며, 도 3의 (c)는 특이값 분해(SVD)를 이용한 컨볼루션 희소 코딩 일반 사전을 통한 복원 영상을 나타낸다.
도 3을 참조하면, 본 발명에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원을 한 결과 영상(도 3의 (c) 참조)과 종래의 희소 코딩 사전을 이용하여 복원한 결과 영상(도 3의 (b) 참조)을 대비하면, 본 발명이 종래에 비해 개선된 품질을 나타내는 것을 확인할 수 있다.
이와 같이, 본 발명은 컨볼루션 희소 코딩(CSC)과 특이값 분해(SVD)를 기반으로 일반 사전(general dictionary)을 구성하고, 일반 사전을 이용하여 영상의 반사율을 재구성하여 영상을 복원함으로써, 사전의 재학습없이 일반 사전을 지속적으로 사용하여 영상을 복원할 수 있고, 이에 따라, 계산 효율을 향상시키며 메모리를 절감할 수 있다. 또한, 본 발명은 조명의 변화로 인해 어려움을 겪는 기존의 영상 재구성(image reconstruction), 패턴 인식(pattern recognition), 영상 개선(image enhancement) 등의 다양한 분야에 적용할 수 있다.
그러면, 도 4를 참조하여 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 방법에 대하여 설명한다.
도 4는 본 발명의 바람직한 실시예에 따른 일반 사전을 이용한 레티넥스 기반 영상 복원 방법을 설명하기 위한 흐름도이다.
도 4를 참조하면, 영상 복원 장치(100)는 조명 성분을 분리할 대상 영상을 입력받는다(S110).
그런 다음, 영상 복원 장치(100)는 대상 영상을 구성하는 화소의 영상 신호 값으로부터 조명 성분과 반사율 성분을 분리하여 추출한다(S130).
이후, 영상 복원 장치(100)는 특이값 분해(SVD)를 이용하여 학습된 일반 사전(general dictionary), 대상 영상으로부터 추출된 반사율 성분 및 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 비용 함수를 기반으로, 대상 영상으로부터 반사율 성분을 재구성하여, 대상 영상으로부터 복원 영상을 생성한다(S150).
이때, 반사율 성분은 컨볼루션 희소 코딩(convolution sparse coding, CSC)을 이용하여 표현될 수 있다. 여기서, 컨볼루션 희소 코딩은 영상의 이미지 α가 사전(dictionary) dk와 계수 맵(coefficient map) zk의 컨볼루션으로 이루어지고, 식 으로 표현될 수 있다.
그리고, 일반 사전은 복수의 데이터 세트로부터 특이값 분해(SVD)를 기반으로 선택된 데이터를 이용하여 학습된 일반 반사율 함수(general reflectance function)를 나타낼 수 있다. 여기서, 일반 반사율 함수는 컨볼루션 희소 코딩을 이용하여, 식 으로 표현될 수 있다.
이상에서 설명한 본 발명의 실시예를 구성하는 모든 구성요소들이 하나로 결합하거나 결합하여 동작하는 것으로 기재되어 있다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한, 이와 같은 컴퓨터 프로그램은 USB 메모리, CD 디스크, 플래쉬 메모리 등과 같은 컴퓨터가 읽을 수 있는 기록 매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 기록 매체로서는 자기기록매체, 광 기록매체 등이 포함될 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 영상 복원 장치,
110 : 영상 입력부,
130 : 영상 신호 분리부,
150 : 영상 생성부
110 : 영상 입력부,
130 : 영상 신호 분리부,
150 : 영상 생성부
Claims (13)
- 조명 성분을 분리할 대상 영상을 입력받는 영상 입력부;
상기 대상 영상을 구성하는 화소의 영상 신호 값으로부터 조명 성분과 반사율 성분을 분리하여 추출하는 영상 신호 분리부; 및
특이값 분해(singular value decomposition)를 이용하여 학습된 일반 사전(general dictionary), 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 비용 함수를 기반으로, 상기 대상 영상으로부터 추출된 반사율 성분을 재구성하여, 상기 대상 영상으로부터 복원 영상을 생성하는 영상 생성부;
를 포함하며,
상기 반사율 성분은, 영상의 이미지 α가 사전(dictionary) dk와 계수 맵(coefficient map) zk의 컨볼루션으로 이루어지는 컨볼루션 희소 코딩(convolution sparse coding)을 이용하여 표현되고,
상기 일반 사전은, 복수의 데이터 세트로부터 특이값 분해를 기반으로 선택된 데이터를 이용하여 학습된 일반 반사율 함수(general reflectance function)를 나타내며,
상기 일반 반사율 함수는, 상기 컨볼루션 희소 코딩을 이용하여, 상기 대상 영상으로부터 추출된 반사율 성분, 상기 사전과 상기 계수 맵의 인덱스, 상기 사전과 상기 계수 맵의 개수 및 정규화 파라미터(regularization parameter)를 기반으로 표현되고,
상기 비용 함수는, 상기 일반 반사율 함수, 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 일반 사전을 이용한 레티넥스 기반 영상 복원 장치. - 삭제
- 삭제
- 삭제
- 레티넥스 기반 영상 복원 장치에 의해 수행되는 영상 복원 방법으로서,
조명 성분을 분리할 대상 영상을 입력받는 단계;
상기 대상 영상을 구성하는 화소의 영상 신호 값으로부터 조명 성분과 반사율 성분을 분리하여 추출하는 단계; 및
특이값 분해(singular value decomposition)를 이용하여 학습된 일반 사전(general dictionary), 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 비용 함수를 기반으로, 상기 대상 영상으로부터 추출된 반사율 성분을 재구성하여, 상기 대상 영상으로부터 복원 영상을 생성하는 단계;
를 포함하며,
상기 반사율 성분은, 영상의 이미지 α가 사전(dictionary) dk와 계수 맵(coefficient map) zk의 컨볼루션으로 이루어지는 컨볼루션 희소 코딩(convolution sparse coding)을 이용하여 표현되고,
상기 일반 사전은, 복수의 데이터 세트로부터 특이값 분해를 기반으로 선택된 데이터를 이용하여 학습된 일반 반사율 함수(general reflectance function)를 나타내며,
상기 일반 반사율 함수는, 상기 컨볼루션 희소 코딩을 이용하여, 상기 대상 영상으로부터 추출된 반사율 성분, 상기 사전과 상기 계수 맵의 인덱스, 상기 사전과 상기 계수 맵의 개수 및 정규화 파라미터(regularization parameter)를 기반으로 표현되고,
상기 비용 함수는, 상기 일반 반사율 함수, 상기 대상 영상으로부터 추출된 반사율 성분 및 상기 대상 영상으로부터 추출된 조명 성분을 파라미터로 포함하는 일반 사전을 이용한 레티넥스 기반 영상 복원 방법. - 삭제
- 삭제
- 제8항, 제10항 및 제12항 중 어느 한 항에 기재된 일반 사전을 이용한 레티넥스 기반 영상 복원 방법을 컴퓨터에서 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록 매체에 저장된 컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126202A KR102275498B1 (ko) | 2020-09-28 | 2020-09-28 | 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126202A KR102275498B1 (ko) | 2020-09-28 | 2020-09-28 | 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102275498B1 true KR102275498B1 (ko) | 2021-07-08 |
Family
ID=76894544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200126202A KR102275498B1 (ko) | 2020-09-28 | 2020-09-28 | 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102275498B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170069635A (ko) * | 2015-12-11 | 2017-06-21 | 연세대학교 산학협력단 | 레티넥스 모델 기반 영상 신호 분리 장치 및 그 방법 |
KR101883806B1 (ko) * | 2017-04-07 | 2018-07-31 | 울산과학기술원 | 영상 복원 장치 및 방법 |
-
2020
- 2020-09-28 KR KR1020200126202A patent/KR102275498B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170069635A (ko) * | 2015-12-11 | 2017-06-21 | 연세대학교 산학협력단 | 레티넥스 모델 기반 영상 신호 분리 장치 및 그 방법 |
KR101883806B1 (ko) * | 2017-04-07 | 2018-07-31 | 울산과학기술원 | 영상 복원 장치 및 방법 |
Non-Patent Citations (1)
Title |
---|
Huibin Chang, Michael K. Ng, Wei Wang, Tieyong Zeng , "Retinex image enhancement via a learned dictionary", Optical Engineering, 54(1), 013107, Jan. 2015(2015.01.26.) 1부.* * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112767468B (zh) | 基于协同分割与数据增强的自监督三维重建方法及系统 | |
Mu et al. | Accelerated low-rank visual recovery by random projection | |
Fu et al. | Continual image deraining with hypergraph convolutional networks | |
CN109886884A (zh) | 一种基于限定核范数的低秩张量估计的视觉数据补全方法 | |
US20230214719A1 (en) | Method for performing continual learning using representation learning and apparatus thereof | |
Sun et al. | Identifying invariant texture violation for robust deepfake detection | |
Wang et al. | Learning to hallucinate face in the dark | |
Chen et al. | A robust object segmentation network for underwater scenes | |
KR102275498B1 (ko) | 일반 사전을 이용한 레티넥스 기반 영상 복원 장치 및 방법 | |
CN117291850A (zh) | 一种基于可学习低秩表示的红外偏振图像融合增强方法 | |
CN115053256A (zh) | 空间自适应图像滤波 | |
CN114663802B (zh) | 基于特征时空约束的监控视频跨模态视频迁移方法 | |
Li et al. | Semantic prior-driven fused contextual transformation network for image inpainting | |
CN114331894B (zh) | 一种基于潜在特征重构和掩模感知的人脸图像修复方法 | |
CN113160101B (zh) | 一种合成高仿真图像的方法 | |
KR102340387B1 (ko) | 뇌 연결성 학습 방법 및 이를 위한 시스템 | |
Morales et al. | Deep phase retrieval by a learnable filtered spectral initialization | |
Tao et al. | Neuron manifold distillation for edge deep learning | |
Shang et al. | Mutual Support and Promotion: Learning Structure Compensation and Context Completion for Low-Light Vision | |
Huang et al. | Bayesian robust tucker decomposition for multiway data analysis | |
CN117113010B (zh) | 基于卷积网络轻量化的输电通道安全监测方法及系统 | |
CN116402916B (zh) | 人脸图像的还原方法、装置、计算机设备及存储介质 | |
KR102709892B1 (ko) | 크로스 어텐션을 이용한 멀티 스케일 퓨샷 러닝 기반 위성 영상 생성 방법 및 이를 수행하는 장치 | |
Balaji et al. | Single image dehazing via transmission map estimation using deep neural networks | |
Gao et al. | MSCNet: Multi-Scale Connected Network for Image Denoising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |