KR102132075B1 - Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor - Google Patents

Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor Download PDF

Info

Publication number
KR102132075B1
KR102132075B1 KR1020180094253A KR20180094253A KR102132075B1 KR 102132075 B1 KR102132075 B1 KR 102132075B1 KR 1020180094253 A KR1020180094253 A KR 1020180094253A KR 20180094253 A KR20180094253 A KR 20180094253A KR 102132075 B1 KR102132075 B1 KR 102132075B1
Authority
KR
South Korea
Prior art keywords
image
nonlinear
hyperspectral
reconstructing
hyperspectral image
Prior art date
Application number
KR1020180094253A
Other languages
Korean (ko)
Other versions
KR20190036459A (en
Inventor
김민혁
최인창
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020180031806A external-priority patent/KR20190036442A/en
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to US16/127,014 priority Critical patent/US10861143B2/en
Publication of KR20190036459A publication Critical patent/KR20190036459A/en
Application granted granted Critical
Publication of KR102132075B1 publication Critical patent/KR102132075B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2211/00Image generation
    • G06T2211/40Computed tomography
    • G06T2211/416Exact reconstruction

Abstract

인공 지능을 이용한 초분광 영상 재구성 방법 및 장치가 개시된다. 본 발명의 일 실시예에 따른 초분광 영상 재구성 방법은 영상에 대한 코딩된 데이터를 수신하는 단계; 및 미리 생성된 비선형 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계를 포함한다.Disclosed is a method and apparatus for reconstructing a hyperspectral image using artificial intelligence. An ultra-spectral image reconstruction method according to an embodiment of the present invention includes receiving coded data for an image; And reconstructing a hyperspectral image of the image for the coded data based on a pre-generated nonlinear learning model.

Description

인공 지능을 이용한 초분광 영상 재구성 방법 및 장치 {Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor}Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor}

본 발명은 초분광 영상 복원 기술에 관한 것으로서, 상세하게는 인공 지능 예를 들어, 컨볼루션 신경망(CNN; Convolutional Neural Network)의 일종이며 비선형 학습 모델인 컨볼루션 자동인코더(Convolutional Autoencoder)를 이용하여 고품질의 초분광 영상을 복원 또는 재구성할 수 있는 방법 및 장치에 관한 것이다.The present invention relates to a hyperspectral image reconstruction technology, and in detail, artificial intelligence, for example, is a kind of convolutional neural network (CNN) and is of high quality using a nonlinear learning model, a convolutional autoencoder. It relates to a method and apparatus for reconstructing or reconstructing the hyperspectral image of the.

초분광 영상(또는 하이퍼스펙트럴 영상)은 기존의 RGB 카메라와 달리, 훨씬 더 고밀도의 스펙트럴 샘플링을 통한 정보 즉, 추가적인 데이터를 포함한다. 여기서, 추가 데이터는 외관 캡쳐, 환경 모니터링, 과학 이미징, 천문학 등을 포함한 많은 응용 분야에 사용될 수 있다.Unlike a conventional RGB camera, a hyperspectral image (or hyperspectral image) includes information through much higher density spectral sampling, that is, additional data. Here, additional data can be used for many applications, including exterior capture, environmental monitoring, scientific imaging, astronomy, and the like.

초분광 정보를 캡처하기 위해 하드웨어 아키텍쳐를 개발하는 데에 중점을 둔 연구가 다수 존재하며, 가장 직접적인 접근법은 가시 스펙트럴을 순차적으로 스캐닝하는 동안 다른 대역통과 또는 가변적 액정필터(LCTF; liquid crystal tunable flters)를 사용하여 파장 측정을 격리하는 시간-스펙트럴 스캐닝이다. 이 접근법의 스펙트럴 분해능은 사용된 필터의 수에 의해 제한된다. 시간 다중 샘플링은 미세 이동 단계(micro-translation stage) 또는 디지털 마이크로미러 디바이스(DMD)를 사용하여 도입되었다. 이외에도, 공간-스펙트럴 스캐닝 접근법은 슬릿을 통해 각 파장의 이미지열을 캡쳐한다. 최근의 다른 접근법으로는 만화경 기반 다중 샘플링, 재구성 가능 카메라 또는 하드웨어 비용 절감을 위한 디자인 등이 있다.There are a number of studies focusing on developing a hardware architecture to capture hyperspectral information, the most direct approach being different bandpass or liquid crystal tunable flters (LCTF) while sequentially scanning visible spectral. ) Is a time-spectral scanning that isolates wavelength measurements. The spectral resolution of this approach is limited by the number of filters used. Time multiple sampling was introduced using a micro-translation stage or a digital micromirror device (DMD). In addition, the space-spectral scanning approach captures a sequence of images of each wavelength through slits. Other recent approaches include kaleidoscope-based multiple sampling, reconfigurable cameras, or designs to reduce hardware costs.

상술한 바와 같이, 기존의 솔루션들은 액정 대역 통과 필터, 푸시브룸(pushbroom) 스캐너, 마이크로 변환 또는 디지털 미러 장치의 사용을 포함하여 새로운 하드웨어 아키텍쳐 설계에 중점을 두고 있다. 하지만, 기존의 솔루션들은 엔지니어링 비용 및 하드웨어 구축 비용 또는 정적 화면만 캡처해야 하는 등의 제한 요소를 공유한다. 게다가, 기존의 솔루션들의 공통적인 특징은 캡쳐된 결과에 나타나는 공간 해상도와 스펙트럴 정확도 사이의 트레이드 오프이다.As mentioned above, existing solutions are focused on designing new hardware architectures, including the use of liquid crystal bandpass filters, pushhbroom scanners, micro conversion or digital mirror devices. However, existing solutions share limitations such as engineering costs and hardware deployment costs or the need to capture only static screens. Moreover, a common feature of existing solutions is the trade-off between spatial resolution and spectral accuracy in the captured results.

이러한 트레이드 오프를 극복하기 위해 몇 가지 방법이 제안되었다.Several methods have been proposed to overcome this trade-off.

종래 일 실시예의 최적화 기술은 그래디언트의 희소성을 강조하기 위해 데이터 정확도 항과 총 변이 전체 표준 정규화 항을 정의하는 재구성 과정을 거치는데, 이 때 공간-스펙트럴 트레이드 오프를 극복하는 것을 목표로 한다. 이러한 최적화 기술은 두 가지 가정에 의존한다. 첫째, 초분광 성분은 공간 영역과 스펙트럴 영역 모두에서 매우 높은 상관 관계를 나타낸다. 둘째, 초분광 벡터는 저차원 상의 부분 공간에 속한다. 종래 일 실시예에 따른 기술들은 스펙트럴 차원에서 스펙트럴 균일 세그먼트가 존재한다고 가정하고, 스펙트럴 그래디언트가 대략 구분적으로 매끄럽다고 가정하며, 공간 상관을 추론하는 제한된 최적화 접근법을 도입한다. 그러나 이러한 접근법은 여전히 재구성된 이미지 구조 및 세부 사항에 인위적인 결과가 나타난다. In order to emphasize the scarcity of the gradient, the optimization technique of a conventional embodiment undergoes a reconstruction process that defines a data accuracy term and a total standardized term for total variation, with the goal of overcoming the spatial-spectral trade-off. This optimization technique relies on two assumptions. First, the hyperspectral component exhibits a very high correlation in both spatial and spectral domains. Second, the hyperspectral vector belongs to the low-dimensional subspace. Techniques according to one conventional embodiment assume that a spectral uniform segment exists at the spectral level, and assume that the spectral gradient is roughly distinctly smooth, and introduce a limited optimization approach to infer spatial correlation. However, this approach still produces artificial results in reconstructed image structures and details.

종래 다른 일 실시예의 코딩된 조리개 스냅샷 스펙트럴 이미징(CASSI)은 동적 장면을 캡처할 수 있는 가장 널리 사용되는 초분광 영상 방식 중 하나이다. 이러한 압축 기술의 정의 상 캡처된 코딩 정보는 최종 이미지를 생성하기 위해 재구성되어야 한다. CASSI는 스펙트럴 서명이 인코딩되는 방식에 따라 두 클래스 즉, (1) 단일 분산기를 사용하여 공간적으로 인코딩 된 CASSI(SD-CASSI), (2) 두 영역의 정보를 코딩하는 공간-스펙트럴 CASSI(SS-CASSI) 또는 이중 분산기 DDCASSI로 나눌 수 있따. 이러한 모든 기법은 공간 해상도와 스펙트럴 정확도 사이의 내재적인 절충점을 공유하므로 재구성 단계는 최종 이미지의 품질을 결정한다. Coded aperture snapshot spectral imaging (CASSI) of another conventional embodiment is one of the most widely used hyperspectral imaging methods capable of capturing dynamic scenes. By definition of this compression technique, the captured coding information must be reconstructed to produce the final image. CASSI has two classes depending on how the spectral signature is encoded: (1) spatially encoded CASSI (SD-CASSI) using a single spreader, and (2) spatial-spectral CASSI (coding for information in two regions). SS-CASSI) or double-disperser DDCASSI. All these techniques share an inherent trade-off between spatial resolution and spectral accuracy, so the reconstruction step determines the quality of the final image.

종래 다른 일 실시예의 기술에서 데이터 기반 방법은 내추럴 스펙트럴 이미지의 선형 표현을 희소 코딩된 사전 예를 들어, 공개된 초분광 영상 데이터 세트로 학습하는데, 일 예의 기술에서 재구성 중 노이즈 제거 방법을 제안한 바 있으며, 다른 일 예의 기술에서 하이 프레임 레이트의 팬크로매틱(panchromatic) 비디오와 로우 프레임 레이트의 초분광 정보를 결합하는 듀얼 카메라 시스템을 소개한 바도 있다. 팬크로매틱 정보는 과도 완료된(overcomplete) 사전을 배우는 데 사용될 수 있다. 또 다른 일 예의 기술에서 회절 격자가 갖춰진 공간-스펙트럴 인코딩 초분광 이미저(imager)를 소개한 바 있다.In the technique of another conventional embodiment, the data-based method learns a linear representation of a natural spectral image as a sparse coded dictionary, for example, an open hyperspectral image data set. In an example technique, a method for removing noise during reconstruction is proposed. Another example is the introduction of a dual camera system that combines high frame rate panchromatic video with low frame rate hyperspectral information. Panchromatic information can be used to learn overcomplete dictionaries. In another example technique, a space-spectral encoded hyperspectral imager equipped with a diffraction grating has been introduced.

본 발명의 실시예들은, 상세하게는 인공 지능 예를 들어, 컨볼루션 신경망(CNN; Convolutional Neural Network)의 일종이며 비선형 학습 모델인 컨볼루션 자동인코더(Convolutional Autoencoder)를 이용하여 고품질의 초분광 영상을 재구성할 수 있는 방법 및 장치를 제공한다.Embodiments of the present invention, in detail, artificial intelligence, for example, a type of convolutional neural network (CNN) and a nonlinear learning model using a convolutional autoencoder, a high-quality hyperspectral image. Provided is a method and apparatus for reconfiguration.

본 발명의 일 실시예에 따른 초분광 영상 재구성 방법은 영상에 대한 코딩된 데이터를 수신하는 단계; 및 미리 생성된 비선형 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계를 포함한다.An ultra-spectral image reconstruction method according to an embodiment of the present invention includes receiving coded data for an image; And reconstructing a hyperspectral image of the image for the coded data based on a pre-generated nonlinear learning model.

나아가, 본 발명의 일 실시예에 따른 초분광 영상 재구성 방법은 미리 설정된 초분광 영상 데이터 세트를 이용한 학습을 통해 비선형 학습 모델을 생성하는 단계를 더 포함하고, 상기 초분광 영상을 재구성하는 단계는 상기 생성된 비선형 학습 모델과 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성할 수 있다.Furthermore, the hyperspectral image reconstruction method according to an embodiment of the present invention further includes generating a nonlinear learning model through training using a preset hyperspectral image data set, and the reconstructing the hyperspectral image comprises: The hyperspectral image may be reconstructed based on the generated nonlinear learning model and the nonlinear optimization technique.

상기 비선형 학습 모델을 생성하는 단계는 상기 초분광 영상 데이터 세트를 이용한 학습을 통해 컨볼루션 자동인코더를 학습시켜 상기 비선형 학습 모델을 생성할 수 있다.The generating of the nonlinear learning model may generate the nonlinear learning model by learning a convolutional automatic encoder through learning using the hyperspectral image data set.

상기 비선형 학습 모델을 생성하는 단계는 상기 컨볼루션 자동 인코더를 이용하여 비선형 공간에서 인코더 네트워크를 학습시킨 후 디코더 네트워크를 이용하여 상기 비선형 학습 모델을 생성할 수 있다.The generating of the nonlinear learning model may generate the nonlinear learning model using a decoder network after training the encoder network in a nonlinear space using the convolutional automatic encoder.

상기 컨볼루션 자동 인코더는 상기 초분광 영상 데이터 세트를 비선형 표현으로 변환하는 인코더 네트워크와 상기 비선형 표현으로부터 원본 데이터 세트를 생성하는 디코더 네트워크를 포함할 수 있다.The automatic convolution encoder may include an encoder network that converts the hyperspectral image data set into a nonlinear representation and a decoder network that generates an original data set from the nonlinear representation.

상기 비선형 학습 모델은 초분광 영상에 대한 비선형 재구성을 출력하는 학습 모델일 수 있다.The nonlinear learning model may be a learning model that outputs a nonlinear reconstruction of hyperspectral images.

상기 초분광 영상을 재구성하는 단계는 상기 생성된 비선형 학습 모델에 대한 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)의 희소성(sparsity)을 공동으로 정규화하는 상기 비선형 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수 있다.Reconstructing the hyperspectral image is based on the nonlinear optimization technique that jointly normalizes the accuracy of the nonlinear spectral representation for the generated nonlinear learning model and the sparsity of gradients in the spatial domain. It is possible to reconstruct the hyperspectral image of the image for the coded data.

상기 초분광 영상을 재구성하는 단계는 ADMM(alternating direction multiplier) 방식을 사용하여 상기 비선형 최적화 기법을 반복 수행함으로써, 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수 있다.The reconstructing of the hyperspectral image may reconstruct the hyperspectral image of the image with respect to the coded data by repeatedly performing the nonlinear optimization technique using an alternating direction multiplier (ADMM) method.

상기 수신하는 단계는 압축 하이퍼스펙트럴 이미징 접근법을 이용하여 상기 영상에 대한 코딩된 데이터를 수신할 수 있다.The receiving step may receive coded data for the image using a compressed hyperspectral imaging approach.

본 발명의 다른 일 실시예에 따른 초분광 영상 재구성 방법은 영상에 대한 코딩된 데이터를 수신하는 단계; 및 미리 학습된 스펙트럴 프라이어에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계를 포함한다.An ultra-spectral image reconstruction method according to another embodiment of the present invention comprises the steps of receiving coded data for the image; And reconstructing a hyperspectral image of the image for the coded data based on the previously learned spectral fryer.

나아가, 본 발명의 다른 일 실시예에 따른 초분광 영상 재구성 방법은 미리 설정된 초분광 영상 데이터 세트를 이용하여 상기 스펙트럴 프라이어(prior)를 학습시키는 단계를 포함하고, 상기 초분광 영상을 재구성하는 단계는 상기 학습된 스펙트럴 프라이어와 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성할 수 있다.Furthermore, a method for reconstructing a hyperspectral image according to another embodiment of the present invention includes learning the spectral prior using a preset hyperspectral image data set, and reconstructing the hyperspectral image. May reconstruct the hyperspectral image based on the learned spectral fryer and the nonlinear optimization technique.

상기 초분광 영상을 재구성하는 단계는 상기 학습된 스펙트럴 프라이어에 대한 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)의 희소성(sparsity)을 공동으로 정규화하는 상기 비선형 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수 있다.Reconstructing the hyperspectral image is based on the nonlinear optimization technique that jointly normalizes the accuracy of the nonlinear spectral representation for the learned spectral fryer and the sparsity of gradients in the spatial domain. It is possible to reconstruct the hyperspectral image of the image for the coded data.

상기 초분광 영상을 재구성하는 단계는 ADMM(alternating direction multiplier) 방식을 사용하여 상기 비선형 최적화 기법을 반복 수행함으로써, 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수 있다.The reconstructing of the hyperspectral image may reconstruct the hyperspectral image of the image with respect to the coded data by repeatedly performing the nonlinear optimization technique using an alternating direction multiplier (ADMM) method.

본 발명의 일 실시예에 따른 초분광 영상 재구성 장치는 영상에 대한 코딩된 데이터를 수신하는 수신부; 및 미리 생성된 비선형 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 재구성부를 포함한다.An apparatus for reconstructing hyperspectral images according to an embodiment of the present invention includes a receiver configured to receive coded data for an image; And a reconstruction unit reconstructing a hyperspectral image of the image for the coded data based on a previously generated nonlinear learning model.

나아가, 본 발명의 일 실시예에 따른 초분광 영상 재구성 장치는 미리 설정된 초분광 영상 데이터 세트를 이용한 학습을 통해 비선형 학습 모델을 생성하는 생성부를 더 포함하고, 상기 재구성부는 상기 생성된 비선형 학습 모델과 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성할 수 있다.Furthermore, the apparatus for reconstructing hyperspectral images according to an embodiment of the present invention further includes a generation unit for generating a nonlinear learning model through learning using a preset hyperspectral image data set, and the reconstruction unit is configured to generate the nonlinear learning model. The hyperspectral image may be reconstructed based on a nonlinear optimization technique.

상기 생성부는 상기 초분광 영상 데이터 세트를 이용한 학습을 통해 컨볼루션 자동인코더를 학습시켜 상기 비선형 학습 모델을 생성할 수 있다.The generation unit may generate the nonlinear learning model by learning a convolutional automatic encoder through learning using the hyperspectral image data set.

상기 생성부는 상기 컨볼루션 자동 인코더를 이용하여 비선형 공간에서 인코더 네트워크를 학습시킨 후 디코더 네트워크를 이용하여 상기 비선형 학습 모델을 생성할 수 있다.The generation unit may train the encoder network in a nonlinear space using the convolutional automatic encoder and then generate the nonlinear learning model using a decoder network.

상기 컨볼루션 자동 인코더는 상기 초분광 영상 데이터 세트를 비선형 표현으로 변환하는 인코더 네트워크와 상기 비선형 표현으로부터 원본 데이터 세트를 생성하는 디코더 네트워크를 포함할 수 있다.The automatic convolution encoder may include an encoder network that converts the hyperspectral image data set into a nonlinear representation and a decoder network that generates an original data set from the nonlinear representation.

상기 비선형 학습 모델은 초분광 영상에 대한 비선형 재구성을 출력하는 학습 모델일 수 있다.The nonlinear learning model may be a learning model that outputs a nonlinear reconstruction of hyperspectral images.

상기 재구성부는 상기 생성된 비선형 학습 모델에 대한 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)의 희소성(sparsity)을 공동으로 정규화하는 상기 비선형 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수 있다.The reconstruction unit is an image for the coded data based on the nonlinear optimization technique that jointly normalizes the accuracy of nonlinear spectral representation for the generated nonlinear learning model and the sparity of gradients in the spatial domain. Can reconstruct the hyperspectral image of.

상기 재구성부는 ADMM(alternating direction multiplier) 방식을 사용하여 상기 비선형 최적화 기법을 반복 수행함으로써, 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수 있다.The reconstruction unit may reconstruct the hyperspectral image of the image for the coded data by repeatedly performing the nonlinear optimization technique using an alternating direction multiplier (ADMM) method.

상기 수신부는 압축 하이퍼스펙트럴 이미징 접근법을 이용하여 상기 영상에 대한 코딩된 데이터를 수신할 수 있다.The receiver can receive coded data for the image using a compressed hyperspectral imaging approach.

본 발명의 또 다른 일 실시예에 따른 초분광 영상 재구성 방법은 영상에 대한 코딩된 데이터를 수신하는 단계; 및 미리 학습된 학습 모델과 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계를 포함한다.A method of reconstructing a hyperspectral image according to another embodiment of the present invention includes receiving coded data for an image; And reconstructing a hyperspectral image of the image for the coded data based on a pre-trained learning model and optimization technique.

본 발명의 실시예들에 따르면, 인공 지능 예를 들어, 컨볼루션 신경망(CNN; Convolutional Neural Network)의 일종이며 비선형 학습 모델인 컨볼루션 자동인코더(Convolutional Autoencoder)를 이용하여 고품질의 초분광 영상을 재구성함으로써, 기존의 어떤 압축 이미징 아키텍처에 적용할 수 있다.According to embodiments of the present invention, artificial intelligence, for example, is a kind of convolutional neural network (CNN) and reconstructs high-quality hyperspectral images using a nonlinear learning model, a convolutional autoencoder. By doing so, it can be applied to any existing compression imaging architecture.

본 발명의 실시예들에 따르면, 스펙트럴 정확도와 공간 해상도 측면에서 각 아키텍처의 최첨단 방식을 능가하면서도 계산 복잡성은 희소 코딩 기술과 관련하여 2배 정도 감소시킬 수 있다.According to embodiments of the present invention, in terms of spectral accuracy and spatial resolution, the computational complexity can be reduced by a factor of two with respect to the sparse coding technique while surpassing the state-of-the-art method of each architecture.

본 발명의 실시예들에 따르면, 프로젝트 웹 사이트를 통해 제공되는 기존 방법보다 더 다양한 스펙트럴의 선명한 이미지를 포함하는 새로운 고해상도 초분광 데이터 세트를 제공할 수 있다.According to embodiments of the present invention, it is possible to provide a new high-resolution hyperspectral data set that includes a clear image of more spectral than the existing method provided through the project website.

도 1은 본 발명에 따른 방법과 기존 방법들을 비교한 일 예시도를 나타낸 것이다.
도 2는 SD-CASSI, SS-CASSI 및 이중 분산기 DD-CASSI 시스템에서 사용된 공간 인코딩에 대한 일 예시도를 나타낸 것이다.
도 3은 인코딩된 센서 신호에서 하이퍼스펙트럴 이미지를 재구성하는 2단계 프로세스의 개요를 나타낸 것이다.
도 4는 컨볼루션 자동 인코더에 대한 일 예시도를 나타낸 것이다.
도 5는 자동 인코더의 재구성 정확도에 대한 일 예시도를 나타낸 것이다.
도 6은 콜럼비아 이미지 데이터 세트에 대한 평균 결과에 대한 일 예시도를 나타낸 것이다.
도 7은 콜럼비아 데이터 세트의 컬러 체커 하이퍼 스펙트럴 이미지에 대한 대조비교를 나타낸 것이다.
도 8은 Twist, SpaRSA, 희소 코딩 및 본 발명의 방법을 사용하여 표준 공간 주파수 측정 차트(ISO 12233)를 재구성한 결과를 나타낸 것이다.
도 9는 본 발명의

Figure 112018079687404-pat00001
-충실도 프라이어의 영향에 대한 일 예시도를 나타낸 것이다.
도 10은 숨겨진 레이어 수가 재구성의 공간 해상도에 미치는 영향을 나타낸 것이다.
도 11은 본 발명과 기존 방법들에 대한 재구성 결과를 나타낸 것이다.
도 12는 본 발명에 의해 생성된 초분광 영상 데이터 세트에 대한 예시도를 나타낸 것이다.
도 13은 본 발명과 실측값 그리고 다른 방법들과 비교한 결과를 나타낸 것이다.
도 14는 본 발명과 회귀 기반 방법에 대해 스펙트럴 반사 정확도와 공간 구조 정확도를 비교한 일 예시도를 나타낸 것이다.
도 15는 본 발명의 초분광 영상 시스템과 이에 대한 결과의 예시도를 나타낸 것이다.
도 16은 본 발명이 스펙트럴 재구성에 대한 결과를 나타낸 것이다.
도 17은 본 발명에서의 제한 예를 나타낸 것이다.1 shows an exemplary diagram comparing a method according to the present invention and an existing method.
2 shows an exemplary diagram for spatial encoding used in SD-CASSI, SS-CASSI, and dual spreader DD-CASSI systems.
3 shows an overview of a two-step process for reconstructing a hyperspectral image from an encoded sensor signal.
4 shows an exemplary diagram for a convolutional automatic encoder.
5 shows an exemplary diagram for the reconstruction accuracy of an automatic encoder.
6 shows an exemplary diagram for an average result for a Columbia image data set.
7 shows a contrast comparison for a color checker hyper spectral image of the Columbia data set.
8 shows the results of reconstructing a standard spatial frequency measurement chart (ISO 12233) using Twist, SpaRSA, sparse coding, and the method of the present invention.
9 is the present invention
Figure 112018079687404-pat00001
-Fidelity is an example of the effect of the fryer.
10 shows the effect of the number of hidden layers on the spatial resolution of reconstruction.
11 shows the reconstruction results for the present invention and the existing methods.
12 shows an exemplary view of a hyperspectral image data set generated by the present invention.
13 shows the results of comparing the present invention with actual values and other methods.
14 shows an exemplary diagram comparing spectral reflection accuracy and spatial structure accuracy for the present invention and the regression-based method.
15 shows an exemplary view of the hyperspectral imaging system of the present invention and its results.
Figure 16 shows the results of the present invention for spectral reconstruction.
17 shows an example of limitation in the present invention.

이하, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. However, the present invention is not limited or limited by the embodiments. In addition, the same reference numerals shown in each drawing denote the same members.

본 발명은 개별 선정된(hand-crafted) 만들어진 프라이어(prior)를 신경망으로 트레이닝된 데이터 구동 프라이어(data-driven prior)로 대체함으로써, 문제에 따른 부작용을 줄이고, 자연스러운 초분광 영상의 비선형 표현 도입을 가능하게 할 수 있다.The present invention replaces the hand-crafted made fryer with a data-driven prior trained with a neural network, thereby reducing side effects caused by problems and introducing nonlinear representation of natural hyperspectral images. It can be enabled.

본 발명의 신규한 스펙트럴 재구성 알고리즘은 SD-CASSI, SS-CASSI 및 DD-CASSI와 같은 임의의 압축 이미징 기술로 캡처된 입력에 적용될 수 있으며, 다른 기존의 데이터 구동 방식에 비해 빠른 속도와 나은 결과를 제공한다.The novel spectral reconstruction algorithm of the present invention can be applied to the input captured by any compression imaging technology such as SD-CASSI, SS-CASSI and DD-CASSI, and is faster and better than other conventional data driving methods. Provides

본 발명은 비선형 표현을 생성하는 컨볼루션 자동 인코더를 사용한다. 본 발명은 새로운 전역 최적화 기법을 통해 비선형 표현의 정확도를 공동으로 조정함으로써, 정확성과 효율성을 향상시킬 수 있다.The present invention uses a convolutional automatic encoder that generates a nonlinear representation. The present invention can improve accuracy and efficiency by jointly adjusting the accuracy of the nonlinear representation through a new global optimization technique.

이러한 본 발명은 기존의 압축 이미징 기법에서 스펙트럴 정확도와 공간 해상도 사이의 오래된 트레이드 오프를 극복하는 새로운 초분광 영상 재구성 알고리즘을 제시한다.The present invention proposes a new hyperspectral image reconstruction algorithm that overcomes the old trade-off between spectral accuracy and spatial resolution in conventional compression imaging techniques.

본 발명에 따른 방법은 두 단계로 구성된다. 먼저, 본 발명은 실제 초분광(또는 하이퍼스펙트럴)(hyperspectral) 데이터 세트로부터 비선형 스펙트럴 표현을 학습한다. 이를 위해, 인코더 및 디코더 네트워크를 통해 자체 입력을 재구성 할 수 있는 컨볼루션 자동 인코더를 구축한다. 그 다음, 본 발명은 새로운 정확도 프라이어(prior)에 의해 학습된 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)(또는 그래디언트)의 희소성(sparsity)을 공동으로 정규화하는 새로운 최적화 방법을 공식화한다. 본 발명에 따른 방법은 기존의 어떤 압축 이미징 아키텍처에나 적용될 수 있으며 시뮬레이션 및 프로토타입 초분광 영상 시스템 구축을 통한 테스트를 통해 그 결과를 확인할 수 있다. 본 발명에 따른 기술은 스펙트럴 정확도와 공간 해상도 측면에서 각 아키텍처의 최첨단 방식을 능가하면서도 계산 복잡성은 희소 코딩(sparse coding) 기술과 관련하여 2배 정도 감소시킬 수 있다. 또한, 본 발명은 초분광 보간법과 디모자이싱(demosaicing, 디지털 카메라의 모자이크 형태의 컬러필터배열에 의해 만들어진 샘플을 풀 컬러 이미지로 변환하는 것)을 제공할 수 있으며, 프로젝트 웹 사이트를 통해 제공되는 기존 방법보다 더 다양한 스펙트럴의 선명한 이미지를 포함하는 새로운 고해상도 초분광 데이터 세트를 제공할 수 있다.The method according to the invention consists of two steps. First, the present invention learns a nonlinear spectral representation from an actual hyperspectral (or hyperspectral) data set. To this end, we build a convolutional automatic encoder that can reconstruct its own input through an encoder and decoder network. Next, the present invention formulates a new optimization method that jointly normalizes the accuracy of nonlinear spectral representations learned by a new accuracy prior and the sparsity of gradients (or gradients) in the spatial domain. do. The method according to the present invention can be applied to any existing compression imaging architecture, and the results can be confirmed through tests through simulation and prototype hyperspectral imaging system construction. The technology according to the present invention surpasses the state-of-the-art method of each architecture in terms of spectral accuracy and spatial resolution, while the computational complexity can be reduced by a factor of two with respect to sparse coding technology. In addition, the present invention can provide hyperspectral interpolation and demosaicing (converting a sample made by a mosaic type color filter arrangement of a digital camera into a full color image), which is provided through a project website. It can provide a new high-resolution hyperspectral data set that contains sharper images of more spectral than conventional methods.

또한, 본 발명은 재구성 알고리즘의 모든 요인과 파라미터에 대한 심층 분석을 제공하고, 새로운 고해상도 초분광 영상 데이터 세트를 캡쳐할 수 있다. 여기서, 데이터 세트는 낮은 공간 해상도로 인해 이미지가 초점을 약간 벗어나거나 제한된 스펙트럴 범위를 나타내는 다른 기존 데이터 세트의 제한된 부분을 수정한 것일 수 있다.In addition, the present invention provides in-depth analysis of all factors and parameters of the reconstruction algorithm, and can capture new high-resolution hyperspectral image data sets. Here, the data set may be a modification of a limited portion of another existing data set in which the image is slightly out of focus due to low spatial resolution or exhibits a limited spectral range.

본 발명은 새로운 데이터베이스를 본 발명의 모델 및 코드와 함께 프로젝트 웹 사이트에서 공개적으로 이용하도록 할 수도 있다.The present invention may make the new database publicly available on the project website along with the model and code of the present invention.

본 발명은 인공 지능 예를 들어, 컨볼루션 신경망(CNN; Convolutional Neural Network)의 일종이며 비선형 학습 모델인 컨볼루션 자동인코더(Convolutional Autoencoder)와 비선형 최적화 기법을 조인트하게(jointly) 결합하여 사용하는 것을 특징으로 한다. 이러한 본 발명에 대해 도 1 내지 도 17을 참조하여 상세히 설명한다.The present invention is characterized by using artificial intelligence, for example, a convolutional neural network (CNN) and a nonlinear learning model, a convolutional autoencoder, and a nonlinear optimization technique jointly combined. Is done. The present invention will be described in detail with reference to FIGS. 1 to 17.

코딩된 조리개에 의해 각인된 스펙트럴 시그니처는 압축 초분광 영상의 기본 빌딩 블록이다. 이로부터, 이미지는 최적화 수단에 의해 재구성된다. 이 스펙트럴 정보를 인코딩하는 두 가지 주요 방법은 공간 인코딩과 공간-스펙트럴 인코딩이다. 도 2는 SD-CASSI, SS-CASSI 및 이중 분산기 DD-CASSI 시스템에서 사용된 공간 인코딩에 대한 일 예시도를 나타낸 것으로, 도 2a에 도시된 SD-CASSI 시스템에서 사용된 공간 인코딩에 도시된 바와 같이 스펙트럴의 코딩된 사영이 먼저 생성되고, 이에 이어서 분산에 의해 전단된다. 따라서 SD-CASSI의 재구성 단계는 전단 및 코딩된 정보로 이미지를 재구성한다. 그리고, 도 2b에 도시된 SS-CASSI 및 이중 분산기 DD-CASSI 시스템에서 사용된 공간 인코딩에 도시된 바와 같이 해당 접근법은 입사 광선을 먼저 분산시킨 다음 마스크가 코딩된 사영을 생성하며 추가 광학 장치는 이 정보를 보정한다. 결과적으로 SS-CASSI 및 DD-CASSI의 스펙트럴 재구성에는 SD-CASSI보다 간단한 최적화가 필요하므로 보다 복잡한 광학 설치 비용으로 우수한 결과를 얻을 수 있다.The spectral signature imprinted by the coded aperture is the basic building block of a compressed hyperspectral image. From this, the image is reconstructed by means of optimization. The two main ways to encode this spectral information are spatial encoding and spatial-spectral encoding. FIG. 2 shows an exemplary diagram for spatial encoding used in the SD-CASSI, SS-CASSI and dual spreader DD-CASSI systems, as shown in spatial encoding used in the SD-CASSI system shown in FIG. 2A. The spectral coded projection is first generated and then sheared by dispersion. Therefore, the reconstruction step of SD-CASSI reconstructs the image with the sheared and coded information. And, as shown in the spatial encoding used in the SS-CASSI and double-disperser DD-CASSI systems shown in Fig. 2B, the approach first disperses the incident light beam, then creates a mask-coded projection, and the additional optical device Correct the information. As a result, spectral reconstruction of SS-CASSI and DD-CASSI requires simpler optimization than SD-CASSI, which provides excellent results at a more complex optical installation cost.

본 발명은 압축 입력을 이용한 초분광 영상 재구성에 중점을 둔다. 따라서 본 발명에 따른 방법은 입력 스펙트럴 데이터의 특정 인코딩에 대해 불가지론적이다. 계산상의 이점을 고려하여 본 발명은 재구성 알고리즘을 테스트하기 위한 첫 번째 선택으로 공간 스펙트럴 인코딩을 사용하며, 이에 대한 상세한 설명은 후술한다.The present invention focuses on reconstructing hyperspectral images using compressed input. Thus, the method according to the invention is agnostic for a particular encoding of input spectral data. Considering the computational advantage, the present invention uses spatial spectral encoding as the first option for testing the reconstruction algorithm, and a detailed description thereof will be described later.

이미지 형성Image formation

Figure 112018079687404-pat00002
는 위치
Figure 112018079687404-pat00003
에서 파장
Figure 112018079687404-pat00004
를 갖는 광의 분광 강도를 나타낸다. 마스크는 분산 함수
Figure 112018079687404-pat00005
에 따라, 분산이 전송 함수
Figure 112018079687404-pat00006
에 의해 주어진 코딩된 패턴을 생성하고, 분산은 수평 축을 따라 전단을 생성한다. 공간 인코딩 예를 들어, SD-CASSI에서 센서
Figure 112018079687404-pat00007
상의 투사된 광 세기는 모든 가시 파장
Figure 112018079687404-pat00008
에 걸쳐 적분으로서 아래 <수학식 1>과 같이 나타낼 수 있다.
Figure 112018079687404-pat00002
Is located
Figure 112018079687404-pat00003
Wavelength
Figure 112018079687404-pat00004
It represents the spectral intensity of light having a. Mask is a variance function
Figure 112018079687404-pat00005
Depending on the variance, the transfer function
Figure 112018079687404-pat00006
Generates the coded pattern given by, and variance produces shear along the horizontal axis. Spatial encoding e.g. from SD-CASSI sensor
Figure 112018079687404-pat00007
The projected light intensity of the image is all visible wavelengths.
Figure 112018079687404-pat00008
The integral can be expressed as <Equation 1> below.

[수학식 1][Equation 1]

Figure 112018079687404-pat00009
Figure 112018079687404-pat00009

대조적으로, 공간-스펙트럴 인코딩 예를 들어, DD-CASSI의 경우에서 전단 스펙트럼

Figure 112018079687404-pat00010
는 코딩된 마스크
Figure 112018079687404-pat00011
에 의해 변조되고, 결과는
Figure 112018079687404-pat00012
에 의해 반대 방향으로 비시각화되며, 센서
Figure 112018079687404-pat00013
상의 투사된 광 세기는 모든 가시 파장
Figure 112018079687404-pat00014
에 걸쳐 적분으로서 아래 <수학식 2>와 같이 나타낼 수 있다.In contrast, the shear spectrum in the case of space-spectral encoding e.g. DD-CASSI
Figure 112018079687404-pat00010
Is a coded mask
Figure 112018079687404-pat00011
Modulated by, and the result is
Figure 112018079687404-pat00012
Is visualized in the opposite direction by the sensor
Figure 112018079687404-pat00013
The projected light intensity of the image is all visible wavelengths
Figure 112018079687404-pat00014
The integral can be expressed as <Equation 2> below.

[수학식 2][Equation 2]

Figure 112018079687404-pat00015
Figure 112018079687404-pat00015

여기서, 수평 분산 함수

Figure 112018079687404-pat00016
의 부호는 역전될 수 있다.Where the horizontal variance function
Figure 112018079687404-pat00016
The sign of can be reversed.

행렬 벡터 형태에서,

Figure 112018079687404-pat00017
채널을 갖는 초분광 영상(또는 하이퍼스펙트럴 이미지)는
Figure 112018079687404-pat00018
로 표현 될 수 있는데, 여기서
Figure 112018079687404-pat00019
와 H와 W는 이미지의 공간 차원일 수 있다. 투과율은 희소 변조 행렬
Figure 112018079687404-pat00020
를 통해 나타낼 수 있는데, 여기서
Figure 112018079687404-pat00021
는 센서의 픽셀 수 일 수 있다. 이 행렬은 각 파장에 대한
Figure 112018079687404-pat00022
부분 행렬로 구성될 수 있으며,
Figure 112018079687404-pat00023
Figure 112018079687404-pat00024
의 결과는 아래 <수학식 3>에 나타낸 바와 같이 캡쳐된 이미지
Figure 112018079687404-pat00025
을 도출한다.In matrix vector form,
Figure 112018079687404-pat00017
Hyperspectral images (or hyperspectral images) with channels
Figure 112018079687404-pat00018
Can be expressed as, where
Figure 112018079687404-pat00019
And H and W may be spatial dimensions of the image. Transmittance is sparse modulation matrix
Figure 112018079687404-pat00020
Can be represented by, where
Figure 112018079687404-pat00021
May be the number of pixels of the sensor. This matrix is for each wavelength
Figure 112018079687404-pat00022
It can be composed of partial matrices,
Figure 112018079687404-pat00023
Wow
Figure 112018079687404-pat00024
The result of the image captured as shown in <Equation 3> below
Figure 112018079687404-pat00025
To derive.

[수학식3][Equation 3]

Figure 112018079687404-pat00026
Figure 112018079687404-pat00026

이 방정식은

Figure 112018079687404-pat00027
이므로 상당히 불확실한 시스템을 설명한다.This equation
Figure 112018079687404-pat00027
Therefore, it describes a fairly uncertain system.

본 발명은 과도 완료된(overcomplete) 사전의 선형 조합을 사용하는 일반적인 희소 코딩 접근 방식 대신 컨볼루션 자동 인코딩기를 통해 학습된 비선형 연산자를 사용한다는 점에서 의미가 있다.The present invention is meaningful in that it uses a nonlinear operator trained through a convolutional auto-encoder instead of a common sparse coding approach that uses a linear combination of overcomplete dictionaries.

일반 압축 감지 vs. 압축 Normal compression detection vs. compression 하이퍼스펙트럴Hyperspectral 이미징Imaging

압축 하이퍼스펙트럴 이미징(HSI)은 일반적인 압축 센싱(CS)의 접근법 측면에서 고려 될 수 있다. 그러나 압축 HSI에는 고품질 결과를 얻기 위해 보다 특수한 솔루션이 필요한 몇 가지 특성이 있다. CS는 2D 패치에서 공간 이미지 구조를 재구성한다. 색상 정보는 별도로 계산된 세 가지 색상 채널의 재구성을 결합하여 암시적으로 재구성된다. 반대로 HSI는 스펙트럴 이미지를 3D 텐서로 재구성하며 스펙트럴 차원에서 더 강한 압축을 하여 더 높은 복잡성을 갖는다. 분산으로 인해 겹쳐진 것처럼 나타나기 때문에 일반적인 CS와 같이 색을 재구성 할 수는 없다.Compression hyperspectral imaging (HSI) can be considered in terms of the approach of general compression sensing (CS). However, compressed HSI has several characteristics that require a more specialized solution to achieve high quality results. CS reconstructs the spatial image structure in the 2D patch. The color information is implicitly reconstructed by combining the reconstruction of three separately calculated color channels. Conversely, HSI reconstructs the spectral image into a 3D tensor and has higher complexity by performing stronger compression at the spectral level. Since it appears to overlap due to dispersion, it is not possible to reconstruct the color as in normal CS.

본 발명의 HSI 접근법에서 단색 센서가 31개의 스펙트럴 채널을 캡처한다. 도 1의 좌측 상단에 도시된 바와 같이, 스펙트럴과 공간 도메인을 결합한 분산(캡처된 코딩 정보에서 명확하게 보여짐)은 HSI에서 공간과 스펙트럴 해상도 간 일반적인 트레이드오프로 이어진다.In the HSI approach of the present invention, a monochromatic sensor captures 31 spectral channels. As shown in the upper left of FIG. 1, the variance combining spectral and spatial domains (which is clearly seen in the captured coding information) leads to a general tradeoff between spatial and spectral resolution in HSI.

도 1에 도시된 바와 같이, 본 발명에 따른 초분광 재구성 알고리즘은 기존의 다른 압축 이미징 아키텍처의 입력과 함께 작동하며 고품질 결과를 산출할 수 있다. 이러한 결과는 스펙트럴 정확도와 공간 해상도의 측면에서 모두 나타나며, 비교 결과에 따르면 본 발명(Ours)의 결과는 기존의 다른 방법에 비해 크게 향상된 것을 알 수 있다. 예를 들어, TwIST와 SpaRSA는 일반적으로 최적 이하의 공간 재구성을 제공하지만, 희소 코딩은 컬러 차트의 노이즈 재구성을 제공할 수 있다. 하지만, 희소 코딩은 커피 잔에 녹색 테두리를 정확하게 재구성하지 못한다. 오른쪽의 차트는 본 발명의 재구성이 실측 데이터와 얼마나 잘 맞는지를 보여주고 있다. 나아가, 본 발명은 새로운 고해상도의 초분광 영상 데이터 세트를 제공할 수 있다.As shown in Fig. 1, the hyperspectral reconstruction algorithm according to the present invention works in conjunction with the input of other conventional compression imaging architectures and can produce high quality results. These results appear both in terms of spectral accuracy and spatial resolution, and according to the comparison results, it can be seen that the results of the present invention (Ours) are significantly improved compared to other conventional methods. For example, TwIST and SpaRSA generally provide sub-optimal spatial reconstruction, but sparse coding can provide color chart noise reconstruction. However, sparse coding does not accurately reconstruct the green rim on the coffee cup. The chart on the right shows how well the reconstruction of the present invention fits the actual data. Furthermore, the present invention can provide a new high resolution hyperspectral image data set.

초분광Hyperspectral 영상 재구성( Image reconstruction ( HYPERSPECTRALHYPERSPECTRAL IMAGE RECONSTRUCTION) IMAGE RECONSTRUCTION)

도 3은 인코딩된 센서 신호에서 하이퍼스펙트럴 이미지를 재구성하는 2단계 프로세스의 개요를 나타낸 것이다. 먼저, 실제 하이퍼스펙트럴 이미지 텐서의 비선형 표현을 배우기 위해 컨볼루션 자동 인코더를 학습시킨다. 이 비선형성은 본 발명이 실제 스펙트럴 기능의 더 넓은 범위를 포괄할 수 있게 해주기 때문에 본 발명의 재구성 방식에 있어 핵심적인 측면이다. 둘째, 본 발명은 비선형 최적화 문제를 전역적으로 해결함으로써 인코딩된 입력으로부터 하이퍼스펙트럴 이미지를 재구성한다. 본 발명에서 중요한 측면으로, 실제 스펙트럼의 데이터 기반 자동 인코딩 표현을 재구성된 신호로 강제 적용하는 새로운 프라이어를 도입한다. 본 발명의 공식은 상기 항과 그래디언트의 희소성을 공동으로 조정하여 최종 하이퍼스펙트럴 이미지를 재구성하는 것이다.3 shows an overview of a two-step process for reconstructing a hyperspectral image from an encoded sensor signal. First, we train an automatic convolutional encoder to learn the nonlinear representation of a real hyperspectral image tensor. This nonlinearity is a key aspect of the reconfiguration scheme of the present invention as it allows the present invention to cover a wider range of actual spectral functions. Second, the present invention reconstructs the hyperspectral image from the encoded input by solving the nonlinear optimization problem globally. As an important aspect of the present invention, a new fryer forcing the actual spectrum data-based automatic encoding representation into a reconstructed signal is introduced. The formula of the present invention is to reconstruct the final hyperspectral image by jointly adjusting the sparsity of the term and the gradient.

컨볼루션 신경망은 스펙트럴 이미지 분류, 또는 이미지로부터 특성을 추출하기 위해 사용될 수 있다. 하지만, 본 발명은 추출된 특성들로부터 원래의 신호를 재구성하려는 것은 아니다. 한편 자동 인코딩 장치는 출력 레이어와 입력 레이어가 같은 수의 노드를 공유하며 인코더 및 디코더 기능을 통해 자체 입력을 재구성 할 수 있는 신경망일 수 있는데, 스펙트럴 이미지 분류 또는 디노이징(denoising)에 사용될 수 있다. 기존 일 예의 기술에서 컨볼루션 자동 인코더를 제안하였는데, 여기서 컨볼루션 연산과 활성화 함수는 각 계층에서 작동한다. 이것은 객체 검색, 이미지 분류, 디노이징, 또는 실시간 비행 영상에서의 다중 경로 간섭의 실시간 보정에 성공적으로 적용된다.Convolutional neural networks can be used to classify spectral images, or to extract features from images. However, the present invention is not intended to reconstruct the original signal from the extracted characteristics. On the other hand, the automatic encoding device may be a neural network in which the output layer and the input layer share the same number of nodes and can reconstruct their own input through the encoder and decoder functions, which can be used for spectral image classification or denoising. . In the existing example technique, an automatic convolution encoder is proposed, where the convolution operation and the activation function operate at each layer. It is successfully applied to object retrieval, image classification, de-noising, or real-time correction of multipath interference in real-time flight images.

본 발명에서는 컨볼루션 자동 인코더를 활용하여 비선형 공간에서 하이퍼스펙트럴 이미지의 표현을 배우기 위해 인코더 네트워크를 먼저 학습시킨 다음 디코더 네트워크를 사용하여 코딩된 센서 데이터에서 최종 이미지를 재구성한다.In the present invention, an encoder network is first trained to learn the representation of a hyperspectral image in a nonlinear space by utilizing a convolutional automatic encoder, and then a final image is reconstructed from coded sensor data using a decoder network.

기존 기술과 유사하게, 본 발명은 하이퍼스펙트럴 벡터가 숨겨진 표현의 부분 공간에 속한다고 가정한다. 그러나, 본 발명은 미리 결정된 베이스(이산 코사인 변환 또는 웨이블릿 등) 또는 사전 기반의 희소 코딩(sparse coding)을 사용하는 대신, 입력 신호를 기저벡터 및 계수집합으로 분해하기 위해 컨볼루션 자동 인코더를 사용한다. 더욱이 일반적인 희소 코딩 접근법은 일반적으로 기본 함수의 선형 결합으로 신호를 재구성하지만 자동 인코딩은 하이퍼스펙트럴 정보의 비선형 재구성을 허용하여 문제의 비선형성을 보다 잘 충족시킴으로써 더 나은 결과를 유도할 수 있다.Similar to the existing technique, the present invention assumes that the hyperspectral vector belongs to the subspace of the hidden expression. However, the present invention uses an automatic convolutional encoder to decompose the input signal into a base vector and a set of coefficients, instead of using a predetermined base (such as discrete cosine transform or wavelet) or dictionary-based sparse coding. . Moreover, a common sparse coding approach generally reconstructs the signal with a linear combination of basic functions, but automatic encoding allows nonlinear reconstruction of hyperspectral information to better meet the nonlinearity of the problem, leading to better results.

본 발명에서의 컨볼루션 자동 인코더는 도 4에 도시된 바와 같이, 두가지 서브 네트워크로 구성될 수 있는데, 입력 학습 데이터 세트를 비선형 표현으로 변환하는 인코더 네트워크(도 4의 녹색 블록)와 이 비선형 표현으로부터 원본 데이터 세트를 생성하는 디코더 네트워크(도 4의 빨간색 블록)가 그것이다. 형식적으로, 컨볼루션 자동 인코더 A()는 인코더 함수 E()와 디코더 함수 D()의 합성이다.The convolutional automatic encoder in the present invention can be composed of two sub-networks, as shown in Fig. 4, from an encoder network (green block in Fig. 4) that converts an input learning data set into a non-linear representation and from this non-linear representation. It is the decoder network (red block in Fig. 4) that creates the original data set. Formally, the convolutional automatic encoder A() is a synthesis of the encoder function E() and decoder function D().

본 발명은 네트워크를 학습한 후, 하이퍼스펙트럴 이미지 h를 인코더 함수

Figure 112018079687404-pat00028
를 사용하여 비선형 표현
Figure 112018079687404-pat00029
로 변환할 수 있다. 그러면 디코더 함수
Figure 112018079687404-pat00030
를 사용하여
Figure 112018079687404-pat00031
에서 하이퍼스펙트럴 이미지 프라이어로 사용되는 h를 재구성 할 수 있으며, 아래 <수학식 4>와 같이 나타낼 수 있다.In the present invention, after learning the network, the hyperspectral image h is an encoder function.
Figure 112018079687404-pat00028
Nonlinear representation
Figure 112018079687404-pat00029
Can be converted to Decoder function
Figure 112018079687404-pat00030
use with
Figure 112018079687404-pat00031
H can be reconstructed as a hyperspectral image fryer, and can be expressed as <Equation 4> below.

[수학식 4] [Equation 4]

Figure 112018079687404-pat00032
Figure 112018079687404-pat00032

본 발명이 신호 재구성 과정은 본 발명의 이미지 형성 모델을 만족시키는 비선형 하이퍼스펙트럴 표현을 검색할 수 있다.In the signal reconstruction process of the present invention, a nonlinear hyperspectral expression satisfying the image forming model of the present invention can be searched.

네트워크 아키텍처Network architecture

도 4에 도시된 바와 같이, 본 발명의 자동 인코딩 프로그램은 입력 및 출력 레이어를 제외한

Figure 112018079687404-pat00033
레이어로 구성될 수 있다.As shown in Fig. 4, the automatic encoding program of the present invention excludes the input and output layers.
Figure 112018079687404-pat00033
It can be composed of layers.

여기서,

Figure 112018079687404-pat00034
는 각 하위 네트워크의 숨겨진 레이어 수를 의미할 수 있다.here,
Figure 112018079687404-pat00034
Can mean the number of hidden layers of each sub-network.

인코더 네트워크

Figure 112018079687404-pat00035
는 자동 인코딩 장치의 시작 부분에 배치되며,
Figure 112018079687404-pat00036
의 입력이 인코더 네트워크에 공급된다고 가정할 때 인코더는 아래 <수학식 5>, <수학식 6>와 같이 정의된 하이퍼스펙트럴 이미지의 비선형 표현을 출력한다.Encoder network
Figure 112018079687404-pat00035
Is placed at the beginning of the automatic encoding device,
Figure 112018079687404-pat00036
Assuming that the input of is supplied to the encoder network, the encoder outputs a nonlinear representation of the hyperspectral image defined as <Equation 5> and <Equation 6> below.

[수학식 5] [Equation 5]

Figure 112018079687404-pat00037
Figure 112018079687404-pat00037

[수학식 6] [Equation 6]

Figure 112018079687404-pat00038
Figure 112018079687404-pat00038

여기서,

Figure 112018079687404-pat00039
Figure 112018079687404-pat00040
는 각각 커널 가중치, 중간 특징 표현 및 인코더 네트워크의 계층 l에서의 바이어스를 의미하며, 가중치와 바이어스는 자동 인코딩을 구성하고, 아래 첨자 E는 인코더를 나타낼 수 있으며,
Figure 112018079687404-pat00041
는 직선 선형 단위(ReLU) 인 비선형 활성화 함수를 의미할 수 있다.here,
Figure 112018079687404-pat00039
And
Figure 112018079687404-pat00040
Denotes kernel weight, intermediate feature representation, and bias in layer l of the encoder network, respectively, weight and bias constitute automatic encoding, and subscript E can represent the encoder,
Figure 112018079687404-pat00041
May denote a nonlinear activation function that is a linear linear unit (ReLU).

Figure 112018079687404-pat00042
를 입력 하이퍼스펙트럴 이미지 h로 설정한다. 재구성 단계에서
Figure 112018079687404-pat00043
에 제약을 가하지 않기 위해서, 활성화 함수는 상기 수학식 5의 출력 계층에 적용되지 않을 수 있다.
Figure 112018079687404-pat00042
Set to the input hyperspectral image h. In the reconstruction phase
Figure 112018079687404-pat00043
In order not to impose a constraint on, the activation function may not be applied to the output layer of Equation (5).

인코더 네트워크의 아키텍처와 유사하게, 숨겨진 계층을 갖는 디코더 네트워크는 아래 <수학식 7>, <수학식 8>과 같이 정의될 수 있다.Similar to the architecture of the encoder network, a decoder network having a hidden layer can be defined as <Equation 7> and <Equation 8> below.

[수학식 7] [Equation 7]

Figure 112018079687404-pat00044
Figure 112018079687404-pat00044

[수학식 8] [Equation 8]

Figure 112018079687404-pat00045
Figure 112018079687404-pat00045

여기서

Figure 112018079687404-pat00046
는 하이퍼스펙트럴 이미지의 비선형 표현
Figure 112018079687404-pat00047
를 의미할 수 있다.here
Figure 112018079687404-pat00046
Is a non-linear representation of a hyperspectral image
Figure 112018079687404-pat00047
Can mean

인코더 네트워크의 첫 번째 컨볼루션 계층인

Figure 112018079687404-pat00048
에 대해
Figure 112018079687404-pat00049
를 사용하지만 다른 계층은
Figure 112018079687404-pat00050
의 커널로 컨볼루션된다. 이미지와 숨겨진 레이어의 공간 해상도는 동일하게 유지된다. 본 발명은 컨볼루션 자동 인코딩 장치의 기존 응용 프로그램과 같은 특징 벡터를 추출하는 대신 원본 신호를 재구성하는 것이다. 이러한 의미에서 본 발명의 특징 벡터는 하이퍼스펙트럴 벡터를 정의하는 저차원 부분 공간으로 볼 수 있으며 희소 코딩에서의 과도 완료된(overcomplete) 사전과 유사하다. 본 발명은 도 5a에 도시된 바와 같이, 더 많은 특징 벡터에 의해 더 많은 결과를 산출하는 것을 통해 벡터
Figure 112018079687404-pat00051
의 개수가 재구성된 신호의 정확도에 중요한 영향을 미치는 것을 알 수 있다. 그러나 성능과 메모리 사이에는 실질적인 트레이드 오프가 있다. 실제로는 각 계층의 특징 벡터 수를
Figure 112018079687404-pat00052
(원래 C = 31보다 큼)로 고정한다. 도 5b와 도 5c는 R = 64 개의 특징 벡터와 11개의 숨겨진 레이어를 갖는 하이퍼스펙트럴 재구성의 예를 보여준 것으로, 재구성된 스펙트럴 정보는 사실상 원본과 동일하다.The first convolutional layer of the encoder network,
Figure 112018079687404-pat00048
About
Figure 112018079687404-pat00049
But the other layers
Figure 112018079687404-pat00050
Is convolved into the kernel. The spatial resolution of the image and the hidden layer remains the same. The present invention is to reconstruct the original signal instead of extracting a feature vector like the existing application of the convolutional automatic encoding device. In this sense, the feature vector of the present invention can be viewed as a low-dimensional subspace defining a hyperspectral vector and is similar to an overcomplete dictionary in sparse coding. The present invention, as shown in Figure 5a, through the production of more results by more feature vectors, vectors
Figure 112018079687404-pat00051
It can be seen that the number of has a significant effect on the accuracy of the reconstructed signal. However, there is a real trade-off between performance and memory. The number of feature vectors in each layer
Figure 112018079687404-pat00052
(Original C = greater than 31). 5B and 5C show an example of hyperspectral reconstruction having R = 64 feature vectors and 11 hidden layers, and the reconstructed spectral information is substantially the same as the original.

트레이닝training 절차 step

자동 인코더에 대한 본 발명의 정의는 파라미터들의 세트

Figure 112018079687404-pat00053
를 포함한다. 하이퍼스펙트럴 이미지의 비선형 표현을 배우기 위해 자동 인코딩 네트워크를 학습시키고 손실 함수를 최소화하는 특정 세트
Figure 112018079687404-pat00054
를 찾는다.
Figure 112018079687404-pat00055
하이퍼스펙트럴 이미지의 집합
Figure 112018079687404-pat00056
에 대해 overfitting을 피하기 위해 decay term을 포함하는 손실 함수
Figure 112018079687404-pat00057
는 아래 <수학식 9>와 같이 나타낼 수 있다.The definition of the invention for an automatic encoder is a set of parameters
Figure 112018079687404-pat00053
It includes. A specific set of training automatic encoding networks to minimize nonlinear representation of hyperspectral images and minimizing loss functions
Figure 112018079687404-pat00054
Find
Figure 112018079687404-pat00055
Set of hyperspectral images
Figure 112018079687404-pat00056
Loss function with decay term to avoid overfitting
Figure 112018079687404-pat00057
Can be expressed as <Equation 9> below.

[수학식 9] [Equation 9]

Figure 112018079687404-pat00058
Figure 112018079687404-pat00058

여기서,

Figure 112018079687404-pat00059
는 대안 적으로
Figure 112018079687404-pat00060
로 표현 될 수 있고,
Figure 112018079687404-pat00061
는 오버피팅을 피하기 위해 데이터 정확도와 정규화 사이의 상대적 중요성을 조정할 수 있다. here,
Figure 112018079687404-pat00059
Alternatively
Figure 112018079687404-pat00060
Can be expressed as,
Figure 112018079687404-pat00061
Can adjust the relative importance between data accuracy and normalization to avoid overfitting.

본 발명은 역 전파 그래디언트와 활성화의 변화를 유지하기 위해 정규화된 초기화를 사용하여

Figure 112018079687404-pat00062
Figure 112018079687404-pat00063
를 모두 초기화한다.The present invention uses a normalized initialization to maintain changes in back propagation gradients and activation.
Figure 112018079687404-pat00062
Wow
Figure 112018079687404-pat00063
Initialize all.

구현 세부 사항Implementation details

본 발명은 공개적으로 입수할 수 있는 하버드와 콜럼비아에서 얻은 109개(하버드에서 77 이미지, 콜럼비아에서 32 이미지)의 하이퍼스펙트럴 이미지를 사용하여 보강된 트레이닝 데이터 세트를 만들 수 있다. 각 하이퍼스펙트럴 이미지에는 약 31개의 파장 채널이 포함된다.The present invention can create augmented training data sets using 109 hyperspectral images from Harvard and Columbia (77 images from Harvard and 32 from Columbia), which are publicly available. Each hyperspectral image contains about 31 wavelength channels.

본 발명은 기존의 네트워크 학습 접근법에 따라 초기 이미지 데이터 세트를 추가할 수 있다. 입력 이미지에 대한 스케일 불변성을 달성하기 위해 입력 데이터 세트를 두 가지 추가 해상도(1/2 및 2배)로 확장할 수 있고, 이에 따라 327개의 하이퍼스펙트럴 이미지를 생성할 수 있다. 이렇게 증가된 데이터 세트에서 크기가 96 x 96 x 31 인 21,760 개의 텐서 패치를 샘플링한다.The present invention can add an initial image data set according to an existing network learning approach. To achieve scale invariance for the input image, the input data set can be extended to two additional resolutions (1/2 and 2x), thus creating 327 hyperspectral images. In this increased data set, 21,760 tensor patches of size 96 x 96 x 31 are sampled.

본 발명은 TensorFlow를 사용하여 자동 인코더를 구현하고 ADAM 그래디언트 디센트 방법을 사용하여 상기 수학식 9의 손실 함수를 최소화하며 최대 60 에포크까지 트레이닝 할 수 있다. 그래디언트 디센트의 경우 배치 크기는 학습 속도가

Figure 112018079687404-pat00064
인 64로 설정될 수 있으며, 감쇠 항의 가중치
Figure 112018079687404-pat00065
Figure 112018079687404-pat00066
로 설정될 수 있다. R = 64개의 특징 채널과 11개의 숨겨진 레이어를 사용하여 64GB의 메모리가 있는 i7-6770k CPU와 12GB의 메모리가 있는 NVIDIA Titan X Pascal GPU가 장착된 컴퓨터를 사용하여 네트워크를 학습하는데 약 30시간이 소요될 수 있다.The present invention implements an automatic encoder using TensorFlow and minimizes the loss function of Equation 9 using the ADAM gradient descent method, and can train up to 60 epochs. For gradient descent, the batch size has a faster learning speed.
Figure 112018079687404-pat00064
Can be set to 64, the weight of the damping term
Figure 112018079687404-pat00065
The
Figure 112018079687404-pat00066
Can be set to R = It takes about 30 hours to train the network using a computer with an i7-6770k CPU with 64 GB of memory and an NVIDIA Titan X Pascal GPU with 12 GB of memory using 64 feature channels and 11 hidden layers. Can.

최적화를 통한 재구성Reconstruction through optimization

본 발명은 하이퍼스펙트럴 이미지를

Figure 112018079687404-pat00067
,
Figure 112018079687404-pat00068
Figure 112018079687404-pat00069
로 나타낸다. 따라서, 상기 수학식 3에서 정의된 압축 화상 형성은 아래 <수학식 10>과 같이 다시 나타낼 수 있다.The present invention is a hyperspectral image
Figure 112018079687404-pat00067
,
Figure 112018079687404-pat00068
sign
Figure 112018079687404-pat00069
It is represented by. Accordingly, the compressed image formation defined in Equation 3 may be expressed again as <Equation 10> below.

[수학식 10][Equation 10]

Figure 112018079687404-pat00070
Figure 112018079687404-pat00070

여기서, 상기 수학식 10은 희소 코딩(sparse coding)에서의 과도 완료된(overcomplete) 사전의 선형 조합과 유사하지만, 본 발명에서의 디코더

Figure 112018079687404-pat00071
는 비선형 연산자이다.Here, Equation 10 is similar to a linear combination of an overcomplete dictionary in sparse coding, but the decoder in the present invention
Figure 112018079687404-pat00071
Is a nonlinear operator.

Figure 112018079687404-pat00072
에서
Figure 112018079687404-pat00073
이므로, 상기 수학식 10은 불안정한 시스템을 의미한다. 이것은 관찰 결과로부터 하이퍼스펙트럴 이미지를 재구성하는 데에 문제를 야기할 수 있기 때문에 본 발명은 아래 <수학식 11>과 같이 목적 함수를 사용하여 하이퍼스펙트럴 재구성을 공식화할 수 있다.
Figure 112018079687404-pat00072
in
Figure 112018079687404-pat00073
Therefore, Equation 10 means an unstable system. Since this may cause problems in reconstructing the hyperspectral image from the observation results, the present invention can formulate the hyperspectral reconstruction using an objective function as shown in <Equation 11> below.

[수학식 11][Equation 11]

Figure 112018079687404-pat00074
Figure 112018079687404-pat00074

여기서,

Figure 112018079687404-pat00075
는 인코더를 의미하고,
Figure 112018079687404-pat00076
는 공간 그래디언트 연산자를 의미하며,
Figure 112018079687404-pat00077
Figure 112018079687404-pat00078
는 데이터 충실도와 prior항 사이의 상대적 중요성을 조정 또는 평가할 수 있다.here,
Figure 112018079687404-pat00075
Means an encoder,
Figure 112018079687404-pat00076
Means the spatial gradient operator,
Figure 112018079687404-pat00077
and
Figure 112018079687404-pat00078
Can adjust or evaluate the relative importance between data fidelity and prior terms.

프라이어 항의 첫 번째는 인코더-디코더 쌍을 사용하여 비선형 표현의 정확도를 정립하는 반면, 프라이어 항의 두 번째는 총변이의 L1-norm 정규화기(regularizer)이며 공간 영역의 희소성을 선호한다. 프라이어 항의 첫 번째

Figure 112018079687404-pat00079
-충실도는 자동 인코더 표현을 본 발명의 최적화 문제와 연관시킬 수 있기 때문에 본 발명의 목적 함수에 중요한 기여를 한다. 이는 도 9에 도시된 바와 같이 재구성된 이미지의 스펙트럴 정확도에 큰 영향을 미칠 수 있다. 도 9는 본 발명의
Figure 112018079687404-pat00080
-충실도 프라이어의 영향에 대한 일 예시도를 나타낸 것으로, 도 9a는
Figure 112018079687404-pat00081
가 없는 복원 결과를 나타낸 것이고, (b)는 이전이 결과를 나타낸 것이다. 인셋(inset)은 실측값과 비교된 피크 신호대 잡음비(PSNR)와 구조적 유사성(SSIM)을 나타낸 것으로, 프라이어가 PSNR과 SSIM에서 모두 크게 증가한 것을 알 수 있다. 또한, 프라이어가 반복 회수에 따라 정확도가 어떻게 증가하는지 알 수 있으며, 노란색 깃털과 붉은 깃털에 대한 스펙트럴 정확도 또한 알 수 있다.The first of the fryer terms uses the encoder-decoder pair to establish the accuracy of the nonlinear representation, while the second of the fryer term is the L1-norm regularizer of the total variation and prefers sparsity of the spatial domain. Fryer protest first
Figure 112018079687404-pat00079
-Fidelity makes an important contribution to the objective function of the present invention as it can correlate automatic encoder representation with the optimization problem of the present invention. This can greatly affect the spectral accuracy of the reconstructed image, as shown in FIG. 9. 9 is the present invention
Figure 112018079687404-pat00080
-Fidelity shows an example of the effect of the fryer, Figure 9a
Figure 112018079687404-pat00081
Shows the restoration result without, and (b) shows the previous result. The inset shows the peak signal-to-noise ratio (PSNR) and structural similarity (SSIM) compared to the measured values, and it can be seen that the fryer significantly increased in both PSNR and SSIM. In addition, it is possible to see how the fryer increases in accuracy with the number of repetitions, and also the spectral accuracy for yellow and red feathers.

최적화optimization

총 변이 그래디언트 희소성 항은 미분할 수 없으므로 상기 수학식 11의 목적 함수를 아래 <수학식 12>와 <수학식 13>의 두 가지 문제로 나눈다.Since the total variation gradient sparse term cannot be differentiated, the objective function of Equation 11 is divided into two problems, <Equation 12> and <Equation 13> below.

[수학식 12][Equation 12]

Figure 112018079687404-pat00082
Figure 112018079687404-pat00082

[수학식 13][Equation 13]

Figure 112018079687404-pat00083
Figure 112018079687404-pat00083

따라서, 본 발명의 최적화 문제는 아래 <수학식 14>와 같이 나타낼 수 있다.Therefore, the optimization problem of the present invention can be expressed as <Equation 14> below.

[수학식 14][Equation 14]

Figure 112018079687404-pat00084
Figure 112018079687404-pat00084

여기서, z는 재구성된 하이퍼스펙트럴 이미지의 공간 그래디언트를 의미할 수 있다.Here, z may mean a spatial gradient of the reconstructed hyperspectral image.

본 발명은 아래 도시된 알고리즘1과 같이 ADMM(alternating direction multiplier) 방식을 사용하여 상기 수학식 14의 문제를 반복적으로 해결한다.The present invention repeatedly solves the problem of Equation 14 by using an alternating direction multiplier (ADMM) method as shown in Algorithm 1 shown below.

Figure 112018079687404-pat00085
Figure 112018079687404-pat00085

첫째,

Figure 112018079687404-pat00086
항은 라인 3에서 업데이트되고 ADAM 최적화 알고리즘에 의해 최소화된다. 근사 그래디언트 디센트를 사용하여 라인 4의 보조 변수
Figure 112018079687404-pat00087
Figure 112018079687404-pat00088
항을 최소화하고, 라인 5에 나타난 엘리먼트-와이즈 소프트-스레스홀딩(element-wise soft-thresholding) 함수
Figure 112018079687404-pat00089
를 사용하여 이 항을 업데이트한다. 알고리즘1에서 그래디언트
Figure 112018079687404-pat00090
제약의 희소성의 강도를 아래 <수학식 15>와 같이 제어할 수 있다.first,
Figure 112018079687404-pat00086
The term is updated in line 3 and minimized by the ADAM optimization algorithm. Secondary variable in line 4 using approximate gradient descent
Figure 112018079687404-pat00087
in
Figure 112018079687404-pat00088
Minimize terms, and the element-wise soft-thresholding function shown in line 5
Figure 112018079687404-pat00089
Use to update this term. Gradient in Algorithm 1
Figure 112018079687404-pat00090
The strength of the scarcity of the constraint can be controlled as shown in Equation 15 below.

[수학식 15][Equation 15]

Figure 112018079687404-pat00091
Figure 112018079687404-pat00091

라그랑쥬 승수

Figure 112018079687404-pat00092
는 상기 수학식 14의 제약 조건을 충족시키기 위해 그래디언트 상승을 통해 라인6에서 업데이트된다. 이 과정은 정지조건에 도달할 때까지 반복된다. 솔루션 표현
Figure 112018079687404-pat00093
가 획득되면 디코더 D(
Figure 112018079687404-pat00094
)로 사용하여 최종 하이퍼스펙트럴 이미지를 재구성한다.Lagrange multiplier
Figure 112018079687404-pat00092
Is updated in line 6 through gradient elevation to satisfy the constraint of Equation (14). This process is repeated until a stop condition is reached. Solution representation
Figure 112018079687404-pat00093
Decoder D(
Figure 112018079687404-pat00094
) To reconstruct the final hyperspectral image.

파라미터parameter

상기 수학식 11에서, 비선형 표현 충실도에 대해

Figure 112018079687404-pat00095
을 0.1로 설정하고, 알고리즘 1은
Figure 112018079687404-pat00096
및 ρ을
Figure 112018079687404-pat00097
Figure 112018079687404-pat00098
으로 각각 설정한다. 최적화 도구는 약 20 회의 ADMM 반복을 수행한다. 상기 수학식 14의
Figure 112018079687404-pat00099
에 대한 ADAM 최적화 프로그램은
Figure 112018079687404-pat00100
의 학습 속도로 200 단계를 반복한다.In Equation 11 above, for nonlinear expression fidelity
Figure 112018079687404-pat00095
Is set to 0.1, algorithm 1 is
Figure 112018079687404-pat00096
And ρ
Figure 112018079687404-pat00097
and
Figure 112018079687404-pat00098
Respectively. The optimization tool performs about 20 ADMM iterations. Equation 14 above
Figure 112018079687404-pat00099
The ADAM optimizer for
Figure 112018079687404-pat00100
Repeat steps 200 at a learning rate.

시간 복잡성Time complexity

하이퍼스펙트럴 이미지 재구성의 시간 복잡도는 컨볼루션 자동 인코더에서 수행된 곱셈의 수에 비례한다. 원 스트라이드(one-stride) 컨볼루션을 수행할 때, 컨볼루션 계층에 대한 곱셈의 수는

Figure 112018079687404-pat00101
이며, 여기서
Figure 112018079687404-pat00102
는 커널 크기이고
Figure 112018079687404-pat00103
Figure 112018079687404-pat00104
는 컨볼루션의 입력과 출력을 위한 특징 맵의 수이다.
Figure 112018079687404-pat00105
커널을 가진 컨볼루션 자동 인코더(11개의 숨겨진 레이어가 있는 64개 특징)에서 총 곱셈의 수는 약
Figure 112018079687404-pat00106
이다. 기존의 데이터 구동 방식과 비교하여, 희소 코딩 방법은 숨겨진 계층이나 활성화 기능이 없는 얕은 컨볼루션 신경망으로 간주 될 수 있다.
Figure 112018079687404-pat00107
하이퍼스펙트럴 이미지 패치의 6200개의 원자로 된 사전을 사용하면, 곱셈의 추정된 수는 2배 더 큰
Figure 112018079687404-pat00108
이다.The time complexity of hyperspectral image reconstruction is proportional to the number of multiplications performed by the convolutional automatic encoder. When performing one-stride convolution, the number of multiplications for the convolutional layer is
Figure 112018079687404-pat00101
Where
Figure 112018079687404-pat00102
Is the kernel size
Figure 112018079687404-pat00103
Wow
Figure 112018079687404-pat00104
Is the number of feature maps for convolution input and output.
Figure 112018079687404-pat00105
The total number of multiplications in a convolutional automatic encoder with a kernel (64 features with 11 hidden layers) is approximately
Figure 112018079687404-pat00106
to be. Compared to the existing data driving method, the sparse coding method can be regarded as a shallow convolutional neural network without a hidden layer or an activation function.
Figure 112018079687404-pat00107
Using the 6200 atomic dictionary of the hyperspectral image patch, the estimated number of multiplications is twice as large.
Figure 112018079687404-pat00108
to be.

인코더에서의 활성화Activation at the encoder

도 4와 상술한 바와 같이, ReLU 활성화 기능은 인코더의 출력 계층에 존재하지 않는다. 이것은 하이퍼스펙트럴 이미지의 비선형 표현

Figure 112018079687404-pat00109
가 희소성으로 제한되지 않음을 나타낸다. 본 발명은 희소성을 명시적으로 부과하지는 않지만,
Figure 112018079687404-pat00110
가 ReLU 활성화 함수로 다른 레이어를 통과하는 동안 자동 인코딩은 표현을 희소하게 만든다. 이 희소성 부재의 또 다른 이점은 비선형 최적화를 단순화한다는 것이다. 인코더의 출력 계층에 ReLU 활성화 함수를 추가하는 것은 상기 수학식 11에서 음이 아닌 제약 조건 만족항을 추가적으로 요구한다. 게다가 보조 변수와 라그랑지안 변수인 두 개의 변수가 상기 수학식 14의 ADMM 공식에 도입되어야 하므로 결과적으로 수렴 속도가 느려질 수 있다.4 and the above, the ReLU activation function does not exist in the output layer of the encoder. This is a non-linear representation of the hyperspectral image
Figure 112018079687404-pat00109
Indicates that it is not limited to scarcity. The present invention does not explicitly impose scarcity,
Figure 112018079687404-pat00110
Auto-encoding makes the representation sparse while it passes through different layers with the ReLU activation function. Another advantage of this sparse member is that it simplifies nonlinear optimization. Adding the ReLU activation function to the output layer of the encoder additionally requires a non-negative constraint satisfaction term in Equation (11). In addition, since two variables, an auxiliary variable and a Lagrangian variable, must be introduced into the ADMM formula of Equation 14, convergence may be slow as a result.

글로벌 vs. 로컬 최적화Global vs. Local optimization

TwIST 및 SpaRSA와 같은 전역 최적화 접근법은 스펙트럴 정보를 재구성하는 데에 더 효과적이지만 희소 코딩과 같은 로컬 최적화 기법은 각 패치를 독립적으로 작동하여 이미지 구조를 잘 보존한다. 그러나 분산의 양은 패치 크기에 의해 제한되며, 이는 계산 비용에 큰 영향을 미친다. 본 발명의 접근 방식은 컨볼루션 자동 인코딩과 총변이 항을 통해 로컬 및 글로벌 최적화의 이점을 결합한다.Global optimization approaches such as TwIST and SpaRSA are more effective at reconstructing spectral information, but local optimization techniques such as sparse coding operate each patch independently, preserving the image structure well. However, the amount of variance is limited by the patch size, which greatly affects the computational cost. The approach of the present invention combines the advantages of local and global optimization through automatic convolutional encoding and total variation terms.

본 발명의 재구성 알고리즘의 성능을 평가하기 위해 본 발명은 먼저 기존 하버드와 콜럼비아 스펙트럴 이미지 데이터 세트로부터 코딩된 테스트 세트를 만들고, SDCASSI, DD-CASSI 및 SS-CASSI의 세 가지 주요 인코딩 유형을 사용하여 이미징 프로세스를 시뮬레이션하여 도 12에 도시된 바와 같이 새로운 데이터 세트을 만들 수 있다. 여기서 상기 수학식 11의 행렬

Figure 112018079687404-pat00111
는 영상 형성 모델에 따라 달라질 수 있다.To evaluate the performance of the reconstruction algorithm of the present invention, the present invention first creates coded test sets from existing Harvard and Columbia spectral image data sets, and uses three main encoding types: SDCASSI, DD-CASSI, and SS-CASSI. The imaging process can be simulated to create a new data set as shown in FIG. 12. Here, the matrix of Equation (11)
Figure 112018079687404-pat00111
May vary depending on the image forming model.

본 발명은 이 기법에 의한 결과를 세 가지 다른 인코딩 아키텍처를 대표하는 다른 세 가지 방법인 TwIST, SpaRSA, 희소 코딩에 대한 결과와 비교한다. 본 발명은 각 방법에 대한 최상의 아키텍처를 선택하며, Twist와 SpaRSA에 대해서는 DD-CASSI, 희소 코딩과 본 발명의 기법에 대해서는 SS-CASSI를 선택할 수 있다.The present invention compares the results of this technique with the results for TwIST, SpaRSA, and sparse coding, which are three other methods representing three different encoding architectures. The present invention selects the best architecture for each method, DD-CASSI for Twist and SpaRSA, and SS-CASSI for sparse coding and the technique of the present invention.

본 발명의 재구성 기법은 스펙트럴 및 공간 정확도 모두에서 상당한 개선을 보여주며 세가지 중에서 가장 빠르다. 도 6은 콜럼비아 이미지 데이터 세트에 대한 평균 결과에 대한 일 예시도를 나타낸 것이다. 또한 본 발명은 매개 변수 공간에 대한 분석을 제공하고, 본 발명의 방법을 실측값과 직접 비교하고 학습 기반의 재구성과 비교하며, 새로운 하이퍼스펙트럴 데이터 세트를 소개하고 실제 하이퍼스펙트럴 이미징 시스템으로 결과를 제시한다. 마지막으로, 본 발명은 하드웨어 수정없이 다중-하이퍼스펙트럴 보간법과 하이퍼스펙트럴 디모자이싱에서 두 가지 방법을 제안한다.The reconstruction technique of the present invention shows a significant improvement in both spectral and spatial accuracy and is the fastest of the three. 6 shows an exemplary diagram for an average result for a Columbia image data set. In addition, the present invention provides an analysis of the parameter space, directly compares the method of the present invention with actual values, compares it with a learning-based reconstruction, introduces a new hyperspectral data set, and results with a real hyperspectral imaging system. To present. Finally, the present invention proposes two methods in multi-hyperspectral interpolation and hyperspectral demosaicing without hardware modification.

스펙트럴Spectral 정확도 대 공간 해상도 Accuracy vs. spatial resolution

기존의 재구성 기술은 최종 이미지의 품질을 정의하는 스펙트럴 정확도와 공간 해상도 간의 본질적인 절충점을 공유한다. 도 1에서와 같이 TwIST 및 SpaRSA와 같은 기존의 최적화 접근법은 스펙트럴 정확도에서 좋은 결과를 산출하지만 차선의 공간 해상도를 희생한다. 반면에 희소 코딩을 기반으로 하는 데이터 기반 접근 방식은 좋은 공간 해상도를 제공하지만 스펙트럴 정확도를 희생한다. 반대로 본 발명의 방법은 두 영역 모두에서 고품질 결과를 산출한다. 여기서 본 발명의 재구성 알고리즘의 성능을 각각 스펙트럴 정확도와 공간 분해능의 관점에서 비교한다.Existing reconstruction techniques share an essential trade-off between spectral accuracy and spatial resolution that defines the quality of the final image. As shown in Fig. 1, conventional optimization approaches such as TwIST and SpaRSA yield good results in spectral accuracy, but sacrifice the sub-optimal spatial resolution. On the other hand, data-based approaches based on sparse coding provide good spatial resolution, but at the expense of spectral accuracy. Conversely, the method of the present invention produces high quality results in both domains. Here, the performance of the reconstruction algorithm of the present invention is compared in terms of spectral accuracy and spatial resolution, respectively.

스펙트럴Spectral 정확도 accuracy

본 발명은 피크 신호대 잡음비(PSNR)와 구조적 유사성(SSIM)을 계산하여 재구성된 스펙트럴 이미지의 스펙트럴 정확도를 평가한다. 도 7은 콜럼비아 데이터 세트의 컬러체커 하이퍼 스펙트럴 이미지에 대한 대조비교를 나타낸 것으로, 본 발명은 시각화를 위해 보정된 2도 CIE 색 일치 함수를 통해 스펙트럴 이미지의 결과를 sRGB로 변환한다. 31개의 파장 채널에서 본 발명의 평균 PSNR과 SSIM 결과(38.87dB / 0.98)는 TwIST(31.57dB / 0.94), SpaRSA(30.59dB / 0.94) 및 희소 코딩(28.85db / 0.92)의 모든 재구성 결과보다 좋은 것을 알 수 있다. 또한 차트에서 5가지 기본색(파란색, 녹색, 빨간색, 노란색 및 분홍색)의 재구성된 스펙트럴 반사율을 평가한 결과 본 발명의 결과가 다른 방법보다 일관되게 실측값에 가까운 것을 알 수 있으며, 하단의 표는 각 컬러 패치에 대한 RMSE(root-mean-squared errors)와 평균을 나타낸 것이다.The present invention evaluates the spectral accuracy of the reconstructed spectral image by calculating the peak signal-to-noise ratio (PSNR) and structural similarity (SSIM). FIG. 7 shows a contrast comparison of a color checker hyper spectral image of the Columbia data set, and the present invention converts the result of the spectral image to sRGB through a calibrated 2-degree CIE color matching function for visualization. Average PSNR and SSIM results (38.87dB / 0.98) of the present invention in 31 wavelength channels are better than all reconstruction results of TwIST (31.57dB / 0.94), SpaRSA (30.59dB / 0.94) and sparse coding (28.85db / 0.92) You can see that In addition, as a result of evaluating the reconstructed spectral reflectance of the five primary colors (blue, green, red, yellow, and pink) on the chart, it can be seen that the results of the present invention are consistently closer to the measured values than the other methods. Is the root-mean-squared errors (RMSE) and averages for each color patch.

공간 해상도Spatial resolution

본 발명은 변조 전달 함수(MTF)로서 공간 주파수 응답을 계산하여 본 발명에 의해 재구성된 스펙트럴 이미지의 공간 해상도를 평가한다. Twist, SpaRSA, 희소 코딩 및 본 발명의 방법을 사용하여 표준 공간 주파수 측정 차트(ISO 12233)를 다시 재구성한다. 도 8은 Twist, SpaRSA, 희소 코딩 및 본 발명의 방법을 사용하여 표준 공간 주파수 측정 차트(ISO 12233)를 재구성한 결과를 나타낸 것이다. 기존의 다른 최적화 방법과 마찬가지로, TwIST 및 SpaRSA는 공간 주파수의 차선적인 재구성을 보여주며 희소 코딩(sparse coding)에 기반한 데이터 중심 접근법은 이 공간 해상도를 향상 시키므로, 본 발명의 방법은 최상의 결과를 산출하는 것을 알 수 있다.The present invention evaluates the spatial resolution of the spectral image reconstructed by the present invention by calculating the spatial frequency response as a modulation transfer function (MTF). The standard spatial frequency measurement chart (ISO 12233) is reconstructed again using Twist, SpaRSA, sparse coding, and the method of the present invention. 8 shows the results of reconstructing a standard spatial frequency measurement chart (ISO 12233) using Twist, SpaRSA, sparse coding, and the method of the present invention. As with other existing optimization methods, TwIST and SpaRSA show sub-optimal reconstruction of spatial frequencies, and data-centric approaches based on sparse coding improve this spatial resolution, so the method of the present invention yields the best results. You can see that

파라미터 분석Parameter analysis

충실도 프라이어의 영향The effect of fidelity fryer

본 발명의 최적화 공식에서 주요한 신규성 중 하나는 상기 수학식 11의

Figure 112018079687404-pat00112
정확도이며 트레이닝된 자동 인코더 장치의 비선형 표현과 재구성 문제를 연관 짓고 있다. 도 9에 도시된 바와 같이, 이 프라이어는 재구성 정확도에 큰 영향을 미치는 것을 알 수 있다. SSN은 0.93에서 0.96으로 증가하는 반면 PSNR은 30.84dB에서 34.33dB로 크게 증가한다. 또한, 두 번째 행에서 이전 패턴이 노란색 및 붉은 깃털에 대한 반사 정확도 뿐 아니라 반복 횟수에 따라 PSNR에 어떻게 영향을 미치는지 알 수 있다.One of the major novelty in the optimization formula of the present invention is the equation (11)
Figure 112018079687404-pat00112
It is an accuracy and correlates the reconstruction problem with the nonlinear representation of the trained automatic encoder device. As shown in Fig. 9, it can be seen that this fryer greatly influences the reconstruction accuracy. The SSN increases from 0.93 to 0.96, while the PSNR increases significantly from 30.84dB to 34.33dB. Also, in the second row, you can see how the previous pattern affects PSNR according to the number of iterations as well as the reflection accuracy for yellow and red feathers.

숨겨진 hidden 레이어의Layered 영향 effect

도 10은 숨겨진 레이어 수가 재구성의 공간 해상도에 미치는 영향을 나타낸 것으로, 도 10a에 도시된 바와 같이 11 개의 레이어 이상에서는 재구성의 정확도가 크게 개선되지 않은 것을 알 수 있으며, 본 발명은 11개의 레이어 이후에 공간 해상도가 크게 증가하지 않음을 통해 성능과 메모리 간의 절충안을 감안 후 숨겨진 레이어의 수를 11개로 설정할 수 있다.FIG. 10 shows the effect of the number of hidden layers on the spatial resolution of reconstruction. As shown in FIG. 10A, it can be seen that the accuracy of reconstruction is not significantly improved in 11 or more layers. Since the spatial resolution does not increase significantly, the number of hidden layers can be set to 11 after considering the trade-off between performance and memory.

본 발명은 베타 프로세스 요소 분석(BPFA)과 하위 등급 재건법에 의해 추가실험을 진행하며, 본 발명의 정량적 평가는 색도를 보장하기 위해 광도보다는 반사율에 대해 계산된다. 이는 일반적으로 휘도에 비해 PSNR 값을 2.0 ~ 3.0 dB 낮춘다. BPFA에서, 하이퍼스펙트럴 이미지는 블라인드 압축 감지에 사용된 재구성 방법을 채택하여 코딩된 입력으로부터 재구성된다. 후자의 방법은 유사하고 비국지적인 하이퍼스펙트럴 이미지 패치들에 존재하는 스펙트럴-공간 상관을 이용하는 하이퍼스펙트럴 이미지의 초기 추정을 개량한다. 도 13에 도시된 바와 같이, 콜럼비아 데이터 세트의 32개의 하이퍼스펙트럴 이미지의 평균 PSNR과 SSIM 측정 값은 BPFA의 경우 21.71dB와 0.69, 낮은 순위 재구성의 경우 24.48dB와 0.85 이고, 본 발명의 방법에서는 각각 32.46 dB와 0.95를 얻은 것을 알 수 있다. BPFA는 다중 프레임 CASSI 용으로 설계되었지만 비교의 공정성을 위해 단일 입력 만 사용하였다. 상술한 바와 같이, 하위 등급 재구성의 품질은 초기 추정에 의존하는데, 이 경우에는 TwIST 재구성이 해당된다. 따라서 낮은 순위 재구성의 PSNR 및 SSIM 값은 도 6에 표시된 TwIST (23.74 dB / 0.85)보다 높거나 같을 수 있다.The present invention undergoes additional experiments by beta process element analysis (BPFA) and sub-grade reconstruction, and the quantitative evaluation of the present invention is calculated for reflectivity rather than luminosity to ensure chromaticity. This generally lowers the PSNR value by 2.0 to 3.0 dB compared to the luminance. In BPFA, hyperspectral images are reconstructed from coded inputs by employing the reconstruction method used for blind compression detection. The latter method improves the initial estimation of the hyperspectral image using the spectral-spatial correlation present in similar and non-localized hyperspectral image patches. As shown in FIG. 13, the average PSNR and SSIM measurements of 32 hyperspectral images of the Columbia data set are 21.71 dB and 0.69 for BPFA, 24.48 dB and 0.85 for low rank reconstruction, and in the method of the present invention, It can be seen that 32.46 dB and 0.95 were obtained, respectively. BPFA was designed for multi-frame CASSI, but only a single input was used for fairness of comparison. As described above, the quality of the lower grade reconstruction depends on the initial estimation, in this case, the TwIST reconstruction. Therefore, the PSNR and SSIM values of the low rank reconstruction may be higher than or equal to TwIST (23.74 dB / 0.85) shown in FIG. 6.

직접적인 학습 기반의 재구성은 압축 측정을 입력으로 사용하여 해당 원본 이미지를 출력하는 종단 간 회귀 네트워크를 학습시킨다. 변조 행렬

Figure 112018079687404-pat00113
는 회귀 모델에서 암묵적으로 부호화될 수 있다. 본 발명은 재구성을 회귀 기반 네트워크와 비교한다. 원래 하이퍼스펙트럴 이미징을 위해 설계되지 않았기 때문에 압축 입력에서 하이퍼스펙트럴 이미지를 직접 추정하는 심층 컨볼루션 회귀 네트워크를 학습하도록 수정하고, 수정된 심화 회귀 네트워크는 64개의 기능맵으로 구성된 11개의 숨겨진 컨볼루션 레이어로 구성될 수 있다. 컨볼루션은 ReLU 활성화 기능을 사용하여
Figure 112018079687404-pat00114
커널로 수행될 수 있으며, 학습을 위해 콜럼비아 데이터 세트를 사용할 수 있으며 이미지의 크기는
Figure 112018079687404-pat00115
일 수 있다. 회귀 네트워크는 네트워크에서 고정 변조 행렬
Figure 112018079687404-pat00116
를 암묵적으로 인코딩하기 때문에
Figure 112018079687404-pat00117
이미지로 제한된다. 본 발명은 ADAM 최적화 도구를 사용하여 네트워크를 학습할 수 있으며, 배치로 8개의 이미지를 패킹하고 3000 에포크 동안 트레이닝을 수행할 수 있다.Direct learning-based reconstruction trains an end-to-end regression network that outputs the original image using compression measurements as input. Modulation matrix
Figure 112018079687404-pat00113
Can be implicitly coded in the regression model. The present invention compares reconstruction to a regression based network. Since it was not originally designed for hyperspectral imaging, it is modified to train a deep convolutional regression network that directly estimates the hyperspectral image from the compressed input, and the modified deep regression network consists of 11 hidden convolutions consisting of 64 functional maps. It can be composed of layers. Convolution uses the ReLU activation feature
Figure 112018079687404-pat00114
Can be done with the kernel, you can use the Columbia data set for training and the size of the image
Figure 112018079687404-pat00115
Can be The regression network is a fixed modulation matrix in the network.
Figure 112018079687404-pat00116
Because it implicitly encodes
Figure 112018079687404-pat00117
Limited to images. The present invention can train the network using the ADAM optimization tool, pack 8 images in batches and perform training for 3000 epochs.

비교를 위해 콜럼비아 데이터 세트의 32가지 스펙트럴 이미지를 사용하고, 회귀 기반의 재구성에는 최적화 단계가 필요하지 않기 때문에 그 속도가 매우 빠르지만(평균 0.14초) 스펙트럴 및 공간 영역 모두에서 상당히 정확성이 떨어지는 재구성을 산출한다. 도 13은 이에 대한 대표적인 결과를 나타낸 것이고, 도 14는 전체 데이터 세트에서 평균 산출된 PSNR 및 SSIM 값을 나타낸 것으로, 도 13과 도 14를 통해 알 수 있듯이 회귀 기반 재구성의 낮은 품질 외에도 엔드 투 엔드 회귀를 학습하려면 이미지 설정(이미지 크기, 마스크 패턴, 렌즈 또는 센서의 픽셀 피치)이 변경될 때마다 다른 모델을 학습해야 한다는 점에서 매우 비실용적이다.It uses 32 spectral images from the Columbia data set for comparison, and it is very fast (average 0.14 seconds) because regression-based reconstruction does not require an optimization step, but it is significantly less accurate in both spectral and spatial domains. Yield a reconstruction. 13 shows representative results for this, and FIG. 14 shows PSNR and SSIM values averaged over the entire data set. As can be seen from FIGS. 13 and 14, end-to-end regression in addition to low quality of regression-based reconstruction Learning is very impractical in that you have to train a different model whenever the image settings (image size, mask pattern, pixel pitch of the lens or sensor) change.

새로운 new 하이퍼스펙트럴Hyperspectral 이미지 데이터 세트 Image data set

본 발명은 콜럼비아 데이터 세트가 광범위한 스펙트럴 정보를 가진 이미지를 제공하는 반면 낮은 공간 해상도와 초점이 약간 맞지 않는 이미지를 제공한다는 것을 알 수 있으며, 마찬가지로 하버드 데이터 세트는 높은 공간 해상도를 제공하지만 스펙트럴 범위는 제한적인 것을 알 수 있다. 이를 개선하기 위해 넓은 스펙트럴 범위를 커버하는 30개의 하이퍼스펙트럴 이미지로 구성된 새로운 고해상도 데이터 세트를 캡처할 수 있으며, 도 11과 도 12는 몇 가지 예를 보여주며 완전한 데이터 세트는 프로젝트 웹 사이트에서 다운로드 할 수 있다.It can be seen that the Columbia data set provides images with a wide range of spectral information, while providing low spatial resolution and slightly out of focus images, likewise Harvard data sets provide high spatial resolution but spectral range It can be seen that it is limited. To improve this, you can capture a new high-resolution data set consisting of 30 hyperspectral images covering a wide spectral range, and Figures 11 and 12 show some examples, and the complete data set can be downloaded from the project website. can do.

실제 real 하이퍼Hyper 스펙트럴Spectral 카메라의 결과 Camera results

재구성 알고리즘의 유효성을 검증하기 위해 도 15a와 같이 공간 스펙트럴로 인코딩된 DD-CASSI 이미징 시스템의 프로토 타입을 만들 수 있다. 여기서, 시스템은 아포 크로매틱 렌즈, 릴레이 렌즈, 2개의 프리즘 (NBK-7, 2도 각도, 13 픽셀 분산 생성), 코딩된 조리개 및 CCD 이미징 센서로 구성될 수 있다. 모든 릴레이 렌즈(시그마 A, f/1.4)는 일대일 이미징을 위해 동일한 초점 거리(50mm)를 가지고 있다. 카메라는 픽셀 피치 3.69 μm의 포인트 그레이 그래스 호퍼(GS3 9.1MP Mono)일 수 있다. 코딩된 조리개 마스크는 이진 패턴의 픽셀 피치가 7.40μm 인 석영판에서 리소그래피 크롬 에칭을 통해 만들어진 임의의 이진 패턴을 포함한다. 마스크의 픽셀은 이미저의 CCD 센서에서 2 x 2 픽셀에 해당한다. 화면은 고체 상태의 플라즈마 광원으로 포착된다. 상기 수학식 2에서 바이너리 마스크 패턴

Figure 112018079687404-pat00118
및 파장 의존 픽셀 시프트 함수
Figure 112018079687404-pat00119
와 같은 시스템의 광학 특성을 보정할 수 있다.In order to verify the validity of the reconstruction algorithm, a prototype of the spatial spectral encoded DD-CASSI imaging system may be created as shown in FIG. 15A. Here, the system can consist of an apochromatic lens, a relay lens, two prisms (NBK-7, 2 degree angle, 13 pixel dispersion generation), a coded aperture and a CCD imaging sensor. All relay lenses (Sigma A, f/1.4) have the same focal length (50mm) for one-to-one imaging. The camera may be a point graygrass hopper (GS3 9.1MP Mono) with a pixel pitch of 3.69 μm. The coded aperture mask includes any binary pattern made by lithographic chrome etching on a quartz plate with a pixel pitch of 7.40 μm in the binary pattern. The pixels of the mask correspond to 2 x 2 pixels in the imager's CCD sensor. The screen is captured by a solid state plasma light source. Binary mask pattern in Equation 2
Figure 112018079687404-pat00118
And wavelength dependent pixel shift function
Figure 112018079687404-pat00119
The optical characteristics of the system can be corrected.

조명 불변성을 학습Learning lighting constancy

프로토 타입에서 실제 입력을 처리하기 위해 다양한 색온도의 다양한 조명 아래 추가 데이터 세트로 모델을 재학습한다. 본 발명은

Figure 112018079687404-pat00120
(CIE A, 텅스텐),
Figure 112018079687404-pat00121
(형광등),
Figure 112018079687404-pat00122
(CIED 50),
Figure 112018079687404-pat00123
(CIE D65) 및
Figure 112018079687404-pat00124
(플라스마)의 5가지 다른 색온도에서 컬럼비아의 데이터 세트의 32가지 하이퍼스펙트럴 반사 이미지를 사용하여 192개의 하이퍼스펙트럴 이미지에 대한 추가 학습 데이터 세트를 생성할 수 있다. 이 데이터 세트는 스케일 불변성을 위해 추가로 추가되어 총 384개의 새로운 하이퍼스펙트럴 이미지가 생성할 수 있다. 본 발명은 이 증가한 데이터 세트로부터 96 x 96 x 31사이즈의 19,200개의 텐서 패치를 샘플링할 수 있다.The model is retrained with additional datasets under various lights at different color temperatures to handle the actual inputs in the prototype. The present invention
Figure 112018079687404-pat00120
(CIE A, tungsten),
Figure 112018079687404-pat00121
(Fluorescent lamp),
Figure 112018079687404-pat00122
(CIED 50),
Figure 112018079687404-pat00123
(CIE D65) and
Figure 112018079687404-pat00124
You can create additional training datasets for 192 hyperspectral images using 32 hyperspectral reflection images from Columbia's dataset at five different color temperatures in (Plasma). This data set can be further added for scale invariance, resulting in a total of 384 new hyperspectral images. The present invention can sample 19,200 tensor patches of size 96 x 96 x 31 from this increased data set.

실제 데이터에 대한 결과Results for actual data

도 15b는 TwIST4와 본 발명의 방법을 이용한 재구성을 비교한 것이며, 도 15c의 플롯(plot)은 각 방법에 의해 재구성된 선택된 패치의 스펙트럴 정확도와 분광측정기로 측정한 실제 값을 비교한 것이다. 도 15를 통해 알 수 있듯이, 본 발명의 스펙트럴 재구성은 종래의 접근법을 능가하는 것을 알 수 있다. TwIST 재구성은 공간상의 인공물 재구성에 어려움을 겪고 스펙트럴 영역에서는 덜 정확한 것을 알 수 있고, 도 15d와 도 15e는 본 발명의 재구성 결과를 보여준다.FIG. 15B compares the reconstruction using the method of the present invention with TwIST4, and the plot of FIG. 15C compares the spectral accuracy of the selected patch reconstructed by each method and the actual value measured by a spectrophotometer. 15, it can be seen that the spectral reconstruction of the present invention surpasses the conventional approach. TwIST reconstruction has difficulty in reconstructing artifacts in space and can be seen to be less accurate in the spectral region, and FIGS. 15D and 15E show the reconstruction results of the present invention.

하이퍼스펙트럴Hyperspectral 보간Interpolation

본 발명의 방법은 스펙트럴 프라이어를 이용하여 하드웨어 수정없이 고분해능의 하이퍼스펙트럴 이미지로 멀티 스펙트럴 이미지를 보간하는 것을 허용한다. 상기 수학식 11의 측정 행렬

Figure 112018079687404-pat00125
를 파장 서브 샘플링 행렬로 단순히 대체한다.The method of the present invention allows interpolation of a multi-spectral image into a high-resolution hyperspectral image without hardware modification using a spectral fryer. Measurement matrix of Equation (11)
Figure 112018079687404-pat00125
Is simply replaced by the wavelength subsampling matrix.

도 16a는 원래 스펙트럴 파장의 52%, 26% 및 10%를 서브 샘플링한 보간 결과를 보여 주며 각각 16, 8 및 3채널로 변환된다. 31개의 파장에 대한 보간된 재구성을 실제값(또는 실측값)과 비교한 것으로, 재구성의 정확도는 높지만 정보의 10% 만 사용할 경우에는 재구성의 정확도가 감소하는 것을 알 수 있다.FIG. 16A shows the interpolation result of sub-sampling 52%, 26%, and 10% of the original spectral wavelength, and is converted into 16, 8, and 3 channels, respectively. The interpolated reconstruction for 31 wavelengths is compared with the actual value (or actual value), and the accuracy of reconstruction is high, but when only 10% of the information is used, the accuracy of reconstruction decreases.

하이퍼스펙트럴Hyperspectral 디모자이싱Demosaicing

본 발명은 기존 바이어 패턴에 따라 입력이 450nm, 520nm, 580nm 및 650nm의 파장에만 해당된다고 가정할 때 하이퍼스펙트럴 디모자이싱을 가능하게 하기 위해 보간 재구성을 확장하며 상기 수학식 11의 공간 및 스펙트럴 서브 샘플링 행렬로

Figure 112018079687404-pat00126
행렬을 대체한다. 본 발명은
Figure 112018079687404-pat00127
행렬에 대한 가우시안 블러(Gaussian blur)로서 회절 흐림을 설명하고 재구성 흐림을 피하기 위해
Figure 112018079687404-pat00128
를 매우 작은 값
Figure 112018079687404-pat00129
으로 설정한다. 도 16b는 본 발명의 스펙트럴 재구성이 얼마나 정확한지 나타낸 것으로, 본 발명은 디지털 카메라의 디모자이싱(demosaicing)과 유사하게 바이엘 패턴의 다중 스펙트럴 입력을 사용하여 단일샷 하이퍼스펙트럴 이미징을 가능하게 한다.The present invention extends the interpolation reconstruction to enable hyperspectral demosaicing assuming that the inputs correspond only to the wavelengths of 450nm, 520nm, 580nm and 650nm according to the existing buyer pattern, and the spatial and spectral of Equation 11 With subsampling matrix
Figure 112018079687404-pat00126
Replace the matrix. The present invention
Figure 112018079687404-pat00127
Gaussian blur for the matrix to explain the diffraction blur and avoid reconstruction blur
Figure 112018079687404-pat00128
Very small value
Figure 112018079687404-pat00129
Set to 16B shows how accurate the spectral reconstruction of the present invention is, and the present invention enables single-shot hyperspectral imaging using multiple spectral inputs of a Bayer pattern, similar to demosaicing of digital cameras. .

제한limit

본 발명의 재구성 알고리즘은 공간 영역에서의 희소성을 선호하는 총 변이항(스펙트럴 정보를 이웃하는 픽셀과 연관시킴)를 포함한다. 입력 품질이 충분하지 않은 경우 매우 미세한 이미지 구조를 차선책으로 하여 재구성할 수 있다. 도 17에 도시된 바와 같이 입력 이미지의 초점이 맞지 않는 것을 알 수 있다. 비록 본 발명의 방법이 다른 접근 방식보다 좋은 결과를 보여 줌에도 불구하고, 인쇄된 단어의 작은 세부 사항을 재구성하는 것에는 완벽하지 않은 것을 알 수 있다.The reconstruction algorithm of the present invention includes a total variation term (associating spectral information with neighboring pixels) that favors scarcity in the spatial domain. If the input quality is not sufficient, a very fine image structure can be reconstructed as the next best thing. It can be seen that the input image is out of focus as shown in FIG. 17. Although the method of the present invention shows better results than other approaches, it can be seen that it is not perfect for reconstructing the small details of the printed word.

이와 같이, 본 발명에 따른 기술은 공간 분해능과 스펙트럴 정확도에 대해 기존 방법들은 능가하는 것을 알 수 있다. 구체적으로 본 발명은 컨볼루션 자동 인코더를 사용하여 비선형 표현으로 내추럴 스펙트럴을 트레이닝하고, 자동 인코더 결과 값을 스펙트럴 프라이어로 사용하여 새로운 비선형 최적화를 공식화하는 것이다. 본 발명의 재구성 방법은 모든 압축 이미징 아키텍처에 적용될 수 있으며, 또한 희소 코딩을 기반으로 한 최상의 방법과 비교하여 계산상의 복잡성은 2배 정도 감소시킬 수 있다.As such, it can be seen that the technique according to the present invention surpasses existing methods for spatial resolution and spectral accuracy. Specifically, the present invention is to train a natural spectral in a nonlinear expression using a convolutional automatic encoder, and to formulate a new nonlinear optimization using the result of the automatic encoder as a spectral fryer. The reconstruction method of the present invention can be applied to all compression imaging architectures, and also the computational complexity can be reduced by a factor of two compared to the best method based on sparse coding.

상술한 바와 같이, 본 발명에 따른 기술은 영상에 대한 코딩된 데이터 예를 들어, 인코딩된 센서 입력을 수신하고, 미리 생성된 학습 모델 예를 들어, 비선형 학습 모델에 기초하여 코딩된 데이터에 대한 영상의 초분광 영상을 재구성함으로써, 고품질의 초분광 영상을 재구성하고, 기존의 어떤 압축 이미징 아키텍처에 적용할 수 있다.As described above, the technology according to the present invention receives coded data for an image, for example, an encoded sensor input, and images for coded data based on a pre-generated learning model, for example, a nonlinear learning model. By reconstructing the hyperspectral image of, high-quality hyperspectral image can be reconstructed and applied to any existing compression imaging architecture.

또한, 본 발명에 따른 기술은 미리 생성된 학습 모델 뿐만 아니라 최적화 기법 예를 들어, 비선형 최적화 기법에 기초하여 코딩된 데이터에 대한 영상의 초분광 영상을 재구성할 수도 있다. 즉, 본 발명은 인공 지능 예를 들어, 컨볼루션 신경망(CNN; Convolutional Neural Network)의 일종이며 비선형 학습 모델인 컨볼루션 자동인코더(Convolutional Autoencoder)와 비선형 최적화 기법을 조인트하게(jointly) 결합하여 사용하고, 이를 통해 고품질의 초분광 영상을 재구성할 수 있다.In addition, the technique according to the present invention may reconstruct a hyperspectral image of an image for coded data based on an optimization technique, for example, a nonlinear optimization technique, as well as a pre-generated learning model. That is, the present invention uses artificial intelligence, for example, a type of convolutional neural network (CNN) and a nonlinear learning model, a convolutional autoencoder, and a nonlinear optimization technique jointly combined and used. , Through this, it is possible to reconstruct a high quality hyperspectral image.

이러한 본 발명에 따른 방법은 장치 또는 시스템으로 구성될 수 있으며, 구성되는 장치 또는 시스템은 상술한 본 발명에 따른 방법의 모든 기능을 포함할 수 있다.The method according to the present invention may be configured as an apparatus or system, and the configured apparatus or system may include all functions of the method according to the present invention described above.

이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 시스템, 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The system or device described above may be implemented with hardware components, software components, and/or combinations of hardware components and software components. For example, the systems, devices, and components described in the embodiments include, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors (micro signal processors), microcomputers, and field programmable arrays (FPAs). ), a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions, may be implemented using one or more general purpose computers or special purpose computers. The processing device may run an operating system (OS) and one or more software applications running on the operating system. In addition, the processing device may access, store, manipulate, process, and generate data in response to the execution of the software. For convenience of understanding, a processing device may be described as one being used, but a person having ordinary skill in the art, the processing device may include a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that may include. For example, the processing device may include a plurality of processors or a processor and a controller. In addition, other processing configurations, such as parallel processors, are possible.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매질 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매질에 저장될 수 있다.The software may include a computer program, code, instruction, or a combination of one or more of these, and configure the processing device to operate as desired, or process independently or collectively You can command the device. Software and/or data may be interpreted by a processing device, or to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. , Or may be permanently or temporarily embodied in the transmitted signal wave. The software may be distributed on networked computer systems and stored or executed in a distributed manner. Software and data may be stored in one or more computer readable recording media.

실시예들에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매질에 기록될 수 있다. 상기 컴퓨터 판독 가능 매질은 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매질에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매질의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매질(magnetic media), CD-ROM, DVD와 같은 광기록 매질(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매질(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiments may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, or the like alone or in combination. The program instructions recorded in the medium may be specially designed and configured for an embodiment or may be known and usable by those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and magnetic media such as floptical disks. -Hardware devices specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language code that can be executed by a computer using an interpreter, etc., as well as machine language codes produced by a compiler. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described by a limited embodiment and drawings, those skilled in the art can make various modifications and variations from the above description. For example, the described techniques are performed in a different order than the described method, and/or the components of the described system, structure, device, circuit, etc. are combined or combined in a different form from the described method, or other components Alternatively, even if replaced or substituted by equivalents, appropriate results can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (23)

삭제delete 영상에 대한 코딩된 데이터를 수신하는 단계; 및
미리 생성된 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계
를 포함하며,
미리 설정된 초분광 영상 데이터 세트를 이용한 학습을 통해 비선형 학습 모델을 생성하는 단계
를 더 포함하고,
상기 초분광 영상을 재구성하는 단계는
상기 생성된 비선형 학습 모델과 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성하며,
상기 초분광 영상을 재구성하는 단계는
상기 생성된 비선형 학습 모델에 대한 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)의 희소성(sparsity)을 공동으로 정규화하는 상기 비선형 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 것을 특징으로 하는 초분광 영상 재구성 방법.
Receiving coded data for an image; And
Reconstructing a hyperspectral image of an image for the coded data based on a pre-generated learning model
It includes,
Generating a nonlinear learning model through learning using a preset hyperspectral image data set
Further comprising,
Reconstructing the hyperspectral image
Reconstructing the hyperspectral image based on the generated nonlinear learning model and nonlinear optimization technique,
Reconstructing the hyperspectral image
Hyperspectralization of the image for the coded data based on the nonlinear optimization technique that jointly normalizes the accuracy of the nonlinear spectral representation for the generated nonlinear learning model and the sparsity of gradients in the spatial domain. A hyperspectral image reconstruction method comprising reconstructing an image.
제2항에 있어서,
상기 비선형 학습 모델을 생성하는 단계는
상기 초분광 영상 데이터 세트를 이용한 학습을 통해 컨볼루션 자동인코더를 학습시켜 상기 비선형 학습 모델을 생성하는 것을 특징으로 하는 초분광 영상 재구성 방법.
According to claim 2,
The step of generating the nonlinear learning model is
A hyperspectral image reconstruction method characterized by generating a nonlinear learning model by learning a convolutional automatic encoder through training using the hyperspectral image data set.
제3항에 있어서,
상기 비선형 학습 모델을 생성하는 단계는
상기 컨볼루션 자동 인코더를 이용하여 비선형 공간에서 인코더 네트워크를 학습시킨 후 디코더 네트워크를 이용하여 상기 비선형 학습 모델을 생성하는 것을 특징으로 하는 초분광 영상 재구성 방법.
According to claim 3,
The step of generating the nonlinear learning model is
A hyperspectral image reconstruction method comprising learning the encoder network in a nonlinear space using the convolution automatic encoder and then generating the nonlinear learning model using a decoder network.
제4항에 있어서,
상기 컨볼루션 자동 인코더는
상기 초분광 영상 데이터 세트를 비선형 표현으로 변환하는 인코더 네트워크와 상기 비선형 표현으로부터 원본 데이터 세트를 생성하는 디코더 네트워크를 포함하는 것을 특징으로 하는 초분광 영상 재구성 방법.
According to claim 4,
The convolution automatic encoder
And an encoder network for converting the hyperspectral image data set into a nonlinear representation and a decoder network for generating an original data set from the nonlinear representation.
제2항에 있어서,
상기 비선형 학습 모델은
초분광 영상에 대한 비선형 재구성을 출력하는 학습 모델인 것을 특징으로 하는 초분광 영상 재구성 방법.
According to claim 2,
The non-linear learning model
A hyperspectral image reconstruction method, characterized in that it is a learning model that outputs a nonlinear reconstruction of the hyperspectral image.
삭제delete 영상에 대한 코딩된 데이터를 수신하는 단계; 및
미리 생성된 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계
를 포함하며,
미리 설정된 초분광 영상 데이터 세트를 이용한 학습을 통해 비선형 학습 모델을 생성하는 단계
를 더 포함하고,
상기 초분광 영상을 재구성하는 단계는
상기 생성된 비선형 학습 모델과 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성하며,
상기 초분광 영상을 재구성하는 단계는
ADMM(alternating direction multiplier) 방식을 사용하여 상기 비선형 최적화 기법을 반복 수행함으로써, 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 것을 특징으로 하는 초분광 영상 재구성 방법.
Receiving coded data for an image; And
Reconstructing a hyperspectral image of an image for the coded data based on a pre-generated learning model
It includes,
Generating a nonlinear learning model through learning using a preset hyperspectral image data set
Further comprising,
Reconstructing the hyperspectral image
Reconstructing the hyperspectral image based on the generated nonlinear learning model and nonlinear optimization technique,
Reconstructing the hyperspectral image
A hyperspectral image reconstruction method comprising reconstructing a hyperspectral image of an image for the coded data by repeatedly performing the nonlinear optimization technique using an alternating direction multiplier (ADMM) method.
제2항에 있어서,
상기 수신하는 단계는
압축 하이퍼스펙트럴 이미징 접근법을 이용하여 상기 영상에 대한 코딩된 데이터를 수신하는 것을 특징으로 하는 초분광 영상 재구성 방법.
According to claim 2,
The receiving step
A method of reconstructing hyperspectral images, characterized by receiving coded data for the images using a compressed hyperspectral imaging approach.
영상에 대한 코딩된 데이터를 수신하는 단계; 및
미리 학습된 스펙트럴 프라이어에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계
를 포함하며,
미리 설정된 초분광 영상 데이터 세트를 이용하여 상기 스펙트럴 프라이어(prior)를 학습시키는 단계
를 더 포함하고,
상기 초분광 영상을 재구성하는 단계는
상기 학습된 스펙트럴 프라이어와 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성하며,
상기 초분광 영상을 재구성하는 단계는
상기 학습된 스펙트럴 프라이어에 대한 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)의 희소성(sparsity)을 공동으로 정규화하는 상기 비선형 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 초분광 영상 재구성 방법.
Receiving coded data for an image; And
Reconstructing a hyperspectral image of an image for the coded data based on a previously learned spectral fryer
It includes,
Learning the spectral prior using a preset hyperspectral image data set
Further comprising,
Reconstructing the hyperspectral image
Reconstructing the hyperspectral image based on the learned spectral fryer and nonlinear optimization technique,
Reconstructing the hyperspectral image
Hyperspectralization of the image for the coded data based on the nonlinear optimization technique that jointly normalizes the accuracy of the nonlinear spectral representation for the learned spectral fryer and the sparsity of gradients in the spatial domain. Hyperspectral image reconstruction method for reconstructing images.
삭제delete 삭제delete 영상에 대한 코딩된 데이터를 수신하는 단계; 및
미리 학습된 스펙트럴 프라이어에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 단계
를 포함하며,
미리 설정된 초분광 영상 데이터 세트를 이용하여 상기 스펙트럴 프라이어(prior)를 학습시키는 단계
를 더 포함하고,
상기 초분광 영상을 재구성하는 단계는
상기 학습된 스펙트럴 프라이어와 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성하며,
상기 초분광 영상을 재구성하는 단계는
ADMM(alternating direction multiplier) 방식을 사용하여 상기 비선형 최적화 기법을 반복 수행함으로써, 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 것을 특징으로 하는 초분광 영상 재구성 방법.
Receiving coded data for an image; And
Reconstructing a hyperspectral image of an image for the coded data based on a previously learned spectral fryer
It includes,
Learning the spectral prior using a preset hyperspectral image data set
Further comprising,
Reconstructing the hyperspectral image
Reconstructing the hyperspectral image based on the learned spectral fryer and nonlinear optimization technique,
Reconstructing the hyperspectral image
A hyperspectral image reconstruction method comprising reconstructing a hyperspectral image of an image for the coded data by repeatedly performing the nonlinear optimization technique using an alternating direction multiplier (ADMM) method.
삭제delete 영상에 대한 코딩된 데이터를 수신하는 수신부; 및
미리 생성된 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 재구성부
를 포함하며,
미리 설정된 초분광 영상 데이터 세트를 이용한 학습을 통해 비선형 학습 모델을 생성하는 생성부
를 더 포함하고,
상기 재구성부는
상기 생성된 비선형 학습 모델과 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성하며,
상기 재구성부는
상기 생성된 비선형 학습 모델에 대한 비선형 스펙트럴 표현의 정확도와 공간 영역에서의 그래디언트(gradient)의 희소성(sparsity)을 공동으로 정규화하는 상기 비선형 최적화 기법에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 것을 특징으로 하는 초분광 영상 재구성 장치.
A receiver configured to receive coded data for an image; And
A reconstruction unit reconstructing a hyperspectral image of an image of the coded data based on a previously generated learning model
It includes,
A generation unit that generates a nonlinear learning model through learning using a preset hyperspectral image data set
Further comprising,
The reconstruction unit
Reconstructing the hyperspectral image based on the generated nonlinear learning model and nonlinear optimization technique,
The reconstruction unit
Hyperspectralization of the image for the coded data based on the nonlinear optimization technique that jointly normalizes the accuracy of the nonlinear spectral representation for the generated nonlinear learning model and the sparsity of gradients in the spatial domain. Ultra-spectral image reconstruction apparatus, characterized in that to reconstruct the image.
제15항에 있어서,
상기 생성부는
상기 초분광 영상 데이터 세트를 이용한 학습을 통해 컨볼루션 자동인코더를 학습시켜 상기 비선형 학습 모델을 생성하는 것을 특징으로 하는 초분광 영상 재구성 장치.
The method of claim 15,
The generation unit
An apparatus for reconstructing hyperspectral images, wherein the nonlinear learning model is generated by learning a convolutional automatic encoder through learning using the hyperspectral image data set.
제16항에 있어서,
상기 생성부는
상기 컨볼루션 자동 인코더를 이용하여 비선형 공간에서 인코더 네트워크를 학습시킨 후 디코더 네트워크를 이용하여 상기 비선형 학습 모델을 생성하는 것을 특징으로 하는 초분광 영상 재구성 장치.
The method of claim 16,
The generation unit
An apparatus for reconstructing hyperspectral images, wherein the encoder network is trained in a nonlinear space using the convolution automatic encoder, and then the decoder network is generated using a decoder network.
제17항에 있어서,
상기 컨볼루션 자동 인코더는
상기 초분광 영상 데이터 세트를 비선형 표현으로 변환하는 인코더 네트워크와 상기 비선형 표현으로부터 원본 데이터 세트를 생성하는 디코더 네트워크를 포함하는 것을 특징으로 하는 초분광 영상 재구성 장치.
The method of claim 17,
The convolution automatic encoder
And an encoder network for converting the hyperspectral image data set into a nonlinear representation and a decoder network for generating an original data set from the nonlinear representation.
제15항에 있어서,
상기 비선형 학습 모델은
초분광 영상에 대한 비선형 재구성을 출력하는 학습 모델인 것을 특징으로 하는 초분광 영상 재구성 장치.
The method of claim 15,
The non-linear learning model
A hyperspectral image reconstruction apparatus, characterized in that it is a learning model that outputs a nonlinear reconstruction of the hyperspectral image.
삭제delete 영상에 대한 코딩된 데이터를 수신하는 수신부; 및
미리 생성된 학습 모델에 기초하여 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 재구성부
를 포함하며,
미리 설정된 초분광 영상 데이터 세트를 이용한 학습을 통해 비선형 학습 모델을 생성하는 생성부
를 더 포함하고,
상기 재구성부는
상기 생성된 비선형 학습 모델과 비선형 최적화 기법에 기초하여 상기 초분광 영상을 재구성하며,
상기 재구성부는
ADMM(alternating direction multiplier) 방식을 사용하여 상기 비선형 최적화 기법을 반복 수행함으로써, 상기 코딩된 데이터에 대한 영상의 초분광 영상을 재구성하는 것을 특징으로 하는 초분광 영상 재구성 장치.
A receiver configured to receive coded data for an image; And
A reconstruction unit reconstructing a hyperspectral image of an image of the coded data based on a previously generated learning model
It includes,
A generation unit that generates a nonlinear learning model through learning using a preset hyperspectral image data set
Further comprising,
The reconstruction unit
Reconstructing the hyperspectral image based on the generated nonlinear learning model and nonlinear optimization technique,
The reconstruction unit
A hyperspectral image reconstruction apparatus characterized by reconstructing a hyperspectral image of an image for the coded data by repeatedly performing the nonlinear optimization technique using an alternating direction multiplier (ADMM) method.
제15항에 있어서,
상기 수신부는
압축 하이퍼스펙트럴 이미징 접근법을 이용하여 상기 영상에 대한 코딩된 데이터를 수신하는 것을 특징으로 하는 초분광 영상 재구성 장치.
The method of claim 15,
The receiving unit
An apparatus for reconstructing hyperspectral images, characterized by receiving coded data for the images using a compressed hyperspectral imaging approach.
삭제delete
KR1020180094253A 2017-09-27 2018-08-13 Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor KR102132075B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/127,014 US10861143B2 (en) 2017-09-27 2018-09-10 Method and apparatus for reconstructing hyperspectral image using artificial intelligence

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20170125312 2017-09-27
KR1020170125312 2017-09-27
KR1020180031806A KR20190036442A (en) 2017-09-27 2018-03-20 Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor
KR1020180031806 2018-03-20

Publications (2)

Publication Number Publication Date
KR20190036459A KR20190036459A (en) 2019-04-04
KR102132075B1 true KR102132075B1 (en) 2020-07-08

Family

ID=66105624

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180094253A KR102132075B1 (en) 2017-09-27 2018-08-13 Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor

Country Status (1)

Country Link
KR (1) KR102132075B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102407251B1 (en) * 2021-07-15 2022-07-05 (주) 플레이오니 Method, apparatus and program for generating composition map and for detecting source gas using artificial intelligence

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3134527C (en) * 2019-04-22 2023-12-12 Leia Inc. Time-multiplexed backlight, multiview display, and method
US11263756B2 (en) * 2019-12-09 2022-03-01 Naver Corporation Method and apparatus for semantic segmentation and depth completion using a convolutional neural network
KR102273655B1 (en) * 2020-12-24 2021-07-06 국방기술품질원 Method for creating hyperspectral high speed camera image using generative adversarial network algorithm

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016090291A (en) 2014-10-31 2016-05-23 パナソニックIpマネジメント株式会社 Imaging apparatus, spectroscopy system and spectroscopy method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016090291A (en) 2014-10-31 2016-05-23 パナソニックIpマネジメント株式会社 Imaging apparatus, spectroscopy system and spectroscopy method

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Xiaorui Ma ET AL:"Spectral-Spatial Classification of Hyperspectral Image Based on Deep Auto-Encoder", IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing(2016.09.30.) 1부.*
Yunsong Li ET AL:"Hyperspectral image reconstruction by deep convolutional neural network for classification", Pattern Recognition Volume 63, March 2017, Pages 371-383(2017.03.31.) 1부.*
전석준, "다중표본 압축 센싱을 이용한 초분광비디오 관측 시스템 개발", 학위논문(석사)-한국과학기술원:전산학부, 2016.8(2016.08.31.) 1부.*

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102407251B1 (en) * 2021-07-15 2022-07-05 (주) 플레이오니 Method, apparatus and program for generating composition map and for detecting source gas using artificial intelligence

Also Published As

Publication number Publication date
KR20190036459A (en) 2019-04-04

Similar Documents

Publication Publication Date Title
US10861143B2 (en) Method and apparatus for reconstructing hyperspectral image using artificial intelligence
KR102132075B1 (en) Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor
Wang et al. Hyperspectral image reconstruction using a deep spatial-spectral prior
US10274420B2 (en) Compact multifunctional system for imaging spectroscopy
KR102269229B1 (en) Lensless Hyperspectral Imaging Method and Apparatus Therefore
CN110326022B (en) Apparatus and method for recovering hyperspectral data from image
Zhang et al. Hyperspectral image reconstruction using deep external and internal learning
KR20190036442A (en) Hyperspectral Imaging Reconstruction Method Using Artificial Intelligence and Apparatus Therefor
Hu et al. Convolutional sparse coding for RGB+ NIR imaging
US20220301114A1 (en) Noise Reconstruction For Image Denoising
Ramirez et al. LADMM-Net: An unrolled deep network for spectral image fusion from compressive data
Arguello et al. Spatial super-resolution in code aperture spectral imaging
Degraux et al. Multispectral compressive imaging strategies using Fabry–Pérot filtered sensors
Sun et al. Tuning IR-cut filter for illumination-aware spectral reconstruction from RGB
Saragadam et al. SASSI—super-pixelated adaptive spatio-spectral imaging
KR20230118938A (en) optical method
Shinoda et al. Multispectral filter array design without training images
JP7415464B2 (en) Video processing device, video processing method and program
Picone et al. Joint demosaicing and fusion of multiresolution coded acquisitions: A unified image formation and reconstruction method
Kar Computational spectral imaging techniques using diffractive lenses and compressive sensing
Galvis-Carreno Coded aperture design in compressive spectral imaging
Zhang et al. Sub-pixel Dispersion Model for Coded Aperture Snapshot Spectral Imaging
Fu et al. Reinforcement learning based plug-and-play method for hyperspectral image reconstruction
Mei et al. Clustering-based Self-supervised Compressive Spectral Imaging using Positional-encoding Representation
Cuadrado et al. Image Reconstruction Performance Analysis by Optical Implementation in Compressive Spectral Imaging

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant