KR20220037764A - 영상 처리 장치 및 그 동작방법 - Google Patents

영상 처리 장치 및 그 동작방법 Download PDF

Info

Publication number
KR20220037764A
KR20220037764A KR1020200120632A KR20200120632A KR20220037764A KR 20220037764 A KR20220037764 A KR 20220037764A KR 1020200120632 A KR1020200120632 A KR 1020200120632A KR 20200120632 A KR20200120632 A KR 20200120632A KR 20220037764 A KR20220037764 A KR 20220037764A
Authority
KR
South Korea
Prior art keywords
information
image
characteristic information
weight
obtaining
Prior art date
Application number
KR1020200120632A
Other languages
English (en)
Inventor
이태미
강수민
박재연
송영찬
안일준
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020200120632A priority Critical patent/KR20220037764A/ko
Priority to EP21869623.5A priority patent/EP4187482A4/en
Priority to CN202180064086.2A priority patent/CN116210022A/zh
Priority to PCT/KR2021/012234 priority patent/WO2022060001A1/ko
Publication of KR20220037764A publication Critical patent/KR20220037764A/ko
Priority to US18/120,832 priority patent/US20230214971A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • G06T5/002
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/60Image enhancement or restoration using machine learning, e.g. neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20182Noise reduction or smoothing in the temporal domain; Spatio-temporal filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Image Processing (AREA)

Abstract

영상 처리 장치에 관한 것으로, 하나 이상의 인스트럭션들을 저장하는 메모리 및 메모리에 저장된 하나 이상의 인스트럭션들을 실행하는 프로세서를 포함하고, 프로세서는, 제1 영상에 포함되는 픽셀들 각각과 픽셀들 각각의 주변 픽셀과의 차이에 기초하여, 유사도 정보를 획득하고, 유사도 정보에 기초하여, 가중치 정보를 결정하며, 제1 영상과 제1 커널과의 컨볼루션 연산을 통해, 제1 특징 정보를 획득하고, 가중치 정보를 제1 특징 정보에 적용함으로써, 제2 특징 정보를 획득하고, 제2 특징 정보에 기초하여, 제2 영상을 생성하는, 영상 처리 장치가 개시된다.

Description

영상 처리 장치 및 그 동작방법{Image processing apparatus and operating method for the same}
다양한 실시예들은 뉴럴 네트워크를 이용하여, 영상의 노이즈를 제거하는 영상 처리 장치 및 그 동작방법에 관한 것이다.
컴퓨터 기술의 발달과 함께 데이터 트래픽이 지수함수 형태로 증가하면서 인공지능은 미래 혁신을 주도하는 중요한 트랜드로 자리잡았다. 인공지능은 사람의 사고방식을 모방하는 방식이기 때문에 사실상 전 산업에 무한하게 응용이 가능하다. 인공지능의 대표적인 기술로는 패턴 인식, 기계 학습, 전문가 시스템, 뉴럴 네트워크, 자연어 처리 등이 있다.
뉴럴 네트워크는 인간의 생물학적 신경 세포의 특성을 수학적 표현에 의해 모델링한 것으로, 인간이 가지고 있는 학습이라는 능력을 모방한 알고리즘을 이용한다. 이 알고리즘을 통하여, 뉴럴 네트워크는 입력 데이터와 출력 데이터 사이의 사상(mapping)을 생성할 수 있고, 이러한 사상을 생성하는 능력은 뉴럴 네트워크의 학습 능력이라고 표현될 수 있다. 또한, 뉴럴 네트워크는 학습된 결과에 기초하여, 학습에 이용되지 않았던 입력 데이터에 대하여, 올바른 출력 데이터를 생성할 수 있는 일반화 능력을 가진다.
심층 신경망(예를 들어, 층이 깊은 컨볼루션 뉴럴 네트워크(CNN: Convolution Neural Network))를 이용하여, 영상의 디노이징(denoising)을 수행하는 경우, 픽셀의 지역적인(local) 특성에 따라 적응적인 처리가 가능하다. 그러나, 연산량의 제약으로 인해, 컨볼루션 뉴럴 네트워크에 포함되는 레이어의 수를 감소시키는 경우, 적응적 처리의 성능이 저하되는 문제점이 있다.
다양한 실시예들은, 컨볼루션 뉴럴 네트워크를 이용하여, 디노이징을 수행할 수 있는 영상 처리 장치 및 그 동작방법을 제공할 수 있다.
일 실시예에 따른 영상 처리 장치는 하나 이상의 인스트럭션들을 저장하는 메모리, 및 상기 메모리에 저장된 상기 하나 이상의 인스트럭션들을 실행하는 프로세서를 포함하고, 상기 프로세서는, 제1 영상에 포함되는 픽셀들 각각과 상기 픽셀들 각각의 주변 픽셀과의 차이에 기초하여, 유사도 정보를 획득하고, 상기 유사도 정보에 기초하여, 가중치 정보를 결정하며, 상기 제1 영상과 제1 커널과의 컨볼루션 연산을 통해, 제1 특징 정보를 획득하고, 상기 가중치 정보를 상기 제1 특징 정보에 적용함으로써, 제2 특징 정보를 획득하고, 상기 제2 특징 정보에 기초하여, 제2 영상을 생성할 수 있다.
일 실시예에 따른 프로세서는, 상기 제1 영상에 포함되는 픽셀들 각각과, 상기 픽셀들 각각에 대해 제1 상대적 위치를 가지는 제1 주변 픽셀과의 차이에 기초하여, 제1 유사도 정보를 획득하고, 상기 제1 영상에 포함되는 픽셀들 각각과, 상기 픽셀들 각각에 대해 제2 상대적 위치를 가지는 제2 주변 픽셀과의 차이에 기초하여, 제2 유사도 정보를 획득할 수 있다.
일 실시예에 따른 프로세서는, 상기 유사도 정보에 자연 지수 함수 또는 소프트 맥스 함수를 적용하여, 상기 가중치 정보를 산출할 수 있다.
일 실시예에 따른 제1 커널의 채널 개수는, 상기 가중치 정보의 채널 개수와 상기 제1 특징 정보의 채널 개수가 동일해지도록 결정될 수 있다.
일 실시예에 따른 프로세서는, 상기 가중치 정보와 상기 제1 특징 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 상기 제2 특징 정보를 획득할 수 있다.
일 실시예에 따른 프로세서는, 상기 제2 특징 정보와 제2 커널과의 컨볼루션 연산을 통해, 제3 특징 정보를 획득하며, 상기 제3 특징 정보에 기초하여, 상기 제2 영상을 생성할 수 있다.
일 실시예에 따른 프로세서는, 상기 가중치 정보와 제3 커널과의 컨볼루션 연산을 통해, 제2 가중치 정보를 획득하고, 상기 제2 가중치 정보를 상기 제2 특징 정보에 적용함으로써, 제4 특징 정보를 획득하고, 상기 제4 특징 정보에 기초하여, 상기 제2 영상을 생성할 수 있다.
일 실시예에 따른 프로세서는, 상기 제2 특징 정보와 상기 제2 가중치 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 상기 제4 특징 정보를 획득할 수 있다.
일 실시예에 따른 프로세서는, 복수의 레이어들을 포함하는 뉴럴 네트워크를 이용하여, 상기 제1 영상을 처리함으로써, 상기 제2 영상을 생성하고, 상기 제1 영상은 상기 복수의 레이어들 중 n번째 레이어로 입력되고, 상기 제2 특징 정보는 상기 복수의 레이어들 중 n+1번째 레이어로 입력될 수 있다.
일 실시예에 따른 영상 처리 장치의 동작방법은, 제1 영상에 포함되는 픽셀들 각각과 상기 픽셀들 각각의 주변 픽셀과의 차이에 기초하여, 유사도 정보를 획득하는 단계, 상기 유사도 정보에 기초하여, 가중치 정보를 결정하는 단계, 상기 제1 영상과 제1 커널과의 컨볼루션 연산을 통해, 제1 특징 정보를 획득하는 단계, 상기 가중치 정보를 상기 제1 특징 정보에 적용함으로써, 제2 특징 정보를 획득하는 단계, 및 상기 제2 특징 정보에 기초하여, 제2 영상을 생성하는 단계를 포함할 수 있다.
일 실시예에 따른 영상 처리 장치는, 영상에 포함되는 복수의 픽셀들 각각에서, 픽셀들 각각과 주변 픽셀들을 이용하여, 영상 처리를 수행하는 경우, 유사한 특징을 가지는 주변 픽셀의 특징을 더 강조할 수 있으며, 이에 따라, 픽셀의 지역적인 특성에 따른 적응적인 영상 처리가 가능하다.
일 실시예에 따른 영상 처리 장치는 뉴럴 네트워크를 이용하여, 입력 영상의 노이즈를 제거하면서, 세밀한 가장자리(edge) 처리와 텍스쳐를 유지하는 디노이징(denosing)을 수행할 수 있다.
일 실시예에 따른, 입력 영상의 디노이징(denoising)을 수행하는 뉴럴 네트워크는, 레이어의 수가 감소되더라도, 픽셀의 지역적인(local) 특성에 따른 적응적인 처리 성능이 저하되지 않는다.
도 1은 일 실시예에 따른 영상 처리 장치가 영상 처리 네트워크를 이용하여 영상을 처리하는 동작을 나타내는 도면이다.
도 2는 일 실시예에 따른 엣지 보존 필터 블록을 나타내는 도면이다.
도 3은 일 실시예에 따른 엣지 보존 필터 블록의 동작을 설명하기 위해 참조되는 도면이다.
도 4는 일 실시예에 따른 차이 정보(D1)를 획득하는 방법을 설명하기 위해 참조되는 도면이다.
도 5 및 도 6은 일 실시예에 따른 컨볼루션 연산을 설명하기 위해 참조되는 도면들이다.
도 7 및 도 8은 다른 실시예에 따른 하나의 엣지 보존 필터 블록을 나타내는 도면들이다.
도 9는 일 실시예에 따른 영상 처리 장치의 동작방법을 나타내는 흐름도이다.
도 10은 일 실시예에 따른 영상 처리 장치의 구성을 나타내는 블록도이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 실시예들에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 일 실시예에 따른 영상 처리 장치가 영상 처리 네트워크를 이용하여 영상을 처리하는 동작을 나타내는 도면이다.
도 1을 참조하면, 일 실시예에 따른 영상 처리 네트워크(30)는 입력 영상(10)을 입력 받아, 입력 영상(10)을 처리함으로써, 출력 영상(20)을 생성할 수 있다. 이때, 입력 영상(10)은 노이즈를 포함할 수 있다. 영상 처리 장치(100)는 영상 처리 네트워크(30)를 이용하여, 입력 영상(10)의 노이즈를 제거하면서, 세밀한 가장자리(edge) 처리와 텍스쳐를 유지하는 디노이징(denosing)을 수행함으로써, 출력 영상(20)을 생성할 수 있다.
일 실시예에 따른 영상 처리 네트워크(30)는 하나 이상의 컨볼루션 레이어들(31, 32, …, 39)과 적어도 하나의 엣지 보존 필터 블록(200)을 포함할 수 있다. 도 1에는 제1 컨볼루션 레이어(31)와 제2 컨볼루션 레이어(32) 사이에 엣지 보존 필터 블록(200)이 위치하는 것으로 도시하였지만 이에 한정되지 않는다.
일 실시예에 따른 엣지 보존 필터 블록(200)은 제1 컨볼루션 레이어(31) 이전에 위치하여, 영상 처리 네트워크(30)의 입력과 연결될 수 있다. 또는, 엣지 보존 필터 블록(200)은 제2 내지 제N 컨볼루션 레이어들(32, …, 39) 중 인접한 2개의 컨볼루션 레이어들 사이에 위치할 수 있다. 또한, 제1 내지 제N 컨볼루션 레이어들(31, 32, …, 39) 중 인접한 2개의 컨볼루션 레이어들 사이에 엣지 보존 필터 블록(200)이 2개 이상 연속하여 위치할 수 있다. 또는 엣지 보존 필터 블록(200)은 제N 컨볼루션 레이어(39) 다음에 위치하여, 영상 처리 네트워크(30)의 출력과 연결될 수도 있다.
한편, 영상 처리 네트워크(30)에 포함된 컨볼루션 레이어들(31, 32, …, 39) 각각에서는 컨볼루션 레이어에 입력된 영상과 커널과의 컨볼루션 연산을 통해 특징 맵(특징 정보)이 생성될 수 있으며, 특징 맵에 활성화 함수를 적용하는 활성화 함수 연산 등이 수행될 수 있다. 활성화 함수 연산은 컨볼루션 연산 결과 생성된 특징 맵에 비선형(non-linear) 특성을 부여하는 것으로, 활성화 함수는, 시그모이드 함수(sigmoid function), Tanh 함수, ReLU(Rectified Linear Unit) 함수, leaky ReLu 함수 등을 포함할 수 있다. 다만, 이에 한정되는 것은 아니다.
또한, 엣지 보존 필터 블록(200)도, 입력된 영상과 커널과의 컨볼루션 연산, 활성화 함수 연산 등을 수행하여 특징 정보를 획득할 수 있다. 엣지 보존 필터 블록(200)은 주변 픽셀과의 유사도 정보를 획득하고, 유사도 정보를 특징 정보에 적용함으로써, 입력된 영상의 지역적인(local) 특성(예를 들어, 엣지 특성, 텍스쳐 특성 등)이 특징 정보에 고려되도록 할 수 있다.
일 실시예에 따른 엣지 보존 필터 블록(200)에서 수행되는 영상 처리에 대해서는 이하 도면들을 참조하여 자세히 설명하기로 한다.
도 2는 일 실시예에 따른 엣지 보존 필터 블록을 나타내는 도면이다.
도 2를 참조하면, 일 실시예에 따른 엣지 보존 필터 블록(200)은 유사도 산출부(210), 가중치 결정부(220), 제1 컨볼루션 부(230), 가중치 적용부(240) 및 제2 컨볼루션 부(250)를 포함할 수 있다.
일 실시예에 따른 엣지 보존 필터 블록(200)은 제1 영상(F_in)을 입력 받아, 제2 영상(F_out)을 출력하는 구조를 포함할 수 있으며, 제1 영상(F_in)과 제2 영상(F_out)의 크기는 동일하고, 채널 수는 상이할 수 있다. 다만, 이에 한정되지 않는다.
또한, 엣지 보존 필터 블록(200)은 도 1의 제1 컨볼루션 레이어(31)의 이전에 위치하여, 영상 처리 네트워크(30)의 입력과 연결될 수 있다. 이러한 경우, 도 2의 제1 영상(F_in)은 영상 처리 네트워크(30)의 입력 영상(10)과 동일할 수 있다. 또는, 엣지 보존 필터 블록(200)이 복수의 컨볼루션 레이어들 중 m번째 컨볼루션 레이어 다음에 위치하는 경우, 도 2의 제1 영상(F_in)은 m번째 컨볼루션 레이어(엣지 보존 필터 블록의 이전 레이어)에서 출력되는 특징 정보일 수 있다.
또한, 도 2의 제2 영상(F_out)은 엣지 보존 필터 블록(200)의 다음 레이어로 입력되는 특징 정보일 수 있다.
이하, 도 3을 참조하여, 도 2의 엣지 보존 필터 블록(200)에서 수행되는 동작을 구체적으로 설명하기로 한다.
도 3은 일 실시예에 따른 엣지 보존 필터 블록의 동작을 설명하기 위해 참조되는 도면이다.
도 3에서는, 설명의 편의를 위하여, 제1 영상(F_in)의 너비가 w, 높이가 h, 채널 수가 1인 것으로 가정하여 설명하기로 한다. 유사도 산출부(210)는 제1 영상(F_in)에 포함되는 픽셀들 각각과 주변 픽셀과의 차이 값을 계산할 수 있다. 예를 들어, 유사도 산출부(210)는 제1 영상(F_in)에 포함되는 복수의 픽셀들 중 제1 픽셀(기준 픽셀)을 기준으로 주변에 위치한 8개의 픽셀들과 제1 픽셀(기준 픽셀)을 포함하는 9개의 픽셀들 각각과 제1 픽셀(기준 픽셀)과의 차이 값을 계산할 수 있다. 이에 따라, 유사도 산출부(210)는 제1 픽셀에 대해서 9개의 차이 값을 획득할 수 있다.
유사도 산출부(210)는 동일한 방식으로 제1 영상에 포함되는 복수의 픽셀들 각각을 기준 픽셀로 하여, 복수의 픽셀들 각각에 대한 9개의 차이 값을 획득할 수 있다. 이에 따라, 유사도 산출부(210)는 제1 영상(F_in)에 대하여, 채널 수가 9인 차이 정보(D1)를 생성할 수 있으나, 이에 한정되지 않는다.
주변 픽셀을 결정하는 기준에 따라, 차이 정보(D1)의 채널 수는 다양하게 결정될 수 있다. 예를 들어, 주변 픽셀들을 제1 픽셀에 대해 상, 하, 좌, 우에 위치하는 4개의 픽셀들로 결정하는 경우, 차이 정보(D1)의 채널 수는 5가 될 수 있다. 또한, 일 실시예에 따른 차이 정보(D1)의 크기(w x h)는 제1 영상(F_in)의 크기(w x h)와 동일할 수 있다.
도 3의 차이 정보(D1)의 제1 채널 영상은 제1 영상(F_in)에 포함되는 픽셀들 각각과 픽셀들 각각에 대해 제1 상대적 위치를 가지는 주변 픽셀(예를 들어, 픽셀들 각각의 오른쪽에 인접하는 픽셀)과의 차이 값을 나타낼 수 있다. 이때, 차이 정보(D1)의 제1 채널 영상은, 차이 정보(D1)의 제1 채널에 대응하는 영상(정보)을 의미할 수 있다.
또는, 차이 정보(D1)의 제2 채널에 대응하는 제2 채널 영상은 제1 영상(F_in)에 포함되는 픽셀들 각각과, 픽셀들 각각에 대해 제2 상대적 위치를 가지는 주변 픽셀(예를 들어, 픽셀들 각각의 왼쪽에 인접하는 픽셀)과의 차이 값을 나타낼 수 있다.
일 실시예에 따른 유사도 산출부(210)는 제1 영상(F_in)에 대해 마스크 처리를 수행함으로써, 차이 정보(D1)를 획득할 수 있다. 예를 들어, 유사도 산출부(210)는 하나의 픽셀(기준 픽셀)을 기준으로 주변에 위치한 8개의 픽셀들과의 차이 정보를 획득하는 경우, 도 4에 도시된 바와 같이, 3x3의 크기를 가지는 8개의 마스크 필터들(M1, M2, M3, M4, M5, M6, M7, M8)을 이용하여, 마스크 처리를 수행할 수 있다.
도 4는 일 실시예에 따른 차이 정보(D1)를 획득하는 방법을 설명하기 위해 참조되는 도면이다.
도 4에서는 설명의 편의를 위하여, 제1 영상(F_in)은 5x5의 크기를 가지는 것으로 가정하여 설명하기로 한다. 마스크 처리는, 제1 영상(F_in)과 마스크 필터들 각각의 컨볼루션 연산을 통해 수행될 수 있다. 이에 따라, 8개의 마스크 필터들을 포함하는 경우, 마스크 처리를 통해, 차이 정보(D1)에 포함되는 8개의 채널 영상들(421, 422, …, 427, 428)을 생성할 수 있다. 예를 들어, 유사도 산출부(210)는 제1 영상(F_in)과 제1 마스크 필터(M1)와의 컨볼루션 연산을 통해, 차이 정보(D1)의 제1 채널 영상(421)을 생성하고, 제1 영상(F_in)과 제2 마스크 필터와의 컨볼루션 연산을 통해, 차이 정보(D1)의 제2 채널 영상(422)을 생성할 수 있다.
도 4를 참조하면, 유사도 산출부(210)는 제1 영상(F_in)에 포함된 3x3 크기의 영역에 포함되는 픽셀 값들과 마스크 필터들 각각에 포함된 픽셀 값들(파라미터 값들)을 각각 곱하여, 합산함으로써, 차이 정보(D1)에 포함되는 픽셀 값을 계산할 수 있다.
이때, 차이 정보를 계산하기 위한 주변 픽셀의 위치에 따라, 마스크 필터에 포함되는 파라미터 값들이 결정될 수 있다. 예를 들어, 제1 마스크 필터(M1)는, 기준 픽셀과 기준 픽셀의 왼쪽 상단에 위치한 픽셀과의 차이 정보를 계산하기 위한 마스크 필터일 수 있다. 이에 따라, 제1 마스크 필터(M1)는 중심 픽셀 값이 ‘1’이고, 중심 픽셀의 왼쪽 상단에 위치한 픽셀 값이 ‘-1’이며, 나머지 픽셀 값들은 ‘0’일 수 있다.
일 실시예에 따른 유사도 산출부(210)는 제1 픽셀(415)을 중심으로 하는 제1 영역(410)과 제1 마스크 필터(M1)와의 컨볼루션을 수행하여, 차이 정보(D1)의 제1 채널 영상(421)에 포함되는 제2 픽셀(431)의 값을 연산할 수 있다. 이때, 제1 영상(F_in)에서 제1 픽셀(415)의 위치와 차이 정보(D1)의 제1 채널 영상(421)에서의 제2 픽셀(431)의 위치는 동일할 수 있다. 제1 채널 영상(421)에 포함되는 제2 픽셀(431)의 값은, 제1 픽셀 값(P12)에서 제1 픽셀(415)의 왼쪽 상단에 위치한 픽셀 값(P6)을 뺀 값일 수 있다.
이와 동일한 방식으로 제1 영상(F_in)에 포함되는 픽셀들 각각이, 컨볼루션 연산의 대상이 되는 영역의 중심에 위치하도록, 컨볼루션 연산의 대상이 되는 영역을 변경할 수 있으며, 이때, 영역의 중심에 위치하는 픽셀이 기준 픽셀이 된다. 유사도 산출부(210)는, 변경된 영역과 제1 마스크 필터(M1)와의 컨볼루션 연산을 수행함으로써, 제1 채널 영상(421)에 포함되는 픽셀 값들을 연산할 수 있다.
또한, 제2 마스크 필터(M2)는, 기준 픽셀과 기준 픽셀의 상단에 위치한 픽셀과의 차이 정보를 계산하기 위한 마스크 필터일 수 있다. 이에 따라, 제2 마스크 필터(M2)는 중심 픽셀 값이 ‘1’이고, 중심 픽셀의 상단에 위치한 픽셀 값이 ‘-1’이며, 나머지 픽셀 값들은 ‘0’일 수 있다.
유사도 산출부(210)는 제1 픽셀(415)을 중심으로 하는 제1 영역(410)과 제2 마스크 필터(M2)와의 컨볼루션 연산을 수행함으로써, 차이 정보(D1)의 제2 채널 영상(422)에 포함되는 제3 픽셀(432)의 값을 연산할 수 있다. 이때, 제1 영상(F_in)에서 제1 픽셀(415)의 위치와 제2 채널 영상(422)에서의 제3 픽셀(432)의 위치는 동일할 수 있다. 이에 따라, 제2 채널 영상(422)에 포함되는 제3 픽셀(432)의 값은, 제1 픽셀 값(P12)에서 제1 픽셀(415)의 상단에 위치한 픽셀 값(P7)을 뺀 값일 수 있다.
이와 동일한 방식으로 제1 영상(F_in)에 포함되는 픽셀들 각각이, 컨볼루션 연산의 대상이 되는 영역의 중심에 위치하도록, 컨볼루션 연산의 대상이 되는 영역을 변경하고, 변경된 영역과 제2 마스크 필터(M2)와의 컨볼루션 연산을 수행함으로써, 제2 채널 영상(422)에 포함되는 픽셀 값들을 연산할 수 있다.
또한, 제3 마스크 필터(M3)는 기준 픽셀과 기준 픽셀의 오른쪽 상단에 위치한 픽셀과의 차이 정보를 계산하기 위한 마스크 필터일 수 있으며, 제4 마스크 필터(M4)는 기준 픽셀과 기준 픽셀의 오른쪽에 위치한 픽셀과의 차이 정보를 계산하기 위한 마스크 필터일 수 있다. 나머지 마스크 필터들(제5 내지 제8 마스크 필터들(M5, M6, M7, M8))도 기준 픽셀과 주변 픽셀(기준 픽셀의 주변에 위치한 픽셀)과의 차이 정보를 계산하기 위한 마스크 필터들이다.
일 실시예에 따른 유사도 산출부(210)는 도 4에 도시하고 설명한 바와 같이, 8개의 마스크 필터들을 이용하여, 마스크 처리를 수행함으로써, 제1 영상(F_in)에 포함되는 픽셀들 각각과, 픽셀들 각각에 대해 제1 내지 제8 상대적 위치를 가지는 주변 픽셀들과의 차이 값들을 포함하는 차이 정보(D1)를 획득할 수 있다. 예를 들어, 유사도 산출부(210)는 제1 내지 제8 마스크들(M1, M2, M3, M3, M4, M5, M6, M7, M8)을 이용하여, 차이 정보(D1)의 제1 내지 제8 채널 영상들(421, 422, 423, 424, 425, 426, 427, 428)을 생성할 수 있다.
또한, 일 실시예에 따른 차이 정보(D1)는 모든 픽셀 값이 ‘0’인 제9 채널 영상을 포함할 수 있다. 예를 들어, 제9 채널 영상은 제1 영상(F_in)에 포함되는 픽셀들 각각에 대해, 자기 자신과의 차이 정보를 나타내는 영상일 수 있다.
한편, 도 4에 도시된 마스크 처리는 차이 정보(D1)를 획득하는 방법의 일 예에 불과하며, 유사도 산출부(210)는 다양한 방법으로 제1 영상(F_in)에 포함되는 픽셀들 각각과 주변 픽셀과의 차이 정보를 획득할 수 있다.
다시, 도 3을 참조하면, 유사도 산출부(210)는 차이 정보(D1)에 포함되는 값들 각각에 소정의 연산을 수행함으로써, 유사도 정보(D2)를 생성할 수 있다. 일 실시예에 따른 유사도 정보(D2)는 기준 픽셀과 주변 픽셀이 유사한 정도를 나타내는 값을 포함할 수 있다.
예를 들어, 유사도 산출부(210)는 차이 정보(D1)에 포함되는 값들 각각을 제곱하고, 제곱한 값에 -1을 곱하여, 유사도 정보(D2)를 생성할 수 있다. 이에 따라, 유사도 정보(D2)가 음의 방향으로 큰 값을 가지는 경우, 기준 픽셀과 주변 픽셀의 차이가 크다는 것을 의미하며, 유사도 정보가 음의 방향으로 작은 값을 가지는 경우, 기준 픽셀과 주변 픽셀이 유사하다는 것을 의미할 수 있다. 다만, 이에 한정되지 않으며, 유사도 산출부(210)는 차이 정보(D1)에 다양한 연산을 수행함으로써, 유사도 정보(D2)를 생성할 수 있다.
일 실시예에 따른 유사도 정보(D2)는 차이 정보(D1)와 동일한 크기 및 채널 수를 가질 수 있다.
일 실시예에 따른 가중치 결정부(220)는 유사도 정보(D2)에 기초하여, 가중치 정보(W)를 결정할 수 있다. 가중치 결정부(220)는 유사도 정보(D2)에 포함되는 값들에 기초하여, 가중치 정보(W)에 포함되는 가중치 값들을 결정할 수 있다. 가중치 결정부(220)는 기준 픽셀과 주변 픽셀의 차이가 작을수록(기준 픽셀과 주변 픽셀이 동일, 유사할수록) 가중치 값을 크게 하고, 기준 픽셀과 주변 픽셀의 차이가 클수록(기준 픽셀과 주변 픽셀이 상이할수록) 가중치 값을 작게 하도록 가중치 정보(W)를 결정할 수 있다. 이에 따라, 가중치 정보(W)를 후술하는 제1 특징 정보(F1)에 적용하면, 기준 픽셀과 동일 유사한 주변 픽셀들의 특징이 강조될 수 있다.
예를 들어, 가중치 결정부(220)는 유사도 정보(D2)에 포함되는 값들의 크기가 음의 방향으로 클수록, 가중치 값이 0에 가까워지고, 유사도 정보에 포함되는 값들의 크기가 음의 방향으로 작을수록 가중치 값이 1에 가까워지도록 가중치 값들을 결정할 수 있다. 이때, 가중치 결정부(220)는 유사도 정보(D2)에 포함되는 값들에 자연 지수 함수 또는 소프트 맥스 함수를 적용함으로써, 가중치 정보(W)를 산출할 수 있다. 예를 들어, 자연 지수 함수를 적용하여 가중치 정보(W)를 산출하는 경우는 수학식 1로 나타낼 수 있다.
Figure pat00001
수학식 1에서, D2(xi)는 유사도 정보에 포함되는 값들 중 i 위치를 가지는 값을 의미하며, W(xi)는 가중치 정보에 포함되는 값들 중 i 위치를 가지는 값을 의미한다.
또한, 소프트 맥스 함수를 적용하여 가중치 정보(W)를 산출하는 경우는 수학식 2로 나타낼 수 있다.
Figure pat00002
수학식 1에서, D2(xi)는 유사도 정보에 포함되는 값들 중 i 위치를 가지는 값을 의미하며, D2(xj)는 유사도 정보에서 j 위치를 가지는 값을 의미한다. 또한, W(xi)는 가중치 정보에 포함되는 값들 중 i 위치를 가지는 값을 의미한다.
한편, 도 3을 참조하면, 제1 컨볼루션 부(230)는 제1 영상(F_in)과 제1 커널과의 컨볼루션 연산을 수행하여, 제1 특징 정보(F1)를 생성할 수 있다.
이하, 도 5 및 6을 참조하여, 컨볼루션 연산을 수행하여, 제1 특징 정보(F1)를 생성하는 방법을 설명하기로 한다.
도 5 및 도 6은 일 실시예에 따른 컨볼루션 연산을 설명하기 위해 참조되는 도면들이다.
도 5는 일 실시예에 따른, 제1 컨볼루션 부(230)로 입력되는 제1 영상(F_in), 제1 커널(K1) 및 제1 특징 정보(F1)를 나타내는 도면이다.
도 5를 참조하면, 일 실시예에 따른 제1 컨볼루션 부(230)로 입력되는 제1 영상(F_in)의 크기는 w x h 일 수 있으며, 채널 수(Cin)는 1일 수 있다. 다만, 도 5에서는 설명의 편의를 위해, 제1 영상(F_in)의 채널 수(Cin)를 1로 가정하였으나, 이에 한정되지 않는다.
또한, 제1 컨볼루션 부(230)는 제1 커널(K1)을 포함하며, 제1 커널 (K1)은 Cout개의 서브 커널들을 포함할 수 있다. 또한, 하나의 서브 커널은 W x H x Cin의 크기를 가질 수 있다. 하나의 서브 커널의 채널 수(Cin)는 제1 영상(F_in)의 채널 수(Cin)와 동일할 수 있다. 도 5에서는 설명의 편의를 위해, 하나의 서브 커널의 크기는 W x H 이고, 하나의 서브 커널의 채널 수(Cin)는 1이며, 서브 커널들의 개수(Cout)는 9인 것으로 가정하기로 한다.
제1 컨볼루션 부(230)는 제1 영상(F_in)과 제1 커널(K1)의 컨볼루션 연산을 수행함으로써, 제1 특징 정보(F1)를 생성할 수 있다. 이때, 제1 특징 정보(F1)의 크기는 w x h일 수 있으며, 제1 특징 정보(F1)의 채널의 개수는 제1 커널(K1)의 서브 커널들의 개수(Cout)에 의해 결정될 수 있다. 제1 특징 정보(F1)의 채널의 개수는 9(Cout)일 수 있다.
도 6은, 일 실시예에 따른 제1 영상(F_in)과 제1 커널(K1)에 포함된 제1 서브 커널(510)과의 컨볼루션 연산을 통해, 제1 특징 정보(F1)의 제1 채널 영상(520)이 생성되는 과정을 설명하기 위해 참조되는 도면이다.
도 6에서는 설명의 편의를 위해, 제1 영상(F_in)이 5 x 5의 크기를 가지며, 채널의 개수는 1인 것으로 가정한다. 또한, 제1 영상(F_in)에 적용되는 제1 커널(K1)에 포함되는 하나의 서브 커널은 3 x 3의 크기를 가지며, 채널의 개수는 1인 것으로 가정한다.
도 6을 참조하면, 제1 영상(F_in)의 좌측 상단으로부터 우측 하단까지 제1 서브 커널(510)을 적용하여, 제1 영상(F_in)의 특징을 추출하는 과정이 도시되어 있다. 예를 들어, 제1 영상(F_in)의 좌측 상단 3 x 3 영역(621)에 포함되는 픽셀들에 제1 서브 커널(510)을 적용하여 컨볼루션 연산을 수행할 수 있다. 즉, 좌측 상단 3 x 3 영역(621)에 포함되는 픽셀 값들과 제1 서브 커널(510)에 포함되는 파라미터 값들을 곱하여 합산함으로써, 좌측 상단 3 x 3 영역(621) 매핑되는 하나의 픽셀 값(631)을 생성할 수 있다.
또한, 제1 영상(F_in)의 좌측 상단 3 x 3 영역(621)에서 우측으로 한 픽셀 이동시킨 3 x 3 영역(622)에 포함되는 픽셀 값들과 제1 서브 커널(610)에 포함되는 파라미터 값들을 곱하여 합산함으로써, 3 x 3 영역(622)에 매핑되는 하나의 픽셀값(632)을 생성할 수 있다. 동일한 방식으로, 제1 영상(F_in) 내에서 컨볼루션 연산의 대상을 좌측에서 우측으로, 상단에서 하단으로 한 픽셀씩 스캔하면서, 제1 서브 커널(610)에 포함되는 파라미터 값들을 곱하여 합산함으로써, 제1 특징 정보(F1)의 제1 채널 영상(630)에 포함되는 픽셀값들을 생성할 수 있다. 이때, 컨볼루션 연산의 대상이 되는 데이터는 한 픽셀씩 이동하면서 스캔될 수도 있으나, 2개 픽셀 또는 그 이상의 픽셀 개수만큼 이동하면서 스캔될 수도 있다. 스캔 과정에서 입력 데이터가 이동하는 픽셀의 개수를 스트라이드(stride)라고 하며, 스트라이드의 크기에 따라 출력되는 제1 특징 정보(F1)의 크기가 결정될 수 있다. 또한, 도 6에 도시된 바와 같이, 제1 특징 정보(F1)의 크기를 제1 영상(F_in)과 동일하게 하기 위해서는 패딩이 수행될 수 있다. 패딩은 출력되는 특징 정보(출력 데이터)의 크기가 작아지는 것을 방지하기 위하여, 제1 영상(F_in, 입력 데이터)의 가장자리에 특정 값(예를 들어, ‘0’)을 주어, 제1 영상(F_in)의 사이즈를 증가시키는 것을 의미한다. 패딩을 수행한 후, 컨볼루션 연산을 수행하면, 제1 특징 정보의 크기가 제1 영상의 크기와 동일할 수 있다. 다만, 이에 한정되지 않는다.
한편, 도 6에는 제1 서브 커널(510)에 대한 컨볼루션 연산 결과(제1 특징 정보의 제1 채널 영상(520))만 도시하였지만, 9개의 서브 커널들에 대해서, 컨볼루션 연산을 수행하는 경우, 9개의 채널 영상들을 포함하는 제1 특징 정보(F1)가 출력될 수 있다. 즉, 제1 커널(K1)에 포함되는 서브 커널들의 개수에 따라, 제1 특징 정보(F1)의 채널 수가 결정될 수 있다. 이때, 제1 특징 정보(F1)의 크기 및 채널 수는 가중치 결정부(220)에서 결정된 가중치 정보(W)의 크기 및 채널 수와 동일해야 하므로, 제1 특징 정보(F1)의 크기 및 채널 수는 가중치 결정부(220)에서 결정된 가중치 정보(W)의 크기 및 채널 수와 동일해지도록 제1 커널(K1)에 포함되는 서브 커널들의 개수(Cout)가 결정될 수 있다.
또한, 일 실시예에 따른 제1 컨볼루션 부(230)는 컨볼루션 연산이 수행된 제1 특징 정보(F1)에 활성화 함수 연산을 추가로 수행할 수 있다. 활성화 함수 연산은 제1 특징 정보에 대해 비선형(non-linear) 특성을 부여하는 것으로, 활성화 함수는, 시그모이드 함수(sigmoid function), Tanh 함수, ReLU(Rectified Linear Unit) 함수, leaky ReLu 함수 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
다시, 도 2 및 3을 참조하면, 일 실시예에 따른 가중치 적용부(240)는 제1 특징 정보(F1)에 가중치 정보(W)를 적용할 수 있다. 예를 들어, 가중치 적용부(240)는 요소별 곱(elementwise multiplication) 연산을 통해, 가중치 정보(W)를 제1 특징 정보(F1)에 적용할 수 있다. 요소별 곱 연산은 제1 특징 정보(F1)에 포함되는 값들 각각과 가중치 정보(W)에 포함되는 값들 각각을 곱할 때, 동일한 위치에 있는 값들끼리 곱하는 연산이다. 제1 특징 정보(F1)에 가중치 정보(W)가 적용됨으로써, 제2 특징 정보(F2)가 생성될 수 있다.
제2 컨볼루션 부(250)는 제2 특징 정보(F2)와 제2 커널과의 컨볼루션 연산을 수행하여, 제3 특징 정보(F_out)를 생성할 수 있다. 컨볼루션 연산을 수행하는 방법에 대해서는 도 5 및 도 6을 참조하여 자세히 설명하였으므로 구체적인 설명은 생략하기로 한다.
제2 컨볼루션 부(250)는 제2 커널을 포함하며, 제2 커널은 c개의 서브 커널들을 포함할 수 있으며, 하나의 서브 커널은 W x H x Cin의 크기를 가질 수 있다. 하나의 서브 커널의 채널수(Cin)는 제2 특징 정보(F2)의 채널 수와 동일할 수 있다. 또한, 서브 커널들의 개수(c)는 제3 특징 정보(F_out)의 채널 수와 동일할 수 있다. 제3 특징 정보(F_out)는 w x h의 크기를 가지며, 채널 수는 c일 수 있다. 또한, 제2 컨볼루션 부(250)는 컨볼루션 연산이 수행된 제3 특징 정보(F3)에 활성화 함수 연산을 추가로 수행할 수 있다.
일 실시예에 따른 제3 특징 정보(F_out)는 엣지 보존 필터 블록(200)의 다음 레이어로 입력될 수 있다. 이때, 다음 레이어는 도 1의 복수의 컨볼루션 레이어들 중 어느 하나일 수 있다. 예를 들어, 도 2의 엣지 보존 필터 블록(200)이 m번째 컨볼루션 레이어와 m+1번째 컨볼루션 레이어 사이에 위치하는 경우, 제3 특징 정보(F_out)는 m+1번째 컨볼루션 레이어로 입력될 수 있다.
한편, 도 2 및 도 3에서는, 제3 특징 정보(F_out)가 엣지 보존 필터 블록(200)의 다음 레이어로 입력되는 것으로 도시하고 설명하였지만, 이에 한정되지 않고, 제2 특징 정보(F2)가 엣지 보존 필터 블록(200)의 다음 레이어로 입력될 수 있다. 이러한 경우, 제2 특징 정보(F2)와 제2 커널의 컨볼루션 연산은 수행되지 않는다.
한편, 도 2 내지 도 6에서 도시하고 설명한 유사도 산출부(210), 가중치 결정부(220), 제1 컨볼루션 부(230), 가중치 적용부(240) 및 제2 컨볼루션 부(250) 중 적어도 하나는, 하드웨어 칩 형태로 제작되어 영상 처리 장치(100)에 탑재될 수 있다. 예를 들어, 유사도 산출부(210), 가중치 결정부(220), 제1 컨볼루션 부(230), 가중치 적용부(240) 및 제2 컨볼루션 부(250) 중 적어도 하나는, 인공 지능(AI;artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 일 실시예에 따른 영상 처리 장치(100)에 탑재될 수도 있다.
또한, 유사도 산출부(210), 가중치 결정부(220), 제1 컨볼루션 부(230), 가중치 적용부(240) 및 제2 컨볼루션 부(250) 중 적어도 하나는, 소프트웨어 모듈로 구현될 수 있다. 픽셀 샘플링부(300), 컨볼루션부(400), 및 픽셀 합성부(500) 중 적어도 하나가 소프트웨어 모듈(또는, 인스터력션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
도 7 및 도 8은 다른 실시예에 따른 하나의 엣지 보존 필터 블록을 나타내는 도면들이다.
도 7을 참조하면, 일 실시예에 따른 엣지 보존 필터 블록(200)은 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750), 제3 컨볼루션 부(760), 및 제2 가중치 적용부(770)를 포함할 수 있다.
도 7의 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750)는 도 2의 유사도 산출부(210), 가중치 결정부(220), 제1 컨볼루션 부(230), 가중치 적용부(240), 제2 컨볼루션 부(250)에 각각 대응하는 구성으로, 동일한 설명은 생략하기로 한다.
도 7 및 도 8을 참조하면, 제3 컨볼루션 부(760)는 가중치 결정부(720)에서 결정된 가중치 정보(W)와 제3 커널의 컨볼루션 연산을 수행하여, 제2 가중치 정보(W2)를 생성할 수 있다. 컨볼루션 연산을 수행하는 방법에 대해서는 도 5 및 도 6을 참조하여 자세히 설명하였으므로, 구체적인 설명은 생략하기로 한다.
제3 컨볼루션 부(760)는 제3 커널을 포함하며, 제3 커널은 복수의 서브 커널들을 포함할 수 있다. 이때, 하나의 서브 커널의 채널 수는 가중치 정보(W)의 채널 수와 동일하며, 제2 가중치 정보(W2)의 채널 수는 서브 커널들의 개수와 동일할 수 있다.
제2 가중치 적용부(770)는 제3 특징 정보(F3)에 제2 가중치 정보(W2)를 적용할 수 있다. 예를 들어, 제2 가중치 적용부(770)는 요소별 곱(elementwise multiplication) 연산을 통해, 제2 가중치 정보(W2)를 제3 특징 정보(F3)에 적용할 수 있다. 이때, 제3 특징 정보의 크기와 채널 수는 제2 가중치 정보의 크기와 채널 수와 동일할 수 있다. 제3 특징 정보(F3)에 제2 가중치 정보(W2)가 적용됨으로써, 제4 특징 정보(F_out)가 생성될 수 있으며, 제4 특징 정보(F_out)는 엣지 보존 필터 블록(200)의 다음 레이어로 입력될 수 있다. 이때, 다음 레이어는 도 1의 복수의 컨볼루션 레이어들 중 어느 하나일 수 있다. 예를 들어, 도 7의 엣지 보존 필터 블록(200)이 m번째 컨볼루션 레이어와 m+1번째 컨볼루션 레이어 사이에 위치하는 경우, 제4 특징 정보(F_out)는 m+1번째 컨볼루션 레이어로 입력될 수 있다.
또한, 도 7 및 도 8에는 도시하지 않았지만, 일 실시예에 따른 엣지 보존 필터 블록(200)은 제4 특징 정보(F_out)에 추가적인 컨볼루션 연산 및 활성화 함수 연산 등을 추가로 수행하는 제4 컨볼루션 부를 더 포함할 수 있다. 또한, 제4 컨볼루션 부에서 컨볼루션 연산 및 활성화 함수 연산 등으로 생성된 특징 정보가 엣지 보존 필터 블록(200)의 다음 레이어로 입력될 수 있다.
또한, 도 7 및 도 8에서 도시하고 설명한 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750), 제3 컨볼루션 부(760), 및 제2 가중치 적용부(770) 중 적어도 하나는, 하드웨어 칩 형태로 제작되어 일 실시예에 따른 영상 처리 장치에 탑재될 수 있다. 예를 들어, 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750), 제3 컨볼루션 부(760), 및 제2 가중치 적용부(770) 중 적어도 하나는, 인공 지능(AI;artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 일 실시예에 따른 영상 처리 장치(100)에 탑재될 수도 있다.
또한, 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750), 제3 컨볼루션 부(760), 및 제2 가중치 적용부(770) 중 적어도 하나는, 소프트웨어 모듈로 구현될 수 있다. 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750), 제3 컨볼루션 부(760), 및 제2 가중치 적용부(770) 중 적어도 하나가 소프트웨어 모듈(또는, 인스터력션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
한편, 도 2내지 도 8에서 설명한 엣지 보존 필터 블록(200)의 블록도는 일 실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 엣지 보존 필터 블록(200)을 포함하는 영상 처리 장치(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 실시예들을 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
도 9는 일 실시예에 따른 영상 처리 장치의 동작방법을 나타내는 흐름도이다.
도 9를 참조하면, 일 실시예에 따른 영상 처리 장치(100)는 제1 영상에 포함되는 픽셀들 각각과 픽셀들 각각의 주변 픽셀들과의 차이에 기초하여, 유사도 정보를 획득할 수 있다(S910).
일 실시예에 따른 영상 처리 장치(100)는 제1 영상에 포함되는 픽셀들 각각과 픽셀들 각각의 주변 픽셀들과의 차이를 나타내는 차이 정보(D1)를 생성할 수 있다. 예를 들어, 영상 처리 장치(100)는 제1 영상에 포함되는 복수의 픽셀들 중 제1 픽셀(기준 픽셀)을 기준으로 제1 픽셀의 주변에 위치한 8개의 픽셀들과 제1 픽셀(기준 픽셀)을 포함하는 9개의 픽셀들 각각과, 제1 픽셀(기준 픽셀)과의 차이 값을 계산할 수 있다.
영상 처리 장치(100)는 계산된 차이 값들을 이용하여, 차이 정보(D1)를 생성할 수 있다. 영상 처리 장치(100)는 제1 픽셀(기준 픽셀)에 대해서 9개의 차이 값을 획득할 수 있으며, 9개의 차이 값들 각각은, 차이 정보(D1)에 포함되는 채널 영상들 각각에서, 제 1 픽셀에 대응하는 픽셀의 픽셀 값으로 결정될 수 있다. 이때, 기준 픽셀에 대한 주변 픽셀들을 결정하는 기준에 따라, 주변 픽셀들의 개수가 결정되며, 주변 픽셀들의 개수에 따라, 차이 정보(D1)의 채널 수(채널 영상들의 개수)가 결정될 수 있다.
일 실시예에 따른 차이 정보(D1)를 생성하는 방법은 도 3 및 도 4를 참조하여 자세히 설명하였으므로, 구체적인 설명은 생략하기로 한다.
영상 처리 장치(100)는 차이 정보(D1)가 생성되면, 차이 정보(D1)에 포함되는 값들 각각에 소정의 연산을 수행함으로써, 유사도 정보(D2)를 생성할 수 있다. 일 실시예에 따른 유사도 정보(D2)는 기준 픽셀과 주변 픽셀이 유사한 정도를 나타내는 값을 포함할 수 있다.
예를 들어, 영상 처리 장치(100)는 차이 정보(D1)에 포함되는 값들 각각을 제곱하고, 제곱한 값에 -1을 곱하여, 유사도 정보(D2)를 생성할 수 있다. 이에 따라, 유사도 정보(D2)가 음의 방향으로 큰 값을 가지는 경우, 기준 픽셀과 주변 픽셀의 차이가 크다는 것을 의미하며, 유사도 정보가 음의 방향으로 작은 값을 가지는 경우, 기준 픽셀과 주변 픽셀이 유사하다는 것을 의미할 수 있다. 다만, 이에 한정되지 않으며, 차이 정보(D1)에 다양한 연산을 수행함으로써, 유사도 정보를 생성할 수 있다.
일 실시예에 따른 영상 처리 장치(100)는 유사도 정보(D2)에 기초하여, 가중치 정보(W)를 결정할 수 있다(S920).
영상 처리 장치(100)는 기준 픽셀과 주변 픽셀의 차이가 작을수록 가중치 값을 크게 하고, 기준 픽셀과 주변 픽셀의 차이가 클수록 가중치 값이 작아지도록 가중치 정보를 결정할 수 있다. 예를 들어, 영상 처리 장치(100)는 유사도 정보(D2)에 포함되는 값들이 음의 방향으로 클수록, 가중치 값이 0에 가까워지고, 유사도 정보(D2)에 포함되는 값들의 크기가 음의 방향으로 작을수록 가중치 값이 1에 가까워지도록 가중치 값들을 결정할 수 있다. 이때, 영상 처리 장치(100)는 유사도 정보(D2)에 포함되는 값들에 자연 지수 함수 또는 소프트 맥스 함수를 적용함으로써, 가중치 값들을 결정할 수 있으며, 자연 지수 함수를 적용하는 경우는 전술한 수학식 1로 나타낼 수 있으며, 소프트 맥스 함수를 적용하는 경우는, 전술한 수학식 2로 나타낼 수 있다.
다시 도 9를 참조하면, 일 실시예에 따른 영상 처리 장치(100)는 제1 영상과 제1 커널)과의 컨볼루션 연산을 수행하여, 제1 특징 정보를 획득할 수 있다(S930). 또한, 영상 처리 장치(100)는 제1 특징 정보에 활성화 함수 연산 등을 추가로 수행할 수 있다.
일 실시예에 따른 영상 처리 장치(100)는 제1 특징 정보에 가중치 정보(W)를 적용함으로써, 제2 특징 정보를 획득할 수 있다(S940). 예를 들어, 영상 처리 장치(100)는 제1 특징 정보와 가중치 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 제2 특징 정보를 생성할 수 있다.
일 실시예에 따른 영상 처리 장치(100)는 제2 특징 정보에 기초하여, 제2 영상을 생성할 수 있다(S950). 제2 특징 정보는, 엣지 보존 필터 블록의 다음에 위치하는 컨볼루션 레이어들을 통과할 수 있으며, 컨볼루션 레이어들을 통과하면서, 컨볼루션 레이어들 각각에서, 컨볼루션 연산, 활성화 함수 연산 등이 수행될 수 있다. 이에 따라, 제2 영상이 생성될 수 있다.
또는, 영상 처리 장치(100)는 제2 특징 정보와 제2 커널과의 컨볼루션 연산을 수행하여, 제3 특징 정보를 획득하고, 제3 특징 정보는, 엣지 보존 필터 블록의 다음에 위치하는 컨볼루션 레이어들을 통과할 수 있으며, 이에 따라, 제2 영상이 생성될 수 있다.
또는, 영상 처리 장치(100)는 가중치 정보(W)와 제3 커널과의 컨볼루션 연산을 수행하여, 제2 가중치 정보(W2)를 생성하고, 제3 특징 정보와 제2 가중치 정보의 요소별 곱(elementwise multiplication) 연산을 통해, 제4 특징 정보를 생성할 수 있다. 제4 특징 정보는, 엣지 보존 필터 블록의 다음에 위치하는 컨볼루션 레이어들을 통과할 수 있으며, 이에 따라, 제2 영상이 생성될 수 있다.
도 10은 일 실시예에 따른 영상 처리 장치의 구성을 나타내는 블록도이다.
도 10을 참조하면, 일 실시예에 따른 영상 처리 장치(100)는 프로세서(120) 및 메모리(130)를 포함할 수 있다.
일 실시예에 따른 프로세서(120)는 영상 처리 장치(100)를 전반적으로 제어할 수 있다. 일 실시예에 따른 프로세서(120)는 메모리(130)에 저장되는 하나 이상의 프로그램들을 실행할 수 있다.
일 실시예에 따른 메모리(130)는 영상 처리 장치(100)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다. 메모리(130)에 저장되는 프로그램은 하나 이상의 인스트럭션들을 포함할 수 있다. 메모리(130)에 저장된 프로그램(하나 이상의 인스트럭션들) 또는 어플리케이션은 프로세서(120)에 의해 실행될 수 있다.
일 실시예에 따른 프로세서(120)는 CPU(Cetral Processing Unit), GPU (Graphic Processing Unit) 및 VPU(Video Processing Unit) 중 적어도 하나를 포함할 수 있다. 또는, 실시예에 따라, CPU, GPU 및 VPU 중 적어도 하나를 통합한 SoC(System On Chip) 형태로 구현될 수 있다. 또는, 프로세서(120)는 NPU(Neural Processing Unit)를 더 포함할 수 있다.
일 실시예에 따른 프로세서(120)는 하나 이상의 영상 처리 네트워크를 이용하여, 입력 영상의 노이즈를 제거하면서, 세밀한 가장자리 처리와 텍스쳐를 유지하는 디노이징을 수행한 출력 영상을 생성할 수 있다. 일 실시예에 따른 영상 처리 네트워크(30)는, 적어도 하나의 엣지 보존 필터 블록과 하나 이상의 컨볼루션 레이어들을 포함할 수 있다.
예를 들어, 프로세서(120)는 도 2 내지 도 6에서 도시하고 설명한 유사도 산출부(210), 가중치 결정부(220), 제1 컨볼루션 부(230), 가중치 적용부(240) 및 제2 컨볼루션 부(250)의 동작들 중 적어도 하나를 수행할 수 있으며, 도 7 및 도 8에서 도시하고 설명한 유사도 산출부(710), 가중치 결정부(720), 제1 컨볼루션 부(730), 제1 가중치 적용부(740), 제2 컨볼루션 부(750), 제3 컨볼루션 부(760), 및 제2 가중치 적용부(770)의 동작들 중 적어도 하나를 수행할 수 있다.
프로세서(120)는 제1 영상에 포함되는 픽셀들 각각과 픽셀들 각각의 주변 픽셀들과의 차이를 나타내는 차이 정보를 생성할 수 있다. 프로세서(120)는 차이 정보가 생성되면, 차이 정보에 포함되는 값들 각각에 소정의 연산을 수행함으로써, 유사도 정보를 생성할 수 있다. 일 실시예에 따른 유사도 정보는 기준 픽셀과 주변 픽셀이 유사한 정도를 나타내는 값을 포함할 수 있다.
프로세서(120)는 유사도 정보에 기초하여, 가중치 정보(W)를 결정할 수 있다. 영상 처리 장치(100)는 기준 픽셀과 주변 픽셀의 차이가 작을수록 가중치 값을 크게 하고, 기준 픽셀과 주변 픽셀의 차이가 클수록 가중치 값이 작아지도록 가중치 정보를 결정할 수 있다.
프로세서(120)는 제1 영상과 제1 커널과의 컨볼루션 연산을 수행하여, 제1 특징 정보를 획득할 수 있다. 프로세서(120)는 제1 특징 정보에 가중치 정보(W)를 적용함으로써, 제2 특징 정보를 획득할 수 있다.
프로세서(120)는 제2 특징 정보에 기초하여, 제2 영상을 생성할 수 있다. 예를 들어, 제2 특징 정보는, 영상 처리 네트워크(30)에 포함된 엣지 보존 필터 블록의 다음에 위치하는 컨볼루션 레이어들을 통과할 수 있다. 프로세서(120)는 컨볼루션 레이어들 각각에서, 컨볼루션 연산, 활성화 함수 연산 등을 수행할 수 있으며, 이에 따라, 제2 영상을 생성할 수 있다.
또는, 프로세서(120)는 제2 특징 정보와 제2 커널과의 컨볼루션 연산을 수행하여, 제3 특징 정보를 획득하고, 제3 특징 정보는, 영상 처리 네트워크(30)에 포함된 엣지 보존 필터 블록의 다음에 위치하는 컨볼루션 레이어들을 통과할 수 있으며, 이에 따라, 제2 영상이 생성될 수 있다.
또는, 프로세서(120)는 가중치 정보 정보와 제3 커널과의 컨볼루션 연산을 수행하여, 제2 가중치 정보(W2)를 생성하고, 제3 특징 정보와 제2 가중치 정보의 요소별 곱(elementwise multiplication) 연산을 통해, 제4 특징 정보를 생성할 수 있다. 제4 특징 정보는, 엣지 보존 필터 블록의 다음에 위치하는 컨볼루션 레이어들을 통과할 수 있으며, 이에 따라, 제2 영상이 생성될 수 있다.
한편, 일 실시예에 따른 영상 처리 네트워크(30)는, 서버 또는 외부 장치에 의해 훈련된 네트워크일 수 있다. 외부 장치는 훈련 데이터에 기초하여, 영상 처리 네트워크(30)를 학습시킬 수 있다. 이때, 훈련 데이터는 노이즈가 포함된 영상 데이터와 노이즈는 제거되면서, 엣지 특성이나 텍스쳐 특성은 보존되는 영상 데이터를 포함하는 복수의 데이터 세트들을 포함할 수 있다.
서버 또는 외부 장치는 영상 처리 네트워크(30)에 포함된 복수의 컨볼루션 레이어들 각각에서 이용되는 커널들 및 엣지 보존 필터 블록에 포함되는 커널들(예를 들어, 제1 커널, 제2 커널 및 제3 커널)에 포함되는 파라미터 값들을 결정할 수 있다. 예를 들어, 서버 또는 외부 장치는 영상 처리 네트워크(30)에 의해 생성된 영상 데이터와 훈련 데이터로써의 노이즈는 제거되면서, 엣지 특성이나 텍스쳐 특성은 보존되는 영상 데이터의 차이(손실 정보)를 최소화하는 방향으로 파라미터 값들을 결정할 수 있다.
일 실시예에 따른 영상 처리 장치(100)는 서버 또는 외부 장치로부터 훈련이 완료된 영상 처리 네트워크(30)를 수신하여, 메모리(130)에 저장할 수 있다. 예를 들어, 메모리(130)는 일 실시예에 따른 영상 처리 네트워크(30)의 구조 및 파라미터 값들을 저장할 수 있으며, 프로세서(120)는 메모리(130)에 저장된 파라미터 값들을 이용하여, 일 실시예에 따른 제1 영상으로부터 노이즈는 제거되면서, 엣지 특성이나 텍스쳐 특성은 보존되는 제2 영상을 생성할 수 있다.
한편, 도 10에 도시된 영상 처리 장치(100)의 블록도는 일 실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 영상 처리 장치(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 실시예들을 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
일 실시예에 따른 영상 처리 장치의 동작방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
또한, 개시된 실시예들에 따른 영상 처리 장치 및 영상 처리 장치의 동작방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다.
컴퓨터 프로그램 제품은 S/W 프로그램, S/W 프로그램이 저장된 컴퓨터로 읽을 수 있는 저장 매체를 포함할 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 전자 장치의 제조사 또는 전자 마켓(예, 구글 플레이 스토어, 앱 스토어)을 통해 전자적으로 배포되는 S/W 프로그램 형태의 상품(예, 다운로더블 앱)을 포함할 수 있다. 전자적 배포를 위하여, S/W 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사의 서버, 전자 마켓의 서버, 또는 SW 프로그램을 임시적으로 저장하는 중계 서버의 저장매체가 될 수 있다.
컴퓨터 프로그램 제품은, 서버 및 클라이언트 장치로 구성되는 시스템에서, 서버의 저장매체 또는 클라이언트 장치의 저장매체를 포함할 수 있다. 또는, 서버 또는 클라이언트 장치와 통신 연결되는 제3 장치(예, 스마트폰)가 존재하는 경우, 컴퓨터 프로그램 제품은 제3 장치의 저장매체를 포함할 수 있다. 또는, 컴퓨터 프로그램 제품은 서버로부터 클라이언트 장치 또는 제3 장치로 전송되거나, 제3 장치로부터 클라이언트 장치로 전송되는 S/W 프로그램 자체를 포함할 수 있다.
이 경우, 서버, 클라이언트 장치 및 제3 장치 중 하나가 컴퓨터 프로그램 제품을 실행하여 개시된 실시예들에 따른 방법을 수행할 수 있다. 또는, 서버, 클라이언트 장치 및 제3 장치 중 둘 이상이 컴퓨터 프로그램 제품을 실행하여 개시된 실시예들에 따른 방법을 분산하여 실시할 수 있다.
예를 들면, 서버(예로, 클라우드 서버 또는 인공 지능 서버 등)가 서버에 저장된 컴퓨터 프로그램 제품을 실행하여, 서버와 통신 연결된 클라이언트 장치가 개시된 실시예들에 따른 방법을 수행하도록 제어할 수 있다.
이상에서 실시예들에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속한다.

Claims (19)

  1. 영상 처리 장치에 있어서,
    하나 이상의 인스트럭션들을 저장하는 메모리; 및
    상기 메모리에 저장된 상기 하나 이상의 인스트럭션들을 실행하는 프로세서를 포함하고,
    상기 프로세서는,
    제1 영상에 포함되는 픽셀들 각각과 상기 픽셀들 각각의 주변 픽셀과의 차이에 기초하여, 유사도 정보를 획득하고,
    상기 유사도 정보에 기초하여, 가중치 정보를 결정하며,
    상기 제1 영상과 제1 커널과의 컨볼루션 연산을 통해, 제1 특징 정보를 획득하고,
    상기 가중치 정보를 상기 제1 특징 정보에 적용함으로써, 제2 특징 정보를 획득하고,
    상기 제2 특징 정보에 기초하여, 제2 영상을 생성하는, 영상 처리 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 영상에 포함되는 픽셀들 각각과, 상기 픽셀들 각각에 대해 제1 상대적 위치를 가지는 제1 주변 픽셀과의 차이에 기초하여, 제1 유사도 정보를 획득하고,
    상기 제1 영상에 포함되는 픽셀들 각각과, 상기 픽셀들 각각에 대해 제2 상대적 위치를 가지는 제2 주변 픽셀과의 차이에 기초하여, 제2 유사도 정보를 획득하는, 영상 처리 장치.
  3. 제1항에 있어서,
    상기 프로세서는,
    상기 유사도 정보에 자연 지수 함수 또는 소프트 맥스 함수를 적용하여, 상기 가중치 정보를 산출하는, 영상 처리 장치.
  4. 제1항에 있어서,
    상기 제1 커널의 채널 개수는,
    상기 가중치 정보의 채널 개수와 상기 제1 특징 정보의 채널 개수가 동일해지도록 결정되는, 영상 처리 장치.
  5. 제1항에 있어서,
    상기 프로세서는,
    상기 가중치 정보와 상기 제1 특징 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 상기 제2 특징 정보를 획득하는, 영상 처리 장치.
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 제2 특징 정보와 제2 커널과의 컨볼루션 연산을 통해, 제3 특징 정보를 획득하며,
    상기 제3 특징 정보에 기초하여, 상기 제2 영상을 생성하는, 영상 처리 장치.
  7. 제1항에 있어서,
    상기 프로세서는,
    상기 가중치 정보와 제3 커널과의 컨볼루션 연산을 통해, 제2 가중치 정보를 획득하고,
    상기 제2 가중치 정보를 상기 제2 특징 정보에 적용함으로써, 제4 특징 정보를 획득하고,
    상기 제4 특징 정보에 기초하여, 상기 제2 영상을 생성하는, 영상 처리 장치.
  8. 제7항에 있어서,
    상기 프로세서는,
    상기 제2 특징 정보와 상기 제2 가중치 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 상기 제4 특징 정보를 획득하는, 영상 처리 장치.
  9. 제1항에 있어서,
    상기 프로세서는, 복수의 레이어들을 포함하는 뉴럴 네트워크를 이용하여, 상기 제1 영상을 처리함으로써, 상기 제2 영상을 생성하고,
    상기 제1 영상은 상기 복수의 레이어들 중 n번째 레이어로 입력되고,
    상기 제2 특징 정보는 상기 복수의 레이어들 중 n+1번째 레이어로 입력되는, 영상 처리 장치.
  10. 영상 처리 장치의 동작방법에 있어서,
    제1 영상에 포함되는 픽셀들 각각과 상기 픽셀들 각각의 주변 픽셀과의 차이에 기초하여, 유사도 정보를 획득하는 단계;
    상기 유사도 정보에 기초하여, 가중치 정보를 결정하는 단계;
    상기 제1 영상과 제1 커널과의 컨볼루션 연산을 통해, 제1 특징 정보를 획득하는 단계;
    상기 가중치 정보를 상기 제1 특징 정보에 적용함으로써, 제2 특징 정보를 획득하는 단계; 및
    상기 제2 특징 정보에 기초하여, 제2 영상을 생성하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  11. 제10항에 있어서,
    상기 유사도 정보를 획득하는 단계는,
    상기 제1 영상에 포함되는 픽셀들 각각과, 상기 픽셀들 각각에 대해 제1 상대적 위치를 가지는 제1 주변 픽셀과의 차이에 기초하여, 제1 유사도 정보를 획득하는 단계; 및
    상기 제1 영상에 포함되는 픽셀들 각각과, 상기 픽셀들 각각에 대해 제2 상대적 위치를 가지는 제2 주변 픽셀과의 차이에 기초하여, 제2 유사도 정보를 획득하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  12. 제10항에 있어서,
    상기 가중치 정보를 결정하는 단계는,
    상기 유사도 정보에 자연 지수 함수 또는 소프트 맥스 함수를 적용하여, 상기 가중치 정보를 산출하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  13. 제10항에 있어서,
    상기 제1 커널의 채널 개수는,
    상기 가중치 정보의 채널 개수와 상기 제1 특징 정보의 채널 개수가 동일해지도록 결정되는, 영상 처리 장치의 동작방법.
  14. 제10항에 있어서,
    상기 제2 특징 정보를 획득하는 단계는,
    상기 가중치 정보와 상기 제1 특징 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 상기 제2 특징 정보를 획득하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  15. 제10항에 있어서,
    상기 제2 영상을 생성하는 단계는,
    상기 제2 특징 정보와 제2 커널과의 컨볼루션 연산을 통해, 제3 특징 정보를 획득하는 단계; 및
    상기 제3 특징 정보에 기초하여, 상기 제2 영상을 생성하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  16. 제10항에 있어서,
    상기 제2 영상을 생성하는 단계는,
    상기 가중치 정보와 제3 커널과의 컨볼루션 연산을 통해, 제2 가중치 정보를 획득하는 단계;
    상기 제2 가중치 정보를 상기 제2 특징 정보에 적용함으로써, 제4 특징 정보를 획득하는 단계; 및
    상기 제4 특징 정보에 기초하여, 상기 제2 영상을 생성하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  17. 제16항에 있어서,
    상기 제4 특징 정보를 획득하는 단계는,
    상기 제2 특징 정보와 상기 제2 가중치 정보의 요소별 곱(elementwise multiplication) 연산을 수행하여, 상기 제4 특징 정보를 획득하는 단계를 포함하는, 영상 처리 장치의 동작방법.
  18. 제10항에 있어서,
    상기 동작방법은,
    뉴럴 네트워크에 포함되는 복수의 레이어들 중 n번째 레이어에서, 상기 제1 영상을 수신하는 단계; 및
    상기 제2 특징 정보를 상기 복수의 레이어들 중 n+1번째 레이어로 출력하는 단계를 더 포함하는, 영상 처리 장치의 동작방법.
  19. 제10항의 방법을 수행하도록 하는 프로그램이 저장된 하나 이상의 컴퓨터로 읽을 수 있는 기록매체.
KR1020200120632A 2020-09-18 2020-09-18 영상 처리 장치 및 그 동작방법 KR20220037764A (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020200120632A KR20220037764A (ko) 2020-09-18 2020-09-18 영상 처리 장치 및 그 동작방법
EP21869623.5A EP4187482A4 (en) 2020-09-18 2021-09-08 IMAGE PROCESSING DEVICE AND ITS OPERATING METHOD
CN202180064086.2A CN116210022A (zh) 2020-09-18 2021-09-08 图像处理设备及其操作方法
PCT/KR2021/012234 WO2022060001A1 (ko) 2020-09-18 2021-09-08 영상 처리 장치 및 그 동작방법
US18/120,832 US20230214971A1 (en) 2020-09-18 2023-03-13 Image processing device and operating method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200120632A KR20220037764A (ko) 2020-09-18 2020-09-18 영상 처리 장치 및 그 동작방법

Publications (1)

Publication Number Publication Date
KR20220037764A true KR20220037764A (ko) 2022-03-25

Family

ID=80777051

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200120632A KR20220037764A (ko) 2020-09-18 2020-09-18 영상 처리 장치 및 그 동작방법

Country Status (5)

Country Link
US (1) US20230214971A1 (ko)
EP (1) EP4187482A4 (ko)
KR (1) KR20220037764A (ko)
CN (1) CN116210022A (ko)
WO (1) WO2022060001A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024210329A1 (ko) * 2023-04-05 2024-10-10 삼성전자 주식회사 영상 처리 방법 및 이를 수행하는 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102420104B1 (ko) * 2019-05-16 2022-07-12 삼성전자주식회사 영상 처리 장치 및 그 동작방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101225056B1 (ko) * 2006-01-27 2013-01-23 삼성전자주식회사 이미지 센서 노이즈 저감 장치 및 방법
KR101776501B1 (ko) * 2016-05-23 2017-09-19 숭실대학교산학협력단 비국부 평균 알고리즘을 이용한 영상 잡음 제거 장치 및 방법
KR101785857B1 (ko) * 2016-07-26 2017-11-15 연세대학교 산학협력단 단일 영상 기반의 외각 시점 합성 방법 및 영상 처리 장치
US10558750B2 (en) * 2016-11-18 2020-02-11 Salesforce.Com, Inc. Spatial attention model for image captioning
KR20200067631A (ko) * 2018-12-04 2020-06-12 삼성전자주식회사 영상 처리 장치 및 그 동작방법
US10957027B2 (en) * 2019-03-26 2021-03-23 Intel Corporation Virtual view interpolation between camera views for immersive visual experience

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024210329A1 (ko) * 2023-04-05 2024-10-10 삼성전자 주식회사 영상 처리 방법 및 이를 수행하는 장치

Also Published As

Publication number Publication date
WO2022060001A1 (ko) 2022-03-24
EP4187482A4 (en) 2024-03-20
US20230214971A1 (en) 2023-07-06
EP4187482A1 (en) 2023-05-31
CN116210022A (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
US10740865B2 (en) Image processing apparatus and method using multi-channel feature map
US20230214971A1 (en) Image processing device and operating method therefor
KR20200067631A (ko) 영상 처리 장치 및 그 동작방법
US11954755B2 (en) Image processing device and operation method thereof
KR102420104B1 (ko) 영상 처리 장치 및 그 동작방법
US11961207B2 (en) Image processing apparatus performing a deconvolution operation and operation method thereof
US11875257B2 (en) Normalization method for machine-learning and apparatus thereof
US12086953B2 (en) Image processing device and operating method thereof
US20230069072A1 (en) Image processing apparatus and operation method thereof
KR102266903B1 (ko) 영상 처리 장치 및 그 동작방법
KR20220125124A (ko) 영상 처리 장치 및 그 동작방법
US20230071417A1 (en) Image processing device and operation method thereof
EP4276744A1 (en) Image processing apparatus and operating method therefor
KR20230034127A (ko) 영상 처리 장치 및 그 동작 방법
US20220284555A1 (en) Image processing apparatus and operation method thereof
US20230169752A1 (en) Image processing apparatus and operating method thereof
US20230169748A1 (en) Image processing apparatus and operating method thereof
KR20220125127A (ko) 영상 처리 장치 및 그 동작방법
US20210182678A1 (en) Data processing system and data processing method
KR20210141304A (ko) 영상 처리 장치 및 그 동작방법
KR20220125126A (ko) 영상 처리 장치 및 그 동작 방법
US20240095883A1 (en) Image processing device, electronic device having the same, and operating method thereof
KR20240149304A (ko) 영상 처리 방법 및 이를 수행하는 장치
KR20230081587A (ko) 영상 처리 장치 및 그 동작 방법
CN116997914A (zh) 图像处理装置及其操作方法