KR20210044648A - 영상 처리 장치 및 이를 포함하는 광학 기기 - Google Patents

영상 처리 장치 및 이를 포함하는 광학 기기 Download PDF

Info

Publication number
KR20210044648A
KR20210044648A KR1020190128083A KR20190128083A KR20210044648A KR 20210044648 A KR20210044648 A KR 20210044648A KR 1020190128083 A KR1020190128083 A KR 1020190128083A KR 20190128083 A KR20190128083 A KR 20190128083A KR 20210044648 A KR20210044648 A KR 20210044648A
Authority
KR
South Korea
Prior art keywords
processor
image
information
bayer pattern
pattern information
Prior art date
Application number
KR1020190128083A
Other languages
English (en)
Inventor
김진옥
Original Assignee
엘지이노텍 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지이노텍 주식회사 filed Critical 엘지이노텍 주식회사
Priority to KR1020190128083A priority Critical patent/KR20210044648A/ko
Publication of KR20210044648A publication Critical patent/KR20210044648A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4015Image demosaicing, e.g. colour filter arrays [CFA] or Bayer patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • H04N23/84Camera processing pipelines; Components thereof for processing colour signals
    • H04N23/843Demosaicing, e.g. interpolating colour pixel values
    • H04N9/04515
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

일 실시예에 따른 영상 처리 장치는 광을 수신하여 제1해상도를 가지는 제1베이어 패턴(Bayer Pattern) 정보를 생성하는 이미지 센서 및 상기 이미지 센서로부터 수신한 제1베이어 패턴 정보를 기초로 상기 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보 및 라벨(Label) 정보를 생성하는 프로세서를 포함할 수 있다.

Description

영상 처리 장치 및 이를 포함하는 광학 기기{Image processing apparatus and optical apparatus including the same}
본 발명은 영상 처리 장치 및 이를 포함하는 광학 기기에 관한 발명으로서, 보다 구체적으로는 영상 처리 장치에 포함되어 있는 별도의 프로세서를 이용하여 선 영상처리를 수행하는 기술에 관할 발명이다.
기술이 발전함에 따라 카메라 장치의 소형화가 가능해지자, 소형 카메라 장치는 스마트폰을 비롯한 휴대폰이나 PDA 등 다양한 IT 기기에 적용되어 사용되고 있다. 이러한 카메라 장치는 CCD나 CMOS 등의 이미지 센서를 주요 부품으로 제작되고 있으며, 화상의 크기를 조절하기 위하여 초점 조정이 가능하도록 제조되고 있다.
이러한 카메라 장치는 복수의 렌즈와 액추에이터(Actuator)를 포함하여 구성이 되며, 액추에이터가 각각의 렌즈를 이동시켜 그 상대적인 거리를 변화시킴으로써 광학적인 초점 거리가 조절되는 방식으로 대상체에 대한 물체를 촬영할 수 있다.
구체적으로 카메라 장치는 외부에선 수신한 광 신호를 전기 신호로 변환하는 이미지 센서와 이미지 센서로 광을 집광시키는 렌즈와 IR(Infrared) 필터, 이들을 내부에 포함하는 하우징 및 이미지 센서의 신호를 처리하는 인쇄회로기판을 등을 포함하고 있으며, 액추에이터는 VCM(Voice Coil Motor) 액추에이터 또는 MEMS(Micro Electromechanical Systems) 액추에이터 등의 액추에이터에 의해 렌즈의 초점 거리가 조절된다.
한편, 기술이 발전에 의해 해상도가 높은 이미지의 구현이 가능해짐에 따라, 멀리 있는 대상체를 촬영한 이미지를 고해상도로 구현할 수 있는 기술에 대한 요구 또한 늘어나고 있다.
일반적으로 카메라는 멀리 있는 대상체를 촬영하기 위해 줌(Zoom) 기능이 탑재되어 있는데, 줌 기능은 크게 카메라 내부의 실제 렌즈가 이동하여 대상체를 확대하는 광학줌과, 대상체를 촬영한 화상 데이터의 일부 화면을 디지털 처리 방식으로 확대 표시하여 줌 효과를 얻는 디지털 줌 방식으로 나뉘어진다.
렌즈의 이동을 이용하여 대상체에 대한 이미지를 얻는 광학 줌의 경우 비교적 높은 해상도를 가지는 이미지를 획득할 수 있으나, 이는 카메라 내부의 구조가 복잡해지고 부품 추가로 인해 비용이 증가하는 문제가 존재한다. 또한, 광학 줌을 이용하여 대상체를 확대할 수 있는 영역은 한계가 있어서, 이러한 부분에 대해서는 소프트웨어로 보정을 하는 기술 등이 개발되고 있다.
이러한 방법 이 외에도, 보이스 코일 모터(VCM, Voice Coil Motor) 또는 MEMS(Micro-Electro Mechanical Systems) 기술로 센서를 흔드는 센서 시프트(Shift) 기술, 렌즈를 VCM 등으로 흔들어서 픽셀 정보를 얻는 OIS(Optical Image Stabilizer) 기술, 센서와 렌즈 사이의 필터(Filter)를 흔드는 기술 등 카메라 내부의 부품을 움직이는 방식으로 픽셀 정보를 더 많이 생성하여 고해상도 이미지를 구현하는 기술들이 존재한다.
그러나 이러한 기술들의 단점은 여러 시차의 데이터를 합성하기 때문에 움직이는 물체를 촬영한 경우, 모션 블러(Motion Blur)나, 아티팩트(Artifact)와 같은 현상들이 발생할 수 있어 이로 인해 이미지의 화질을 저하시키는 문제가 발생할 수 있다.
반면, TV에서 일반적으로 사용되고 있는 소프트웨어 알고리즘을 이용한 고해상도 구현 기술은 싱글 프레임 SR (Single-Frame Super Resolution) 또는 멀티 프레임 SR(Multi-frame Super Resolution) 기술 등이 존재한다.
이러한 기술의 경우 아티팩트(Artifact) 문제는 발생하지는 않지만, 모바일, 차량, IoT 등 소형 카메라 장치가 적용될 수 있는 장치에는 적용하기 어려운 알고리즘이며, 또한 이러한 기술을 구현하기 위해서는 별도의 이미지 프로세서가 필요하다.
그러나 이러한 합성 알고리즘을 수행을 하기 위한 소프트웨어는 일반적으로 처리해야 하는 데이터의 양이 많기 때문에 AP(Application Processor)에서도 실시간으로 처리하기 어려운 문제점이 존재하였으며, 설사 AP가 이러한 기능을 수행할 수 있었어도 이러한 AP는 가격이 비싸 제조 단가가 증가하는 문제점이 존재하였다.
따라서, 본 발명은 전술한 바와 같이 종래 기술이 가지고 있던 문제점을 해결하기 위해 고안된 발명으로서, AP에서 처리하는 영상 처리의 적어도 일부분을 영상 처리 장치 내부에 독립적으로 존재하의 별도의 프로세서를 이용하여 전처리를 수행함으로써, 고가의 AP를 탑재하지 않아도 동일한 기능을 수행할 수 있는 영상 처리 장치 및 이를 포함하는 광학 기기를 제공하기 위함이다.
또한, AP에서 영상 처리를 하기 전에 이미지 센서로부터 수신한 베이어 패턴에 대한 정보를 기초로 외부로 출력해야 하는 영상에 대한 전처리를 수행함으로써, AP가 처리해야 하는 영상처리에 대한 부담을 줄일 수 있는 영상 처리 장치 및 이를 포함하는 광학 기기를 제공하기 위함이다.
일 실시예에 따른 영상 처리 장치는 광을 수신하여 제1해상도를 가지는 제1베이어 패턴(Bayer Pattern) 정보를 생성하는 이미지 센서 및 상기 이미지 센서로부터 수신한 제1베이어 패턴 정보를 기초로 상기 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보 및 라벨(Label) 정보를 생성하는 프로세서를 포함할 수 있다.
상기 프로세서는 제1프로세서와 제2프로세서를 포함하고, 상기 제1프로세서는 상기 제2베이어 패턴 정보를 생성하고, 상기 제2프로세서는 라벨 정보를 생성할 수 있다.
상기 프로세서는 상기 라벨 정보를 기초로 피드백(Feedback)을 수행한 후 이를 기초로 상기 제2베이어 패턴 정보를 생성할 수 있다.
상기 프로세서는 딥 러닝(Deep-Learning)을 수행하여 획득된 알고리즘에 기초해 상기 제2 베이어 패턴 정보 및 상기 라벨 정보를 생성할 수 있다.
상기 제1프로세서와 제2프로세서는, 딥 러닝(Deep-Learning)을 수행하여 획득된 서로 다른 알고리즘에 기초해 상기 제2베이어 패턴 정보, 상기 라벨 정보를 각각 생성할 수 있다.
다른 실시예에 따른 광학 기기는 광을 수신하여 제1해상도를 가지는 제1베이어 패턴(Bayer Pattern) 정보를 생성하는 이미지 센서, 상기 이미지 센서로부터 수신한 제1베이어 패턴 정보를 기초로 상기 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보 및 라벨(Label) 정보를 생성하는 프로세서 및 상기 프로세서로부터 출력되는 상기 제2 베이어 패턴 정보 또는 상기 라벨 정보를 수신하는 AP(Application Processor)를 포함할 수 있다.
상기 프로세서는 제1프로세서와 제2프로세서를 포함하고, 상기 제1프로세서는 상기 제2베이어 패턴 정보를 생성하고, 상기 제2프로세서는 상기 라벨 정보를 생성할 수 있다.
일 실시예에 따른 영상 처리 장치 및 이를 포함하는 광학 기기는 AP에서 처리하는 영상 처리의 일부분을 영상 처리 장치에 탑재되어 있는 별도의 프로세서를 이용하여 수행함으로써, 고가의 AP를 장착하지 않아도 효율적으로 영상처리를 할 수 있는바 비교적 경제적으로 영상 처리 장치 및 이를 포함하는 광학 기기를 제조할 수 있는 효과가 존재한다.
또한, 전처리를 수행하는 프로세서는 딥러닝 과정을 통해 최적으로 영상 처리를 수행할 수 있는 알고리즘을 이용하여 AP가 수행하는 일부 기능을 대신 수행할 수 있으므로, AP가 실시간으로 처리해야 하는 데이터의 양을 줄일 수 있고 이에 따라, AP의 소비전력을 낮추고, AP를 원활하게 작동시킬 수 있는 효과가 존재한다.
또한, AP가 보케(Bokeh) 영상을 생성함에 있어서, 프로세서가 생성한 픽셀의 색상 정보 및 픽셀의 라벨(label) 정보를 이용하여 영상을 생성할 수 있는바, AP가 실시간으로 처리해야 하는 데이터의 양을 줄일 수 있고 이에 따라 AP의 소비전력을 낮출 수 있는 효과가 존재한다.
도 1은 일 실시예에 따른 광학 기기의 일부 구성 요소를 도시한 블럭도이다.
도 2는 일 실시예에 따른 딥 러닝 트레이닝의 수행 과정을 도시한 도면이다.
도 3은 일 실시예에 따른 제1프로세서와 제2프로세서에 의해 생성된 정보를 도시한 도면이다.
도 4는 다른 실시예에 따른 제1프로세서와 제2프로세서에 의해 생성된 정보를 도시한 도면이다.
도5는 다른 실시예에 따른 광학 기기의 일부 구성 요소를 도시한 블럭도이다.
도6은 다른 실시예에 따른 광학 기기의 일부 구성 요소를 도시한 블록도이다.
도 7은 일 실시예에 따른 광학 기기의 제어 방법을 도시한 순서도이다.
본 명세서에 기재된 실시 예와 도면에 도시된 구성은 개시된 발명의 바람직한 일 예이며, 본 출원의 출원 시점에 있어서 본 명세서의 실시 예와 도면을 대체할 수 있는 다양한 변형 예들이 있을 수 있다.
또한, 본 명세서에서 사용한 용어는 실시 예를 설명하기 위해 사용된 것으로, 개시된 발명을 제한 및/또는 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 명세서에서, "포함하다", "구비하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않으며, 본 명세서에서 사용한 "제 1", "제 2" 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되지는 않는다.
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.
도 1은 일 실시예에 따른 광학 기기(400)의 일부 구성 요소를 도시한 블럭도이다.
도 1을 참조하면, 일 실시예에 다른 광학 기기(400)는 외부 대상체에 대한 이미지를 획득한 후 이를 기초로 베이어 패턴 정보를 생성하는 이미지 센서(210)와 이미지 센서(210)가 생성한 베이어 패턴 정보를 기초로 딥 러닝을 수행하여 또 다른 베이어 이미지 및 영상 처리가 수행된 영상 정보를 생성하는 프로세서(220) 및 프로세서(220)에 의해 생성된 정보를 수신하는 AP 도 3은 일 실시예에 따른 제1프로세서와 제2프로세서에 의해 생성된 정보를 수신하여 사용자에 명령에 따른 영상 처리를 실시하는 AP(Application Processor) 등을 포함할 수 있다.
이미지 센서(210)는 영상 처리 장치(200)에 실장되어 있는 렌즈(120)를 통해 들어오는 빛을 전기 신호로 변화하는 장치를 포함할 수 있다. 구체적으로, 이미지 센서(210)는 CMOS(Complementary Metal Oxide Semiconductor) 또는 CCD(Charge Coupled Device)와 같은 여러 종류의 이미지 센서를 포함할 수 있다.
구체적으로 이미지 센서(210)는 렌즈(120)를 통해서 얻은 정보를 기초로 제1해상도를 가지는 제1 베이어 패턴(Bayer Pattern) 정보를 생성하고 생성된 제1베이어 패턴 정보를 프로세서(220)로 송신할 수 있다.
통상적인 카메라 장치 혹은 카메라 장치는 이미지 센서로부터 베이어 패턴 정보를 전달받아 색을 입히는 과정(색 보간 과정, Color Interpolation 혹은 Demosaicing)을 거쳐 이미지 형태의 데이터를 출력할 수 있는데, 여기서 베이어 패턴이란 영상 처리 장치 또는 영상 처리 장치에 포함된 광 신호를 전기 신호로 변환하는 이미지 센서(210)가 출력하는 가공되지 않은 데이터(Raw Data)를 의미한다.
이에 대해 구체적으로 설명하면, 렌즈(120)를 통해 전달되는 광 신호는 이미지 센서에 배치된 R, G, B 색상을 검출할 수 있는 화소를 통해 전기 신호로 변환될 수 있는데, 예를 들어, 영상 처리 장치(100)의 사양이 500만 화소라고 한다면, R, G, B 색상을 감지할 수 있는 화소가 500만개 포함된 이미지 센서가 포함되어 있다고 볼 수 있다.
그리고 이미지 센서의 화소 수가 500만개인 경우 실제로 각각의 화소가 모든 색(color)을 감지하는 것은 아니고, 흑백의 밝기만을 감지하는 단색(monochrome) 화소가 R, G, B 필터 중 어느 하나와 결합되어 있는 것으로 볼 수 있다. 즉, 이미지 센서는 화소수 만큼 배열된 단색 화소 셀들 위에 R, G, B 색상 필터들이 특정한 패턴을 가지고 배치되어 있는 것을 볼 수 있다.
따라서, 이러한 구조에 따라 R, G, B 색상 패턴이 사용자(즉, 인간)의 시각적 특성에 따라 교차하며 배치되는데 이를 베이어 패턴(Bayer Pattern)이라고 부른다.
일반적으로 베이어 패턴 정보는, 이미지 형태의 데이터 보다 데이터의 양이 작다. 따라서, 고사양의 프로세서를 가지고 있지 않은 카메라 장치가 장착된 장치라 하더라도 이미지 형태의 데이터보다 비교적 빠르게 베이어 패턴의 이미지 정보를 전송하고 수신할 수 있으며, 이를 기초로 다양한 해상도를 가지는 이미지로 변환시킬 수 있는 장점이 존재한다.
일 예로, 카메라 장치가 차량에 탑재되어, 카메라 장치가100Mbit/s 의 전이중(Full-duplex) 전송 속도를 가지는 저전압 차등 신호 방식(LVDS)이 이용되는 환경 내에서도 이미지 처리를 하는데 많은 프로세서가 필요하지 않아 과부하가 걸리지 않아 차량을 이용하는 운전자 또는 운전자의 안전에 위해가 되지 않을 수 있다.
또한, 차량 내 통신망에 의해 전달되는 데이터의 크기를 줄일 수 있어 자율 주행 차량에 적용하더라도 차량에 배치된 복수의 카메라의 작동에 따른 통신 방식, 통신 속도 등에 의해 발생하는 문제를 제거할 수 있는 효과가 존재한다.
다시 도1로 돌아와 이미지 센서(210)에 대해 설명하면 이미지 센서(210) 렌즈에 의해 취득한 광신호를 기초로 상기 설명한 제1베이어 패턴 정보를 생성하고 생성된 제1베이어 패턴 정보를 프로세서(220)로 송신할 수 있다.
그리고 프로세서(220)는 이미지 센서(210)로부터 수신한 제1베이어 패턴 정보를 기초로 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보 및 라벨(Label) 정보를 생성할 수 있다.
구체적으로, 프로세서(220)는 딥 러닝(Deep Learning) 트레이닝에 의해 생성된 알고리즘을 이용하여 이미지 센서(210)로부터 수신한 제1해상도를 가지는 제1베이어 패턴 정보를 기초로 제1베이어 패턴 보다 높은 해상도 값을 가지는 제2베이어 패턴을 생성할 수 있으며, 제2베이어 패턴의 해상도의 값은 사용자의 목적에 따라 사용자가 자유롭게 설정 변경할 수 있다.
따라서, 일 실시예에 따른 영상 처리 장치(300)은 도면에는 도시하지 않았으나, 제2해상도 값에 대한 정보를 사용자로부터 수신하는 입력부를 더 포함할 수 있으며, 사용자는 이를 통해 원하는 해상도에 대한 정보를 영상 처리 장치(300)로 전송할 수 있다.
또한, 본 명세서에서는 전반적으로 영상 처리 장치를 기준으로 설명하였지만 영상 처리 장치는 카메라 모듈이나 카메라 장치 등을 포함할 수 있다.
또한, 프로세서(220)는 이미지 센서(210)로부터 수신한 제1베이어 패턴 정보를 기초로 라벨(Label) 정보를 생성할 수 있다. 또한 프로세서(220)는 영상의 픽셀 분류 처리, 영상의 저조도 개선 처리, 영상의 블러(blur) 제거 처리 및 영상의 노이즈(noise) 제거 처리 중 적어도 하나를 포함할 수 있다. 이에 대한 구체적인 설명은 도 3과 도 4를 통해서 설명하도록 한다.
예를 들어, 사용자는 해상도가 높은 이미지를 얻고 싶은 경우, 제2해상도 값을 제1해상도와 차이가 많이 존재하는 해상도로 설정할 수 있으며, 비교적 빠른 시간 내에 새로운 이미지를 취득하고 싶은 경우, 제1해상도와 해상도의 차이가 많이 나지 않은 해상도로 제2해상도 값을 자유롭게 설정할 수 있다.
또한, 프로세서(220)는 프로세서를 통해 실행되는 적어도 하나의 프로그램 명령이 저장된 메모리(Memory, 미도시)를 통해 구현될 수 있다.
구체적으로, 메모리는 S램, D랩 등의 휘발성 메모리를 포함할 수 있다. 다만, 이에 한정되는 것은 아니며, 경우에 따라서 메모리는 플래시 메모리, 롬(Read Only Memory), 이피롬(Erasable Programmable Read Only Memory: EPROM), 이이피롬(Electrically Erasable Programmable Read Only Memory: EEPROM) 등의 비휘발성 메모리를 포함할 수도 있다.
AP(300, Application Processor)는 모바일용 메모리 칩으로 광학 기기(400)에서 각종 어플리케이션 작동과 그래픽 처리를 담당하는 핵심 반도체를 의미할 수 있다.
AP(300)는 컴퓨터의 중앙처리장치(CPU)의 기능과 메모리, 하드디스크, 그래픽 카드 등 기타 장비의 연결을 제어하는 칩셋의 기능을 모두 포함하고 있는 SoC(System on Chip) 형태로 구현될 수 있다.
지금까지 일 실시예에 따른 영상 처리 장치(300)의 일반적인 구성 요소에 대해 알아보았다. 이하 프로세서(220)에 적용되는 알고리즘의 생성 방법 및 특징에 대해 도 2 내지 도 4를 통해 알아보도록 한다.
일 실시예에 따른 프로세서(220)에 적용되는 알고리즘은, 입력된 이미지의 해상도보다 더 높은 해상도를 가지는 이미지를 생성하는 알고리즘과 입력된 이미지를 기초로 특정 영상 처리를 수행하는 알고리짐으로서, 이러한 알고리즘은 딥 러닝 트레이닝을 반복적으로 수행하여 생성된 알고리즘을 의미할 수 있다.
딥 러닝이란, 심층 학습으로 표현되기도 하는데, 여러 비선형 변환기법의 조합을 통해 높은 수준의 추상화(abstractions, 다량의 데이터나 복잡한 자료들 속에서 핵심적인 내용 또는 기능을 요약하는 작업)를 시도하는 기계 학습(machine learning)에 관한 알고리즘의 집합을 의미한다.
구체적으로, 딥 러닝은 어떠한 학습 데이터를 컴퓨터가 이해할 수 있는 형태(예를 들어 이미지의 경우는 픽셀(Pixel)정보를 열 벡터로 표현하는 등)로 표현(Representation)하고 이를 학습에 적용하기 위해 많은 연구(어떻게 하면 더 좋은 표현기법을 만들고 또 어떻게 이것들을 학습할 모델을 만들지에 대한)에 대한 학습 기법으로, DNN(Deep Neural Networks) 및 DBN(Deep Belief Networks)등의 학습 기법을 포함할 수 있다.
일 예로, 딥 러닝은 먼저 주변 환경을 인지하고 현재 환경 상태를 프로세서에 전달할 수 있다. 프로세서는 이에 맞는 행동(Action)을 수행하고 환경은 다시 그 행동에 따른 보상치를 프로세서에게 알려준다. 그리고 프로세서는 보상치를 최대로 하는 행동을 택하게 된다. 이러한 과정에 통해 학습 과정이 반복적으로 진행될 수 있다.
앞서 설명한대로 딥 러닝을 수행 하면서 이용되는 학습 데이터는, 실제 해상도가 낮은 베이어 이미지를 해상도가 높은 베이어 이미지로 변환해 가면서 얻은 결과일 수도 있으며, 시뮬레이션을 통해 얻은 정보일 수도 있다.
만약, 시뮬레이션 과정을 수행하는 경우 시뮬레이션의 환경에 맞추어(이미지의 배경, 색상의 종류 등) 조정함으로써 보다 빠르게 데이터를 획득할 수 있다. 이하 도 2를 통해 일 실시예에 따른 프로세서(230)에 적용되는 알고리즘이 생성되는 방법에 대해 구체적으로 알아본다.
도 2는 일 실시예에 따른 딥 러닝 트레이닝의 수행 과정을 도시한 도면으로서, 구체적으로는 프로세서(220)가 제1베이어 패턴 정보를 기초로 제2베이어 패턴 정보를 생성하는 순서를 도시한 도면이다.
도 2의 딥 러닝은 심층 신경망(Deep Neural Network, DNN) 알고리즘이 적용된 딥 러닝으로서, DNN 알고리즘이 적용됨에 따라 새로운 해상도를 가지는 이미지를 생성하는 과정을 도시한 도면이다.
심층 신경망(DNN)은 입력층(input layer)과 출력층(output layer) 사이에 다중의 은닉층(hidden layer)이 존재하는 심층(deep) 신경망, 동물의 시각 피질의 구조와 유사하게 뉴런 사이의 연결 패턴을 형성하는 컨볼루션(convolutional) 신경망, 시간에 따라 매순간마다 신경망을 쌓아 올리는 재귀(recurrent) 신경망으로 구체화될 수 있다.
구체적으로 DNN은 컨볼루션(Convolution)과 서브 샘플링(Sub-Sampling)을 반복하여 데이터의 양을 줄이고, 왜곡시켜 신경망을 분류한다. 즉, DNN은 특징 추출과 분류 행위를 통해 부류 결과를 출력하는데, 주로 이미지를 분석하는데 사용되며, 컨볼루션은 영상 필터링을 의미한다.
도 2을 참조하여 DNN 알고리즘이 적용된 프로세서(230)가 수행하는 과정을 설명하면, 프로세서(220)는 제1해상도를 가지는 제1베이어 패턴(10)을 기초로 배율을 높이고자 하는 영역에 대해 컨볼루션과 서브 샘플링(Sub-Sampling)을 수행한다.
배율을 높인다는 것은, 이미지 센서(210)가 취득한 이미지 중에서 특정 부분만을 확대하는 것을 의미한다. 따라서, 사용자에 의해 선택되지 않은 부분은 사용자가 관심이 없어 하는 부분이므로 해상도를 높이는 과정을 수행할 필요가 없으므로 사용자에 의해 선택된 부분에 대해서만 컨볼루션과 서브 샘플링 과정을 수행할 수 있다.
서브 샘플링은 영상의 크기를 줄이는 과정을 의미한다. 일 예로 서브 샘플링은 맥스-풀(Max Pool) 방법을 사용할 수 있다. 맥스-풀은 해당 영역에서 최대치를 선택하는 기법인데 뉴런이 가장 큰 신호에 반응하는 것과 유사하다. 서브 샘플링은 노이즈를 감소시키고, 학습의 속도를 증가시킬 수 있는 장점이 존재한다.
컨볼루션과 서브 샘플링이 수행되면, 도 2에 도시된 바와 같이 복수 개의 이미지(20)가 출력될 수 있다. 그 후 출력된 이미지들을 기초로 업 스케일(Up Scale) 방식으로 이용하여 서로 다른 특징을 가지는 복수 개의 이미지를 출력시킬 수 있다. 업 스케일 방식은 서로 다른 r^2개의 필터를 이용하여 이미지를 r*r 배로 스케일을 높이는 것을 의미한다.
업 스케일에 따라 복수 개의 이미지가 도2에 도시된 바와 같이 출력되면(30), 프로세서(220)는 이러한 이미지들을 기초로 재조합을 하여 최종적으로 제1해상도와 다른 해상도 값을 가지는 제2해상도를 가지는 제2베이어 이미지(40)를 출력할 수 있다.
따라서, 도 2에 도시된 바와 같이 제1해상도를 가지는 이미지(10)에서 사용자가 특정 영역을 선택한 경우, 그 영역에 대해서만 프로세서(230)는 앞서 설명한 딥 러닝을 수행할 수 있고, 수행한 결과 도 2에 도시된 바와 같이 제2해상도를 가지는 제2베이어 이미지(40)가 생성될 수 있다.
일반적으로, 딥 러닝을 할 수 있는 프로세서를 소형의 칩으로 구현하기 위해서는 딥 러닝의 프로세스와 메모리 게이트(gate) 수가 최소화가 되어야 하는데, 여기서 게이트 수에 가장 크게 영향을 주는 요소는 알고리즘 복잡도와 클럭(Clock) 당 처리되는 데이터 양이며, 프로세서가 처리하는 데이터의 양은 입력 해상도에 따라 달라진다.
따라서, 일 실시예에 따른 프로세서(220)는 게이트의 수를 줄이기 위해 입력 해상도를 줄인 후에 나중에 업 스케일링(Up Scailing) 하는 방식으로 고배율의 이미지를 생성하므로 보다 빠르게 이미지를 생성할 수 있는 장점이 존재한다.
예를 들어, 입력 해상도가 8Mp(Mega Pixel)인 이미지를 2배 줌을 해야 한다면 1/4 영역 (2Mp)을 기초로 가로와 세로를 각각 2배씩 업 스케일링(Up scailing) 하여 2배 줌을 한다. 그리고 1/4영역(2Mp)을 1/4 다운 스케일링(down scaling) 하여 해상도가 0.5Mp인 이미지를 딥 러닝 처리 입력 데이터로 사용한 후에, 생성된 이미지를 기초로 가로와 세로를 각각 4배씩 업 스케일링(Up scailing) 하는 방식으로 4배 줌을 하면 2배줌을 한 것과 동일한 영역의 줌 영상을 생성할 수 있다.
따라서, 일 실시예에 따른 프로세서(220)는 입력 해상도 손실에 따른 성능 저하를 방지하기 위해 딥 러닝이 해상도 손실에 대응되는 배율만큼 학습을 시켜서 이미지를 생성하므로, 성능 저하를 최소화할 수 있는 장점이 존재한다.
또한, 고해상도의 이미지를 구현하기 위한 딥 러닝 기반의 알고리즘들은 일반적으로 프레임 버퍼(Frame Buffer)를 사용하는데, 프레임 버퍼의 경우 일반 PC 및 서버에서는 그 특성상 실시간 구동이 어려운 문제가 존재하나, 일 실시예에 따른 프로세서(220)는 딥 러닝을 통해 이미 생성되어 있는 알고리즘 적용하므로 저사양 카메라 장치 및 이를 포함하는 여러 장치 들에서 쉽게 적용이 가능하다.
또한, 일 실시예에 따른 프로세서(220)는 이러한 알고리즘을 구체적으로 적용함에 있어서 몇 개의 라인 버퍼(Line Buffer)만을 사용하는 방식으로 고해상도를 구현하므로, 비교적 크기가 작은 소형 칩(Chip)으로 프로세서를 구현할 수 있는 효과 또한 존재한다.
또한, 본 명세서에서 딥 러닝을 수행한다는 것은 앞서 도 2을 통하여 설명한 바와 같이 해상도를 높이기 위한 최적의 알고리즘을 생성하기 위해 추론 또는 반복적 학습을 통해 알고리즘을 생성하는 과정을 의미할 수 도 있지만, 동시에 이러한 과정에 의해 생성된 알고리즘을 실행하는 것 또한 딥 러닝을 수행한다고 볼 수 있다.
지금까지 도 2를 통해 프로세서(220)가 수행하는 제2베이어 이미지를 생성하는 방법에 대해 알아보았다. 이하 도 3과 도4를 통해 프로세서(220)가 수행하는 또 다른 기능에 대해 알아본다.
도 3은 일 실시예에 따른 제1프로세서와 제2프로세서에 의해 생성된 정보를 도시한 도면이고 도 4는 다른 실시예에 따른 제1프로세서와 제2프로세서에 의해 생성된 정보를 도시한 도면이다.
도 3을 참조하면, 프로세서(220)는 이미지 센서(210)로부터 수신한 제1베이어 패턴 정보를 기초로 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보를 생성하거나, 이미지 센서(210)로부터 수신한 제1베이어 패턴 정보를 기초로 라벨(Label) 정보를 생성할 수 있다. 여기서 제2베이어 패턴 정보를 생성하는 방법에 대해서는 도 2에서 자세히 설명하였는바, 도 3과 도 4에서는 라벨 정보를 생성하는 방법에 대해서 구체적으로 알아본다.
베이어 패턴 정보의 경우 가공 되지 않은 기초적인 정보로서, 이를 기초로 다양한 영상 처리를 수행할 수 있는데, 일반적으로 이러한 영상 처리는 영상 처리 장치에서 수행하지는 않고, 영상 처리 장치 외부에 존재하는 AP에서 수행하는 것이 일반적이다.
그러나, 영상 처리 장치 또는 영상 처리 장치를 포함하고 있는 광학 기기의 구조가 복잡해짐에 따라, AP가 처리해야 하는 기능들이 많아짐에 따라 성능 좋은 AP를 탑재하여야 하였고, 이러한 경우 제조 단가가 올라가는 문제점이 존재한다.
따라서, 일 실시예에 따른 영상 처리 장치(100) 및 이를 포함하는 광학 기기(400)는 칩(Chip) 형태로 구현되는 프로세서(220)가 이미지 센서(210)로부터 받은 정보를 기초로 영상 전처리를 수행한 한 후, 수행된 정보를 영상 처리 장치 외부의 AP(300)로 송신하므로, AP가 처리하여야 할 데이터의 양을 줄여줄 수 있는 효과가 있다. 이에 따라 고가의 AP를 탑재하지 않아도 똑같은 기능을 수행할 수 있는 장점이 존재한다.
구체적으로, 프로세서(220)는 이미지 센서(210)로부터 받은 제1베이어 패턴을 기초하여 라벨 정보를 생성할 수 있다. 또한, 제1 베이어 패턴에 영상 처리가 수행된 라벨 정보를 생성할 수도 있다. 여기서 영상 처리란, 픽셀 분류 처리, 저조도 개선 처리, 블러(blur) 제거 처리 및 노이즈(noise) 제거 처리 중 적어도 하나를 의미할 수 있다.
그리고, 여기서 말하는 픽셀 분류 처리는 다른 표현으로 영상 분할 처리라 표현할 수 있으며, 이는 영상 내에서 그룹 단위로 픽셀을 분류하는 기능을 의미할 수 있다.
예를 들어, 도 3에 도시된 바와 같이 영상이 건물과 동물, 하늘과 땅을 포함하고 있는 영상이라면 건물과 동물, 하늘과 땅을 그룹별로 분류하여 그룹별마다 서로 다른 라벨을 부여하는 과정을 의미할 수 있다. 라벨은 그룹별로 부여되거나 각각의 픽셀 단위로 부여될 수 있다.
즉, 일 실시예에 따른 광학 기기(400)는 프로세서(220)가 일반적으로 AP가 수행해야 할 영상 전처리 기능을 사전에 수행하고, 생성된 영상 정보를 AP(300)로 송신해주므로, AP(400)는 이러한 정보들을 기초로 다양한 영상 정보를 생성할 수 있다. 예를 들어 영상에서 물체 검출 기능을 손쉽게 수행할 수 있고, 보케(Bokeh) 영상 또한 용이하게 생성할 수 있다.
도 3에서는 제2베이어 패턴 정보의 생성은 제1프로세서(221)가 수행하고, 영상 처리를 수행하여 라벨 정보를 생성하는 것은 제2프로세서(222)가 수행하는 것으로 표현하였지만, 이에 한정되는 것은 아니고 하나의 프로세서가 두 개의 기능을 동시에 수행할 수도 있다.
또한, 프로세서(220)는 제1베이어 패턴 정보를 기초로 IS(Image Signal Processing)를 수행하여 RGB 영상 정보를 생성할 수 있다.
구체적으로, 도 4에 도시된 바와 같이 제1프로세서(221)는 제1베이어 패턴 정보를 기초로 영상에 대한 RGB(Red, Green, Blue) 픽셀 정보를 가지고 있는 RGB 영상 정보를 생성하고, 제2프로세서(222)는 제1베이어 패턴 정보를 기초로 라벨 정보를 생성할 수 있다.
도 4에서는 제1프로세서(221)가 RGB 영상 정보만 생성하는 것으로 도시하였지만, 이에 한정되는 것은 아니고 제1프로세서(221)는 도 3에서 설명한 제2베이어 패턴 정보 또한 같이 생성할 수 있다.
따라서, 프로세서(220)는 이러한 기능들을 수행하기 위해 딥 러닝(Deep-Learning)을 수행하여 획득된 알고리즘이 프로세서에 내장될 수 있다. 구체적으로, 딥러닝에 의해 제1프로세서(221)는 제1베이어 패턴 정보를 기초로 제2베이어 패턴 정보와 RGB 영상 정보를 생성하는 알고리즘이 내장될 수 있으며, 제2프로세서(222)는 제1베이어 패턴 정보를 기초로 라벨 정보를 생성하는 알고리즘이 내장될 수 있다.
또한, 프로세서(220)는 프로세서(220)가 생성한 정보들과, 이미지 센서(210)로부터 수신한 정보들을 비교하여 피드백(Feedback)을 수행할 수 있다.
구체적으로, 프로세서(220)와 이미지 센서(210)는 이미지 센서(210)로부터 수신한 제1베이어 패턴 정보와 생성한 라벨 정보, RGB 영상 정보 및 제2베이어 패턴 정보를 상호 비교하여 원하는 결과 출력되었는지, 사용자가 요구하는 사항에 맞추어 정보가 생성되었는지 등을 비교한 후, 예측된 정보와 다른 정보가 생성된 경우 피드백을 수행하여 예측된 정보와 생성되는 정보를 동일하게 수정할 수 있다.
즉, 생성된 정보와 예측된 정보가 일치하지 않는 경우 이미지 센서(210)로부터 다른 제1베이어 패턴 정보를 생성하여 이를 기초로 제2베이어 패턴 정보, RGB 영상 정보, 라벨 정보 등을 생성한 후, 생성된 정보와 프로세서(220)에 투입되는 인풋 정보들을 상호 비교하는 방식으로 피드백을 수행할 수 있다.
또한, 프로세서는 제1해상도 값 및/또는 제1해상도 보다 해상도가 높은 제2해상도 값을 가지는 제1베이어 패턴 정보와 이를 기초로 프로세서(220)에 의해 생성된 제2베이어 정보들을 서로 상호 비교하여 피드백을 수행할 수 있다.
도5는 다른 실시예에 따른 광학 기기(400)의 일부 구성 요소를 도시한 블럭도이다.
도 5를 참조하면, 일 실시예에 따른 광학 기기(400)는 필터(110), 렌즈(120), 액츄이에터(130), 드라이버 IC(140), 이미지 센서(210), 프로세서(220) 및 멀티플렉스(230)를 포함하고 있는 영상 처리 장치(100)과 ISP(310)를 포함하고 있는 AP(300)를 포함할 수 있다.
이미지 센서(210)와 프로세서(220)는 도 1에서 설명한 구성과 동일한 역할을 하는 구성 요소이므로 이에 대한 설명은 생략한다.
멀티 플렉서(MUX, 230)는 여러 개의 입력선 중에서 하나를 선택하여 단일 출력선으로 연결하는 조합회로서, 일 실시예에 따른 멀티 플렉서(230)는 프로세서(220)에 의해 생성되는 정보를 사용자의 명령에 맞추어 필요한 정보만 선택적으로 수신할 수 있다.
구체적으로, 제1프로세서(221)의 경우 제2베이어 패턴 정보와 RGB 영상 정보를 생성할 수 있으므로, 멀티 플렉서(230)는 사용자에 명령을 분석하여 그 명령을 수행하는데 필요한 정보만 선택적으로 수신한 후, 수시한 정보를 AP(300)로 송신할 수 있다. 이러한 경우 불필요한 정보를 송신하지 않고 필요한 정보만 AP(300)로 송신함으로써, 보다 효율적으로 영상 처리 장치(100) 및 AP(400)를 제어할 수 있는 효과가 존재한다.
영상 처리 장치(100)의 필터(110)는 외부로부터 유입되는 빛을 선택적으로 차단하는 역할을 하며, 일반적으로 렌즈(120)의 상부에 위치할 수 있다.
렌즈(120)는 유리와 같이 투명한 물질의 면을 구면으로 곱게 갈아 물체로부터 오는 빛을 모으거나 발산시켜 광학적 상을 맺게 하는 장치로서, 영상 처리 장치(100)에 사용되는 일반적인 렌즈(120)는 복수 개의 서로 다른 특징을 가지는 렌즈를 구비할 수 있다.
액츄에이터(130)는 렌즈(120) 또는 렌즈(120)를 포함하는 경통의 위치를 조절하여 초점을 조절할 수 있다. 예를 들어 액츄에이터(130)는 VCM(Voice Coil Motor) 방식일 수 있으며, 렌즈(120)는 가변 초점 렌즈를 포함할 수 있다.
액츄에이터(130)가 가변 초점 렌즈를 포함하는 경우 드라이버 IC(140)는 가변 초점 렌즈를 구동할 수 있다.
드라이버 IC(140, Driver IC)는 화면에 문자나 영상 이미지가 표시되도록 패널에 구동 신호 및 데이터를 전기 신호로 제공하는 반도체(IC)를 의미할 수 있으며, 후술하겠지만 드라이버 IC(140)는 광학 기기(400)의 다양한 위치에 배치될 수 있다. 또한 드라이버 IC(140, Driver IC)는 액츄에이터(130)를 구동할 수 있다.
AP(300, Application Processor)는 모바일용 메모리 칩으로 광학 기기(400)에서 각종 어플리케이션 작동과 그래픽 처리를 담당하는 핵심 반도체를 의미할 수 있다.
AP(300)는 컴퓨터의 중앙처리장치(CPU)의 기능과 메모리, 하드디스크, 그래픽 카드 등 기타 장비의 연결을 제어하는 칩셋의 기능을 모두 포함하고 있는 SoC(System on Chip) 형태로 구현될 수 있다.
영상 신호 처리부(ISP, Image Signal Processing, 310)는 MIPI(Mobile Industry Processor Interface) 통신을 이용하여 프로세서(220)가 생성한 제2베이어 이미지를 수신하고 영상 신호 처리 과정을 수행할 수 있다.
영상 신호 처리부(310)부는 영상 신호를 처리하면서 복수의 서브 과정을 포함할 수 있다. 예를 들어, 수신한 영상에 대해 감마값 보정(gamma correction)을 하거나, 색채 보정(color correction), 자동 노출(auto exposure correction), 자동 화이트값 보정(auto white balance) 과정 중에서 적어도 하나 이상을 수행할 수 있다.
일반적으로 픽셀 정보를 더 많이 생성하여 고해상도 이미지를 구현하는 기술의 경우 싱글 프레임 SR (Single-Frame Super Resolution) 또는 멀티 프레임 SR(Multi-frame Super Resolution) 기술 등이 존재하는데, 이러한 기술의 경우 아티팩트(Artifact) 문제는 발생하지는 않지만, 모바일, 차량, IoT 등 소형 카메라 장치가 적용될 수 있는 장치에는 적용하기 어려운 알고리즘이며, 또한 이러한 기술을 구현하기 위해서는 별도의 이미지 프로세서가 필요하다.
그러나 이러한 합성 알고리즘을 수행을 하기 위한 소프트웨어는 일반적으로 처리해야 하는 데이터의 양이 많기 때문에 AP(Application Processor)에서도 실시간으로 처리하기 어려운 문제점이 존재한다. 설사 AP가 이러한 기능을 수행할 수 있었어도 이러한 AP는 가격이 비싸 제조 단가가 증가하는 문제점이 존재하였다.
그러나 일 실시예에 따른 영상 처리 장치(100) 또는 광학 기기(400)는 도 4에 도시된 바와 같이, 영상 처리 장치(100)에 AP(300)에서 처리하는 영상 처리의 일부분을 수행할 수 있는 프로세서(220)가 별도로 실장되어 있으므로 고가의 AP를 장착하지 않아도 효율적으로 영상처리를 할 수 있는바 비교적 경제적으로 영상 처리 장치 및 광학기기를 제조할 수 있는 효과가 존재한다.
또한, AP(300)에서 영상 처리를 하기 전에 이미지 센서(210)가 베이어 패턴에 대한 정보를 기초로 영상에 대한 전처리를 수행함으로써, AP(300)가 처리해야 하는 데이터의 양을 줄일 수 있는 효과가 존재한다. 따라서, 이러한 구조 및 순서에 의해 AP(300)의 소비전력을 낮추고, AP(300)를 보다 원활하게 작동시킬 수 있는 효과가 존재한다.
또한, 이러한 구조로 인해, 영상 처리 장치(100) 내부의 구조 또한 단순화 시킬 수있다. 종래 기술의 경우 이미지 센서와 프로세서 및 AP간의 통신 연결을 하기 위해서는 "이미지 센서 출력(MIPI tx) - 칩 입력(MIPI rx) - 칩 출력(MIPI tx) - AP 입력(MIPI rx)"구조가 필요하였으나, 일 실시예에 따른 광학 기기(400)는 영상 처리 장치(100) 내부에 전처리 기능을 수행하는 프로세서(220)가 칩(Chip)형태로 실장되어 있으며, 프로세서(220)에 의해 생성된 정보는 기존에 존재하였던 이미지 센서 출력(MIPI tx, 220)를 통해 출력할 수 있는바 설계를 비교적 간단하게 할 수 있는 효과가 존재한다.
즉, 도 6에 도시된 바와 같이 일 실시예에 따른 광학기기(400)는 종래 "이미지 센서 출력(MIPI tx) - 칩 입력(MIPI rx) - 칩 출력(MIPI tx) - AP 입력(MIPI rx)"구조에서 "칩 입력(MIPI rx) - 칩 출력(MIPI tx)"부분이 삭제된 구조를 취할 수 있다. 그리고 이러한 구조로 인해 MIPI IP에 대한 비용이 절감되 수 있어 경제적으로 영상 처리 장치 및 광학 기기를 제작할 수 있으며, 설계의 자유도 또한 증가시킬 수 있다.
또한, 이미지 센서(210) 내부에서 공유하던 여러 가지 데이터 정보들을 칩에서 함께 공유함으로 인해 AP(300)의 제어 신호도 단일화하여 통신할 수 있고, 이미지 센서에(210) 이미 있는 EEPROM이나 Flash memory등을 함께 사용함으로 메모리도 절약할 수 있다.
또한, 이미지 센서(210)는 간단한 ISP 기능들 또한 포함되어 있는바, 이러한 기능들을 영상 데이터에 활용한다면 더 다양한 딥 러닝 영상 데이터 베이스를 생성할 수 있어서 최종 성능을 향상시킬 수 있는 효과도 존재한다.
도 7은 일 실시예에 따른 광학 기기(400)의 제어 방법을 도시한 순서도이다.
도 7을 참조하면, 광학 기기(400)는 외부로부터 수신한 대상체에 대한 정보를 기초로 제1베이어 패턴 정보를 생성할 수 있다. (S10)
구체적으로, 이미지 센서(210)는 렌즈를 통과한 빛에 대한 정보를 기초로 영상 정보를 생성함에 있어서 필요한 제1베이어 패턴 정보를 생성할 수 있다.
그 후, 딥 러닝을 수행하여 제1베이어 패턴 정보를 기초로 제1베이어 패턴의 해상보다 높은 해상도를 가지는 제2베이어 패턴 정보 또는 픽셀에 대한 RGB 정보를 포함하고 있는 RGB 영상 정보를 생성하거나(S20), 라벨 정보를 생성할 수 있다.(S30)
제2베이어 패턴 정보, 픽셀에 대한 RGB 정보를 포함하고 있는 RGB 영상 정보 및 라벨 정보를 생성하는 방법에 대해서는 앞서 도면들을 통해 자세히 설명하였는바 이하 생략하도록 한다.
그 후, 생성된 정보들은 AP(300)로 송신되거나(S40), 도면에는 도시하지 않았으나 생성된 정보와 제1베이어 배턴 정보를 상호 비교함으로써, 피드백을 수행할 수도 있다.
지금까지 도면을 통해 영상 처리 장치(100) 및 영상 처리 장치(100)을 포함하는 광학 기기(400)에 대해 알아보았다.
종래 기술에 따라 영상 처리를 위해 합성 알고리즘을 수행하기 위한 소프트웨어는 일반적으로 처리해야 하는 데이터의 양이 많기 때문에 AP(Application Processor)에서도 실시간으로 처리하기 어려운 문제점이 존재한다. 설사 AP가 이러한 기능을 수행할 수 있었어도 이러한 AP는 가격이 비싸 제조 단가가 증가하는 문제점이 존재하였다.
그러나 일 실시예에 따른 영상 처리 장치(100) 또는 광학 기기(400)는 AP(300)에서 처리하는 영상 처리의 일부분을 수행할 수 있는 프로세서(220)가 별도로 포함되어 있어, 고가의 AP를 장착하지 않아도 효율적으로 영상처리를 할 수 있는바 비교적 경제적으로 영상 처리 장치 및 광학 기기를 제조할 수 있는 효과가 존재한다.
즉, AP(300)에서 영상 처리를 하기 전에 별도의 프로세서(220)가 베이어 패턴 정보를 기초로 영상에 대한 전처리를 수행함으로써, AP(300)가 처리해야 하는 데이터의 양을 줄일 수 있는 효과가 존재한다. 따라서, 이러한 구조 및 순서에 의해 AP(300)의 소비전력을 낮추고, AP(300)를 보다 원활하게 작동시킬 수 있는 효과가 존재한다.
또한, 보케(Bokeh) 영상을 생성함에 있어서, AP(300)는 프로세서(300)가 생성한 픽셀의 색상 정보 및 픽셀의 라벨(label) 정보를 이용하여 보케 영상을 생성할 수 있는바, AP가 실시간으로 처리해야 하는 데이터의 양을 줄일 수 있고 이에 따라 AP의 소비전력을 낮출 수 있는 효과가 존재한다.
지금까지 실시 예들이 비록 한정된 실시 예와 도면에 의해 설명되었으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 상기 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 실시 예들 및 특허 청구 범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
210: 이미지 센서
220: 프로세서
221: 제1프로세서
222: 제2프로세서
230: 멀티플렉서
300: AP
310: ISP
400: 광학 기기

Claims (7)

  1. 광을 수신하여 제1해상도를 가지는 제1베이어 패턴(Bayer Pattern) 정보를 생성하는 이미지 센서; 및
    상기 이미지 센서로부터 수신한 제1베이어 패턴 정보를 기초로 상기 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보 및 라벨(Label) 정보를 생성하는 프로세서;를 포함하는 영상 처리 장치.
  2. 제1 항에 있어서,
    상기 프로세서는 제1프로세서와 제2프로세서를 포함하고,
    상기 제1프로세서는 상기 제2베이어 패턴 정보를 생성하고, 상기 제2프로세서는 라벨 정보를 생성하는 영상 처리 장치.
  3. 제1 항에 있어서,
    상기 프로세서는 상기 라벨 정보를 기초로 피드백(Feedback)을 수행한 후 이를 기초로 상기 제2베이어 패턴 정보를 생성하는 영상 처리 장치.
  4. 제1 항에 있어서,
    상기 프로세서는
    딥 러닝(Deep-Learning)을 수행하여 획득된 알고리즘에 기초해 상기 제2 베이어 패턴 정보 및 상기 라벨 정보를 생성하는 영상 처리 장치.
  5. 제2 항에 있어서,
    상기 제1프로세서와 제2프로세서는,
    딥 러닝(Deep-Learning)을 수행하여 획득된 서로 다른 알고리즘에 기초해 상기 제2베이어 패턴 정보, 상기 라벨 정보를 각각 생성하는 영상 처리 장치.
  6. 광을 수신하여 제1해상도를 가지는 제1베이어 패턴(Bayer Pattern) 정보를 생성하는 이미지 센서;
    상기 이미지 센서로부터 수신한 제1베이어 패턴 정보를 기초로 상기 제1 베이어 패턴보다 높은 해상도를 가지는 제2베이어 패턴 정보 및 라벨(Label) 정보를 생성하는 프로세서;및,
    상기 프로세서로부터 출력되는 상기 제2 베이어 패턴 정보 또는 상기 라벨 정보를 수신하는 AP(Application Processor)를 포함하는 광학 기기.
  7. 제6 항에 있어서,
    상기 프로세서는 제1프로세서와 제2프로세서를 포함하고,
    상기 제1프로세서는 상기 제2베이어 패턴 정보를 생성하고, 상기 제2프로세서는 상기 라벨 정보를 생성하는 광학 기기.
KR1020190128083A 2019-10-15 2019-10-15 영상 처리 장치 및 이를 포함하는 광학 기기 KR20210044648A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190128083A KR20210044648A (ko) 2019-10-15 2019-10-15 영상 처리 장치 및 이를 포함하는 광학 기기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190128083A KR20210044648A (ko) 2019-10-15 2019-10-15 영상 처리 장치 및 이를 포함하는 광학 기기

Publications (1)

Publication Number Publication Date
KR20210044648A true KR20210044648A (ko) 2021-04-23

Family

ID=75738218

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190128083A KR20210044648A (ko) 2019-10-15 2019-10-15 영상 처리 장치 및 이를 포함하는 광학 기기

Country Status (1)

Country Link
KR (1) KR20210044648A (ko)

Similar Documents

Publication Publication Date Title
CN103428427B (zh) 影像尺寸重新调整方法以及影像尺寸重新调整装置
KR102242939B1 (ko) 카메라 장치 및 카메라 장치의 이미지 생성 방법
WO2023086694A1 (en) Image modification techniques
KR20220067034A (ko) 슬로우 셔터를 제공하기 위한 방법, 장치 및 저장 매체
KR102494123B1 (ko) 이미지 센서, 카메라 모듈 및 카메라 모듈을 포함하는 광학 기기
CN114208147B (zh) 图像传感器、相机模块和包括相机模块的光学装置
KR20220030877A (ko) 다양한 인트라-프레임 아날로그 비닝을 사용하는 이미지 센서
US11825214B2 (en) Camera device and image generation method of camera device
KR20210044648A (ko) 영상 처리 장치 및 이를 포함하는 광학 기기
KR102371944B1 (ko) 카메라 장치 및 카메라 장치의 이미지 생성 방법
CN114270799B (zh) 相机装置以及相机装置的图像生成方法
KR20220159852A (ko) 이미지 처리 모듈
US11363209B1 (en) Systems and methods for camera zoom
US20240119561A1 (en) Image processing device and image processing method
KR20210047070A (ko) 이미지 처리 장치 및 이미지 처리 방법
US20240013362A1 (en) Image processing method, image processing apparatus, learning apparatus, manufacturing method of learned model, and storage medium
US20240144717A1 (en) Image enhancement for image regions of interest
WO2023283855A1 (en) Super resolution based on saliency
JP2024012828A (ja) 撮像装置およびその制御方法
KR20240067983A (ko) 이미지 수정 기법들

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal