KR20210020387A - 전자 장치 및 그 제어 방법 - Google Patents

전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
KR20210020387A
KR20210020387A KR1020190099609A KR20190099609A KR20210020387A KR 20210020387 A KR20210020387 A KR 20210020387A KR 1020190099609 A KR1020190099609 A KR 1020190099609A KR 20190099609 A KR20190099609 A KR 20190099609A KR 20210020387 A KR20210020387 A KR 20210020387A
Authority
KR
South Korea
Prior art keywords
parameter
image
mode
layer
artificial intelligence
Prior art date
Application number
KR1020190099609A
Other languages
English (en)
Inventor
조인상
유기원
이원재
조대성
황찬영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020190099609A priority Critical patent/KR20210020387A/ko
Priority to US16/720,433 priority patent/US11100607B2/en
Priority to EP21182796.9A priority patent/EP3907695B1/en
Priority to EP20151293.6A priority patent/EP3779862B1/en
Priority to PCT/KR2020/001262 priority patent/WO2021029505A1/en
Priority to CN202010112631.8A priority patent/CN112399120B/zh
Priority to JP2020066303A priority patent/JP6978542B2/ja
Publication of KR20210020387A publication Critical patent/KR20210020387A/ko
Priority to US17/364,941 priority patent/US11574385B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4046Scaling the whole image or part thereof using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4007Interpolation-based scaling, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4053Super resolution, i.e. output image resolution higher than sensor resolution

Abstract

전자 장치가 개시된다. 복수의 레이어를 포함하는 인공 지능 모델에 관한 정보가 저장된 메모리 및, 입력 영상을 보간 처리하고 보간 처리된 영상을 인공 지능 모델을 이용하여 처리한 출력 영상을 획득하는 프로세서를 포함하며, 프로세서는,복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드로 동작하며, 제1 모드는, 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리된 영상 및 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며, 제2 모드는, 보간 처리된 영상에 기초하여 출력 영상을 획득할 수 있다.

Description

전자 장치 및 그 제어 방법 { Electronic apparatus and control method thereof }
본 개시는 전자 장치 및 그 제어 방법에 관한 것으로, 더욱 상세하게는 인공 지능 모델을 이용하여 영상 처리를 수행하는 전자 장치 및 그 제어 방법에 관한 것이다.
전자 기술의 발달에 힘입어 다양한 유형의 전자 기기가 개발 및 보급되고 있다. 특히, 가정, 사무실, 공공 장소 등 다양한 장소에서 이용되는 디스플레이 장치는 최근 수년 간 지속적으로 발전하고 있다.
최근에는 고해상도 영상 서비스에 대한 요구가 크게 증가하고 있다. 이러한 요구로 인해 super resolution, style transfer 등 deep learning 기반 기술이 영상 처리에 이용되고 있다.
Super Resolution은 저해상도의 입력 영상을 일련의 미디어 처리를 통해 고해상도의 영상으로 복원하는 기술이다. 예를 들어, deep learning 기반의 복수의 레이어를 포함하는 CNN 모델을 이용하여 저해상도의 입력 영상을 가로/세로 방향으로 스케일링하여 고해상도의 영상으로 복원할 수 있다.
다만, CNN 모델에 포함된 복수의 레이어 각각이 많은 수의 파라미터(또는 가중치)를 가지고 있어 연산 동작을 멈추지 않고 파라미터를 업데이트하기 어렵고, 업데이트 과정에서 출력 영상에 artifact가 발생할 수 있다는 문제점이 있다.
본 개시는 상술한 필요성에 따른 것으로, 본 개시의 목적은 실시간 뉴럴 네트워크 시스템에서 연산 동작을 멈추지 않고 파라미터를 효율적으로 업데이트할 수 있는 전자 장치 및 그 제어 방법을 제공함에 있다.
이상과 같은 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 전자 장치는, 복수의 레이어를 포함하는 인공 지능 모델에 대한 정보가 저장된 메모리 및 입력 영상을 보간 처리하고 상기 보간 처리된 영상을 상기 인공 지능 모델을 이용하여 처리한 출력 영상을 획득하는 프로세서를 포함하며, 상기 프로세서는, 상기 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드로 동작하며, 상기 제1 모드는, 상기 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리된 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며, 상기 제2 모드는, 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득할 수 있다.
또한, 상기 프로세서는, 상기 복수의 레이어 중 적어도 하나에서 이용되는 필터의 파라미터에 대한 업데이트가 필요한 경우, 상기 필터의 현재 파라미터 및 업데이트될 대상 파라미터 간 차이에 기초하여 상기 제1 모드 또는 상기 제2 모드를 선택할 수 있다.
또한, 상기 인공 지능 모델에 포함된 상기 복수의 레이어 각각은, 상이한 파라미터를 포함하는 필터를 이용하여 상기 보간 처리된 영상에 대한 잔차 영상을 생성하며, 상기 프로세서는, 상기 인공 지능 모델로부터 출력되는 잔차 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득할 수 있다.
또한, 상기 프로세서는, 상기 제1 모드가 선택되면 상기 복수의 레이어 중 적어도 하나의 레이어에서 이용되는 파라미터를 실시간으로 업데이트하고, 상기 파라미터의 업데이트에 기초하여 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 상기 프로세서는, 상기 적어도 하나의 중간 레이어에서 이용되는 상기 파라미터의 실시간 업데이트에 기초하여 상기 복수의 레이어 중 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 상기 프로세서는, 제1 중간 레이어에서 이용되는 제1 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하고, 상기 제1 중간 레이어가 업데이트된 후 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 상기 프로세서는, 상기 제2 모드로 동작하는 동안 상기 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 상기 제2 모드를 상기 제1 모드로 전환하며, 상기 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 상기 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 보상하기 위한 보상 파라미터는, 상기 적어도 하나의 중간 레이어가 상기 업데이트된 파라미터를 포함하는 상기 인공 지능 모델의 학습에 기초하여 획득될 수 있다.
또한, 상기 프로세서는, 상기 입력 영상의 데이터 전송 속도 또는 상기 입력 영상에 대한 정보 중 적어도 하나에 기초하여 상기 파라미터의 업데이트가 필요한지 여부를 식별할 수 있다.
또한, 디스플레이를 더 포함하며, 상기 프로세서는, 상기 출력 영상을 출력하도록 상기 디스플레이를 제어하며, 상기 출력 영상은, 4K 또는 8K 이상의 고해상도 영상일 수 있다.
한편, 본 개시의 일 실시 예에 따른 복수의 레이어를 포함하는 인공 지능 모델에 대한 정보를 저장하는 전자 장치의 제어 방법은, 입력 영상을 보간 처리하는 단계 및 상기 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드에 따라 출력 영상을 획득하는 단계를 포함하며, 상기 제1 모드는, 상기 보간 처리된 영상을 상기 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리한 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며, 상기 제2 모드는, 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득할 수 있다.
또한, 상기 입력 영상을 처리하는 단계는, 상기 복수의 레이어 중 적어도 하나에서 이용되는 필터의 파라미터에 대한 업데이트가 필요한 경우, 상기 필터의 현재 파라미터 및 업데이트될 대상 파라미터 간 차이에 기초하여 상기 제1 모드 또는 상기 제2 모드를 선택할 수 있다.
또한, 상기 인공 지능 모델에 포함된 상기 복수의 레이어 각각은, 상이한 파라미터를 포함하는 필터를 이용하여 상기 보간 처리된 영상에 대한 잔차 영상을 생성하며, 상기 전자 장치는, 상기 인공 지능 모델로부터 출력되는 잔차 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득할 수 있다.
또한, 상기 제1 모드가 선택되면 상기 복수의 레이어 중 적어도 하나의 레이어에서 이용되는 파라미터를 실시간으로 업데이트하고, 상기 파라미터의 업데이트에 기초하여 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 실시간으로 보상하는 단계를 더 포함할 수 있다.
또한, 상기 파라미터를 실시간으로 보상하는 단계는, 상기 적어도 하나의 중간 레이어에서 이용되는 상기 파라미터의 실시간 업데이트에 기초하여 상기 복수의 레이어 중 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 상기 파라미터를 실시간으로 보상하는 단계는, 제1 중간 레이어에서 이용되는 제1 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하고, 상기 제1 중간 레이어가 업데이트된 후 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 상기 입력 영상을 처리하는 단계는, 상기 제2 모드로 동작하는 동안 상기 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 상기 제2 모드를 상기 제1 모드로 전환하는 단계 및, 상기 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는 단계;를 포함할 수 있다.
또한, 상기 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 보상하기 위한 보상 파라미터는, 상기 적어도 하나의 중간 레이어가 상기 업데이트된 파라미터를 포함하는 상기 인공 지능 모델의 학습에 기초하여 획득될 수 있다.
또한, 상기 입력 영상을 처리하는 단계는, 상기 입력 영상의 데이터 전송 속도 또는 상기 입력 영상에 대한 정보 중 적어도 하나에 기초하여 상기 파라미터의 업데이트가 필요한지 여부를 식별할 수 있다.
또한, 본 개시의 일 실시 예에 따른 복수의 레이어를 포함하는 인공 지능 모델에 관한 정보를 저장하는 전자 장치의 프로세서에 의해 실행되는 경우 상기 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서, 상기 동작은, 입력 영상을 보간 처리하는 단계 및 상기 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드에 따라 출력 영상을 획득하는 단계를 포함하며, 상기 제1 모드는, 상기 보간 처리된 영상을 상기 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리한 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며, 상기 제2 모드는, 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득할 수 있다.
상술한 다양한 실시 예에 따르면, 실시간 뉴럴 네트워크 시스템에서 적은 하드웨어 자원으로 파라미터를 효과적으로 업데이트할 수 있고, 업데이트 과정에서 출력 영상에 발생될 수 있는 artifact를 최소화시킬 수 있게 된다.
도 1a는 본 개시의 일 실시 예에 따른 전자 장치의 영상 처리 동작을 설명하기 위한 도면이다.
도 1b는 본 개시의 다른 실시 예에 따른 전자 장치의 영상 처리 동작을 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.
도 3a는 본 개시의 일 실시 예에 따른 제1 모드에서의 동작을 설명하기 위한 도면이다.
도 3b는 본 개시의 일 실시 예에 따른 제1 모드에서의 동작을 설명하기 위한 도면이다.
도 3c는 본 개시의 일 실시 예에 따른 제1 모드에서의 동작을 설명하기 위한 도면이다.
도 4는 본 개시의 다른 실시 예에 따른 제1 모드에서의 동작을 설명하기 위한 도면들이다.
도 5a는 본 개시의 일 실시 예에 따른 제2 모드에서의 동작을 설명하기 위한 도면이다.
도 5b는 본 개시의 일 실시 예에 따른 제2 모드에서의 동작을 설명하기 위한 도면이다.
도 6은 본 개시의 다른 실시 예에 따라 제1 모드 및 제2 모드를 혼합한 혼합 모드에서의 동작을 설명하기 위한 도면이다.
도 7은 본 개시의 일 실시 예에 따른 인공 지능 모델의 다른 예를 설명하기 위한 도면이다.
도 8은 본 개시의 일 실시 예에 따른 프로세서의 구현 예를 설명하기 위한 도면이다.
도 9는 본 개시의 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.
도 10은 본 개시의 일 실시 예에 따른 서버의 구성을 나타내는 블럭도이다.
도 11은 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
이하에서는 첨부 도면을 참조하여 본 개시를 상세히 설명한다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다. 
본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
A 또는 B 중 적어도 하나라는 표현은 "A" 또는 "B" 또는 "A 및 B" 중 어느 하나를 나타내는 것으로 이해되어야 한다.
본 개시에서 "모듈" 혹은 "부"는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈" 혹은 복수의 "부"는 특정한 하드웨어로 구현될 필요가 있는 "모듈" 혹은 "부"를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서(미도시)로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1a는 본 개시의 일 실시 예에 따른 전자 장치의 영상 처리 동작을 설명하기 위한 도면이다.
본 개시의 일 실시 예에 따른 전자 장치는 인공 지능 모델(또는 신경망 모델 또는 학습 네트워크 모델)을 이용하여 입력 영상에 대한 영상 처리를 수행하도록 구현될 수 있다. 여기서, 인공 지능 모델은 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 파라미터(parameters)(또는 복수의 가중치(weight values))를 포함하며, 이전(previous) 레이어의 연산 결과와 복수의 파라미터들 간의 연산을 통해 신경망 연산을 수행할 수 있다. 복수의 신경망 레이어들에 포함된 파라미터들은 인공지능 모델의 학습 결과에 의해 최적화될 수 있다. 예를 들어, 학습 과정 동안 인공 지능 모델에서 획득한 로스(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 파라미터들이 갱신될 수 있다. 인공 신경망은 심층 신경망(DNN:Deep Neural Network)를 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다.
도 1a는 본 개시의 일 실시 예에 따른 Super Resolution 처리를 위한 인공 지능 모델의 일 예를 도시한다. Super Resolution이란 해상도가 낮은 영상을 일련의 미디어 처리를 통해 높은 해상도로 변환하는 처리를 의미한다.
도 1a에 따르면 본 개시의 일 실시 예에 따른 전자 장치는 입력 영상(10), 예를 들어 저해상도 영상에 대해 보간 처리(20)를 수행하고, 보간 처리된 영상(11)을 인공 지능 모델(20)에 입력하여 잔차 영상(12)을 획득할 수 있다. 즉, 인공 지능 모델(20)은 Residual neural network로 구현될 수 있다.
전자 장치는 보간 처리된 영상(11)을 잔차 영상(12)과 결합하여 출력 영상(13), 예를 들어 고해상도 영상을 획득할 수 있다. 여기서, 보간 처리는 해상도가 낮은 영상을 높은 해상도로 스케일링하는 처리를 의미하며, 예를 들어 bilinear interpolation, nearest neighbor interpolation, bicubic interpolation, deconvolution interpolation, subpixel convolution interpolation, polyphase interpolation, trilinear interpolation, linear interpolation 중 적어도 하나의 보간 기법이 이용될 수 있다. 또한, 잔차 영상(residual image)은 잔차 정보 만을 포함하는 영상을 의미할 수 있다. 여기서, 잔차 정보는 입력 영상과 기준 영상의 차이에 따른 정보로서, 예를 들어, 에지(edge) 방향, 에지 강도, 노이즈 정보 또는 텍스처(texture) 정보 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다. 다른 예에 따라 잔차 정보는 계조 정보, 밝기 정보 또는 감마 정보 중 적어도 하나를 포함할 수 있다.
도 1b는 본 개시의 다른 실시 예에 따른 Super Resolution 처리를 위한 인공 지능 모델의 일 예를 도시한다.
도 1b에 따르면 전자 장치는 입력 영상(10), 예를 들어 저해상도 영상을 인공 지능 모델(20)에 입력하여 잔차 영상(12’)을 획득하고, 입력 영상(10)에 대해 보간 처리(20)를 수행하여 보간 처리된 영상(11)을 획득할 수 있다. 이어서, 전자 장치는 보간 처리된 영상(11)을 잔차 영상(12’)과 결합하여 출력 영상(13), 예를 들어 고해상도 영상을 획득할 수 있다. 즉, 도 1b에 도시된 실시 예에 따르면, 도 1a에 도시된 실시 예와 달리 입력 영상(10)을 인공 지능 모델(20)에 입력하여 잔차 영상(12’)을 획득할 수 있다.
한편, 도 1a 및 도 1b에 도시된, Super Resolution 처리에 이용되는 인공 지능 모델(20)는 학습을 통해 만들어진 것일 수 있다. 여기서, 학습을 통해 만들어진다는 것은, 기본 인공 지능 모델이 학습 알고리즘에 의하여 다수의 학습 데이터들을 이용하여 학습됨으로써, 원하는 특성(또는, 목적)을 수행하도록 설정된 기 정의된 동작 규칙 또는 인공 지능 모델이 만들어짐을 의미한다. 이러한 학습은 본 개시에 따른 별도의 서버 및/또는 시스템을 통해 이루어질 수 있으나, 이에 한정되는 것은 아니며 전자 장치에서 이루어질 수도 있다. 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)이 있으나, 전술한 예에 한정되지 않는다.
인공 지능 모델(20)은 예를 들어, CNN 기반의 VDSR 기술(Jiwon Kim, et al. , Accurate Image Super-Resolution Using Very Deep Convolutional Networks, CVPR 2016), EDSR(Enhanced Deep Residual Networks for Single Image Super-Resolution), DRCN(Deeply-Recursive Convolutional Network for Image Super-Resolution.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.), MDSR(Multi-scale deep super-resolution system) 등이 이용될 수 있으나, 이에 한정되는 것은 아니다.
한편, 상술한 바와 같이 인공 지능 모델(20)에 포함된 복수의 신경망 레이어들 각각은 복수의 파라미터를 포함하며, 인공 지능 모델(20)은 이전 레이어의 연산 결과와 복수의 파라미터들 간의 연산을 통해 신경망 연산을 수행할 수 있다.
다만, 입력 영상의 특성, 예를 들어, 포맷, 해상도, 압축율, 품질, 데이터 양, 입력 영상의 데이터 전송 속도 등에 기초하여 상이한 파라미터들이 이용될 수 있으므로, 인공 지능 모델(20)에 포함된 파라미터들의 실시간 업데이트가 필요할 수 있다. 하지만, 파라미터를 업데이트하는 과정에서 출력되는 영상에 다양한 결함(artifact)이 발생하여 화질 저하로 이어지는 문제가 있다.
이에 따라, 이하에서는 인공 지능 모델(20)에 포함된 파라미터의 실시간 업데이트가 필요한 경우 그로 인한 화질 저하를 방지할 수 있는 다양한 실시 예에 대해 설명하도록 한다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.
도 2에 따르면, 전자 장치(100)는 메모리(110) 및 프로세서(120)를 포함한다.
전자 장치(100)는 TV 또는 set-top box 로 구현될 수 있으나, 이에 한정되는 것은 아니며 스마트 폰, 태블릿 PC, 노트북 PC, HMD(Head mounted Display), NED(Near Eye Display), LFD(large format display), Digital Signage(디지털 간판), DID(Digital Information Display), 비디오 월(video wall), 프로젝터 디스플레이, 카메라, 캠코더, 프린터 등과 같이 영상 처리 및/또는 디스플레이 기능을 갖춘 장치라면 한정되지 않고 적용 가능하다.
전자 장치(100)는 다양한 압축 영상 또는 다양한 해상도의 영상을 수신할 수 있다. 예를 들어, 영상 처리 장치(100)는 MPEG(Moving Picture Experts Group)(예를 들어, MP2, MP4, MP7 등), JPEG(joint photographic coding experts group), AVC(Advanced Video Coding), H.264, H.265, HEVC(High Efficiency Video Codec) 등으로 압축된 형태로 영상을 수신할 수 있다. 또는 영상 처리 장치(100)는 SD(Standard Definition), HD(High Definition), Full HD, Ultra HD 영상 중 어느 하나의 영상을 수신할 수 있다.
메모리(110)는 본 개시의 다양한 실시 예를 위해 필요한 데이터를 저장할 수 있다. 메모리(110)는 데이터 저장 용도에 따라 전자 장치(100)에 임베디드된 메모리 형태로 구현되거나, 전자 장치(100)에 탈부착이 가능한 메모리 형태로 구현될 수도 있다. 예를 들어, 전자 장치(100)의 구동을 위한 데이터의 경우 전자 장치(100)에 임베디드된 메모리에 저장되고, 전자 장치(100)의 확장 기능을 위한 데이터의 경우 전자 장치(100)에 탈부착이 가능한 메모리에 저장될 수 있다. 한편, 전자 장치(100)에 임베디드된 메모리의 경우 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(non-volatile Memory)(예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, 플래시 메모리(예: NAND flash 또는 NOR flash 등), 하드 드라이브, 또는 솔리드 스테이트 드라이브(solid state drive(SSD)) 중 적어도 하나로 구현될 수 있다. 또한, 전자 장치(100)에 탈부착이 가능한 메모리의 경우 메모리 카드(예를 들어, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital), MMC(multi-media card) 등), USB 포트에 연결가능한 외부 메모리(예를 들어, USB 메모리) 등과 같은 형태로 구현될 수 있다.
일 예에 따라, 메모리(110)는 복수의 레이어를 포함하는 인공 지능 모델에 관한 정보를 저장할 수 있다. 여기서, 인공 지능 모델에 관한 정보를 저장한다는 것은 인공 지능 모델의 동작과 관련된 다양한 정보, 예를 들어 인공 지능 모델에 포함된 복수의 레이어에 대한 정보, 복수의 레이어 각각에서 이용되는 파라미터에 대한 정보 등을 저장한다는 것을 의미할 수 있다.
다른 예에 따라, 메모리(110)는 외부 장치(예를 들어, 소스 장치), 외부 저장 매체(예를 들어, USB), 외부 서버(예를 들어 웹 하드) 등으로부터 수신된 영상을 저장할 수 있다. 여기서, 영상은 디지털 동영상이 될 수 있으나 이에 한정되는 것은 아니다.
또 다른 예에 따라, 메모리(110)는 영상 처리에 필요한 다양한 영상 정보, 예를 들어 텍스처 처리를 위한 텍스처 정보, 에지 처리를 위한 에지 정보 등을 저장할 수 있다. 또한, 메모리(110)는 영상 처리에 의해 생성된 최종 출력 영상을 저장할 수도 있다.
본 개시의 일 실시 예에 따르면, 메모리(110)는 본 개시에 따른 다양한 동작들에서 생성되는 데이터를 저장하는 단일 메모리로 구현될 수 있다. 다만, 본 개시의 다른 실시 예에 따르면, 메모리(110)는 복수의 메모리를 포함하도록 구현될 수도 있다.
프로세서(120)는 전자 장치(100)의 전반적인 동작을 제어한다. 프로세서(120)는 하나 또는 복수의 프로세서로 구성될 수 있다.
일 실시 예에 따라 프로세서(130)는 디지털 영상 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), GPU(Graphics Processing Unit), AI(Artificial Intelligence) 프로세서, NPU (Neural Processing Unit), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(140)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, ASIC(application specific integrated circuit), FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
한편, 본 개시의 일 실시 예에 따른 인공 지능 모델을 실행하기 위한 프로세서(120)는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서 또는 NPU와 같은 인공 지능 전용 프로세서일 수 있다. 프로세서(120)는, 메모리(110)에 저장된 기 정의된 동작 규칙 또는 인공 지능 모델에 따라, 입력 데이터를 처리하도록 제어할 수 있다. 또는, 프로세서(120)가 인공 지능 전용 프로세서인 경우, 인공 지능 전용 프로세서는, 특정 인공 지능 모델의 처리에 특화된 하드웨어 구조로 설계될 수 있다.
프로세서(120)는 입력 영상을 영상 처리하여 출력 영상을 획득한다. 여기서, 입력 영상 및 출력 영상은 SD(Standard Definition), HD(High Definition), Full HD, UHD(Ultra High Definition) 영상 등이 될 수 있다. 특히, 출력 영상은 UHD(Ultra High Definition) 영상, 예를 들어 4K(3840x2160) 영상 또는 8K(7680x4320) 또는 그 이상의 해상도(예를 들어 16K, 32K)를 가지는 영상일 수 있으나, 이에 한정되는 것은 아니다. 영상 처리는 영상 개선(image enhancement), 영상 복원(image restoration), 영상 변환(image transformation), 영상 분석(image analysis), 영상 인식(image understanding) 또는 영상 압축(image compression) 중 적어도 하나를 포함하는 디지털 영상 처리가 될 수 있다.
본 개시의 일 실시 예에 따르면, 프로세서(120)는 인공 지능 모델을 이용하여 입력 영상을 처리함으로써 출력 영상을 획득할 수 있다. 또는 프로세서(120)는 입력 영상을 전처리(pre-processing)하고, 전처리된 영상을 인공 지능 모델을 이용하여 처리함으로써 출력 영상을 획득할 수 있다. 여기서, 전처리는 보간 처리를 포함할 수 있으나, 반드시 이에 한정되는 것은 아니며 인공 지능 모델을 이용하지 않고 입력 영상의 화질을 향상시킬 수 있는 다양한 영상 처리를 포함할 수 있다. 다만, 이하에서는 설명의 편의를 위하여 입력 영상을 보간 처리하는 것으로 설명하도록 한다.
일 실시 예에 따라 프로세서(120)는 입력 영상을 보간 처리하고, 보간 처리된 영상을 인공 지능 모델을 이용하여 처리한 출력 영상을 획득할 수 있다. 다른 실시 예에 따라 프로세서(120)는 입력 영상을 보간 처리함과 병렬적으로, 입력 영상을 인공 지능 모델에 입력하여 출력 영상을 획득할 수 있다. 예를 들어 프로세서(120)는 bilinear interpolation, nearest neighbor interpolation, bicubic interpolation, deconvolution interpolation, subpixel convolution interpolation, polyphase interpolation, trilinear interpolation, linear interpolation 중 적어도 하나의 보간 기법을 이용하여 보간 처리를 수행할 수 있다.
또한, 인공 지능 모델은, 복수의 신경망 레이어(이하, 레이어라 함)를 이용한 연산을 통해 입력 영상 또는 보간 처리된 영상을 처리하여 출력할 수 있다. 일 예로, 인공 지능 모델은 잔차 영상을 생성하여 출력할 수 있다. 여기서, 복수의 레이어 각각은 상이한 파라미터를 포함하는 필터를 이용하여 보간 처리된 영상에 대한 잔차 영상을 생성할 수 있다. 여기서, 파라미터는 필터의 가중치(또는 계수)와 동일한 의미일 수 있다. 이 경우, 인공 지능 모델은 Identity Function, Logistic Sigmoid Function, Hyperbolic Tangent(tanh) Function, ReLU Function, Leaky ReLU Function 등 다양한 유형의 활성화 함수(Activation function)를 이용하여 연산을 수행할 수 있다. 다만, 인공 지능 모델이 반드시 잔차 영상 만을 생성하는 것은 아니며, 인공 지능 모델의 구현 예에 따라 다양한 방식으로 입력된 영상을 처리하고, 처리된 영상을 출력할 수 있다.
일 실시 예에 따라 프로세서(120)는 하나의 인공 지능 모델을 이용하여 입력 영상을 처리할 수 있으나, 다른 실시 예에 따라 프로세서(120)는 복수의 인공 지능 모델을 이용하여 입력 영상을 처리할 수 있다. 이 경우 복수의 인공 지능 모델은 순차적으로 동작하거나, 병렬적으로 동작할 수 있다. 일 예로, 프로세서(120)는 제1 인공 지능 모델에 입력 영상을 입력하고, 제1 인공 지능 모델의 출력을 제2 인공 지능 모델에 입력한 후 제2 인공 지능 모델로부터 출력되는 영상에 기초하여 출력 영상을 획득할 수 있다. 다른 예로 프로세서(120)는 제1 및 제2 인공 지능 모델 각각에 입력 영상을 입력하고, 제1 및 제2 인공 지능 모델로부터 병렬적으로 출력되는 복수의 영상에 기초하여 출력 영상을 획득할 수 있다.
예를 들어, 복수의 인공 지능 모델은 제1 잔차 영상을 생성하는 모델 및 제2 잔차 영상을 생성하는 모델을 포함할 수 있다. 또는 복수의 인공 지능 모델은, 해상도의 업 스케일링을 위한 모델 및 노이즈 감소를 위한 모델을 포함할 수 있다. 또는 복수의 인공 지능 모델은, 객체 영역 처리를 위한 모델 및 배경 영역 처리를 위한 모델을 포함할 수 있다.
프로세서(120)는 인공 지능 모델로부터 출력되는 영상, 예를 들어 잔차 영상 및 전 처리된 영상, 예를 들어, 보간 처리된 영상에 기초하여 출력 영상을 획득할 수 있다. 예를 들어, 프로세서(120)는 보간 처리된 영상에 포함된 픽셀 값 및 잔차 영상에 포함된 픽셀 값을 대응되는 픽셀 단위로 합산하여 출력 영상을 획득할 수 있다. 또는 프로세서(120)는 제1 및 제2 인공 지능 모델로부터 각각 출력되는 제1 및 제2 잔차 영상 및 전 처리된 영상에 기초하여 출력 영상을 획득할 수도 있다. 또는 프로세서(120)는 제1 인공 지능 모델로부터 출력되는 제1 잔차 영상을 제2 인공 지능 모델에 입력하여 획득된, 제2 잔차 영상 및 전 처리된 영상에 기초하여 출력 영상을 획득할 수도 있다.
상술한 바와 같이 프로세서(120)는 입력 영상 또는 보간 처리된 영상을 적어도 하나의 인공 지능 모델에 입력하여 잔차 영상을 획득할 수 있으나, 이하에서는 설명의 편의를 위하여 보간 처리된 영상을 하나의 인공 지능 모델에 입력하여 잔차 영상을 획득하는 경우를 상정하여 설명하도록 한다. 다만, 본 개시에 따른 다양한 실시 예가 입력 영상을 인공 지능 모델에 입력하여 잔차 영상을 획득하는 경우, 복수의 인공 지능 모델을 이용하여 잔차 영상을 획득하는 경우에도 적용될 수 있음은 물론이다.
본 개시의 일 실시 예에 따르면, 프로세서(120)는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드로 동작할 수 있다. 예를 들어, 실시간으로 입력되는 입력 영상의 특성, 예를 들어, 포맷, 해상도, 압축율, 품질, 데이터 양, 입력 영상의 데이터 전송 속도(단위 시간에 전송되는 데이터 양, 예를 들어, 비트/초(bps)) 등에 기초하여 인공 지능 모델에 포함된 파라미터들의 실시간 업데이트가 필요할 수 있다. 여기서, 모드에 따라 입력 영상을 처리한다는 의미는 프로세서(120)가 각 모드에서 정의된 영상 처리 방식에 따라 영상을 처리한다는 의미일 수 있다. 예를 들어, 각 모드에서 정의된 영상 처리 방식에 대응되는 인스트럭션이 메모리(110)에 저장되어 있고, 프로세서(120)는 각 모드에서 대응되는 인스트럭션을 실행하여 대응되는 영상 처리를 수행하도록 동작할 수 있다.
본 개시의 일 실시 예에 따른 제1 모드는 복수의 레이어 중 적어도 하나에서 이용되는 파라미터가 업데이트되는 인공 지능 모델을 이용하여 처리된 영상을 이용하여 출력 영상을 획득하는 모드이고, 제2 모드는 인공 지능 모델을 이용하지 않고 출력 영상을 획득하는 모드일 수 있다.
일 예에 따라, 제1 모드는, 복수의 레이어 중 적어도 하나에서 이용되는 파라미터가 업데이트되는 인공 지능 모델을 이용하여 처리된 영상 및 보간 처리된 영상에 기초하여 출력 영상을 획득하는 모드일 수 있다. 제2 모드는, 보간 처리된 영상에 기초하여 출력 영상을 획득하거나, 입력 영상 및 보간 처리된 영상에 기초하여 출력 영상을 획득하는 모드일 수 있다. 이 경우 제2 모드는 인공 지능 모델에 보간 처리된 영상을 입력하지 않거나, 인공 지능 모델에 보간 처리된 영상을 입력하되, 인공 지능 모델로부터 출력되는 잔차 영상을 이용하지 않고 보간 처리된 영상 만을 이용하여 출력 영상을 획득하도록 동작할 수 있다. 또는, 제2 모드는 인공 지능 모델에 입력 영상을 입력하지 않거나, 인공 지능 모델에 입력 영상을 입력하되, 인공 지능 모델로부터 출력되는 잔차 영상을 이용하지 않고 보간 처리된 영상 만을 이용하거나, 보간 처리된 영상 및 입력 영상을 이용하여 출력 영상을 획득하도록 동작할 수 있다.
프로세서(120)는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 필터의 파라미터에 대한 업데이트가 필요한 경우, 필터에 셋팅된 기존 파라미터 및 업데이트될 대상 파라미터 간 차이에 기초하여 제1 모드 또는 제2 모드를 선택할 수 있다. 여기서, 파라미터 간 차이란 파라미터의 개수 차이, 파라미터의 수치 차이 등 업데이트 속도에 영향을 미칠 수 있는 다양한 속성의 차이가 될 수 있다.
프로세서(120)는 제1 모드가 선택되면 복수의 레이어 중 적어도 하나의 레이어에서 이용되는 파라미터를 실시간으로 업데이트하고, 파라미터의 업데이트에 기초하여 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 실시간으로 보상할 수 있다. 여기서, 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 보상하기 위한 보상 파라미터는, 적어도 하나의 중간 레이어가 업데이트된 파라미터를 포함하는 인공 지능 모델의 학습에 기초하여 획득될 수 있다.
이 경우, 프로세서(120)는 적어도 하나의 중간 레이어에서 이용되는 파라미터의 실시간 업데이트에 기초하여 복수의 레이어 중 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
예를 들어, 프로세서(120)는 제1 중간 레이어에서 이용되는 제1 파라미터가 실시간으로 업데이트되면, 제1 파라미터의 업데이트에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다. 이어서, 프로세서(120)는 제1 중간 레이어가 업데이트된 후 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 제1 파라미터 및 제2 파라미터의 업데이트에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다. 여기서, 파라미터가 업데이트되는 레어어의 순서는 랜덤으로 결정되거나, 각 레이어의 파라미터 수, 각 레이어의 특성 등에 기초하여 결정될 수 있다.
일 예에 따라, 프로세서(120)는 제2 모드로 동작하는 동안, 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하며, 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 업데이트된 제1 파라미터 및 제2 파라미터에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
다른 예에 따라, 프로세서(120)는 제2 모드로 동작하는 동안 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 제2 모드를 제1 모드로 전환하며, 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 제1 파라미터 및 제2 파라미터의 업데이트에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다. 즉, 프로세서(120)는 제1 모드 및 제2 모드를 혼합한 혼합 모드에서 파라미터의 업데이트 및 보상 동작을 수행할 수 있다.
도 3a 내지 도 3c는 본 개시의 일 실시 예에 따른 제1 모드에서의 동작을 설명하기 위한 도면들이다.
도 3a는 본 개시의 일 실시 예에 따른 제1 모드에서의 기본 동작을 설명하기 위한 도면이다.
프로세서(120)는 제1 모드가 선택되면, 인공 지능 모델(310)에 포함된 복수의 레이어 중 파라미터 업데이트가 필요한 적어도 하나의 레이어에 대한 파라미터 업데이트를 순차적으로 수행할 수 있다. 이 경우, 프로세서(120)는 중간 레이어의 파라미터를 우선 보상하고, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N)에서 이용되는 파라미터는 가장 나중에 보상할 수 있다. 이는, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N)에서 이용되는 파라미터의 개수가 다른 레이어의 파라미터 개수보다 작아 파라미터 보상에 좀더 용이할 수 있기 때문이다. 예를 들어, CNN의 경우 각 컨버루션 레이어의 채널 개수와 동일한 개수의 필터(또는 커널)를 이용하며 입력단과 출력단 근처의 컨벌루션 레이어에서의 채널 개수가 상대적으로 작기 때문에, 필터의 개수 또한 작고 이로 인해 필터 계수 즉, 파라미터의 개수가 상대적으로 작게 된다. 이는 컨벌루션 레이어의 파라미터 개수가 "입력 채널 수 *필터 폭*필터 높이*필터 개수(출력 채널 수)"로 계산되기 때문이다.
일 ž, 인공 지능 모델에 포함된 복수의 레이어 각각에서 이용되는 필터의 개수가 64개인 경우를 가정하도록 한다. 일 예에 따라 입력되는 영상이 RGB 영상인 경우 첫번째 레이어의 입력 채널 수는 3개(다른 예에 따라 Luma 영상인 경우, 첫번째 레이어의 입력 채널 수는 1개)이고, 첫번째 레이어에서 적용되는 필터의 크기가 3*3 이고, 필터 개수가 64개이므로 첫번째 레이어에서 이용되는 파라미터의 개수는 3*3*3*64개가 된다. 또한, 첫번째 레이어의 출력 채널 수가 64개이므로 두번째 레이어의 입력 채널 수는 64개이고 이에 따라 두번째 레이어에서 이용되는 파라미터의 개수는 64*3*3*64개와 같이 증가하게 된다.
다른 예로, 인공 지능 모델에 포함된 복수의 레이어 각각에서 이용되는 필터의 개수가 128개이고, 입력 영상이 Luma 영상인 경우를 상정하면, 첫번째 레이어의 입력 채널 수는 1개이고 첫번째 레이어에서 적용되는 필터의 크기가 3*3 이고, 필터 개수가 128개이므로 첫번째 레이어에서 이용되는 파라미터의 개수는 1*3*3*128개가 된다. 또한, 첫번째 레이어의 출력 채널 수가 128개이므로 두번째 레이어의 입력 채널 수는 128개이고 이에 따라 두번째 레이어에서 이용되는 파라미터의 개수는 128*3*3*128개와 같이 증가하게 된다.
또한, 출력단에서는 다시 원래의 채널 개수로 복귀하게 되므로 입력단과 출력단의 컨벌루션 레이어에 대응되는 파라미터 개수가 다른 컨벌루션 레이어에서 이용되는 파라미터의 개수보다 상대적으로 작게 된다. 일 예에 따라, VDCNN의 경우 첫번째 컨벌루션 레이어나 마지막 컨벌루션 레이어 대비, 다른 컨벌루션 레이어의 파라미터 수가 64배 크게 구현될 수 있다. 또한, EDSR의 경우, 첫번째 컨벌루션 레이어나 마지막 컨벌루션 레이어 대비, 다른 컨벌루션 레이어의 파라미터 수가 1820배 크게 구현될 수 있다. 다만, 이는 일 실시 예일 뿐이며 인공 지능 모델은 입력단 근처의 레이어는 필터 개수가 작고, 입력단에서 멀어질수록 필터 개수가 증가하도록 구현될 수도 있다.
도 3a에서는 두번째 레이어(layer 2)에서 이용되는 파라미터의 업데이트가 필요한 경우를 가정하였다.
이 경우, 프로세서(120)는 제2 레이어(layer 2)에서 이용되는 파라미터를 업데이트하면서, 나머지 레이어 중 적어도 하나 예를 들어, 도 3a에 도시된 바와 같이 첫번째 레이어(layer 1) 및 마지막 레이어(layer N)에서 이용되는 파라미터를 각각 보상할 수 있다. 즉, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N)에서 이용되는 파라미터를 보상을 위한 임시 파라미터로 대체할 수 있다. 이는 복수의 레이어 각각에서 이용되는 파라미터는 상호 연관되어 최적의 출력 영상을 출력하도록 학습된 것이기 때문에 두번째 레이어(layer 2)에서 이용되는 파라미터만 업데이트하게 되면 출력 영상에 artifact가 발생하기 때문이다.
구체적으로 프로세서(120)는 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 두번째 레이어(layer 2)에서 업데이트된 파라미터를 보상하기 위한 보상 파라미터로 대체할 수 있다. 여기서, 다른 레이어에서 업데이트된 파라미터를 보상하기 위한 보상 파라미터는 학습에 기초하여 획득될 수 있다. 이 경우 보상 파라미터를 획득하기 위한 학습은 전자 장치(100), 외부 장치 또는 외부 서버 중 적어도 하나에서 이루어질 수 있다. 예를 들어, 설명의 편의를 위하여 외부 서버에서 학습이 이루어지는 경우를 상정하도록 한다. 외부 서버는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터를 업데이트한 후, 나머지 레이어의 파라미터를 학습하여 보상 파라미터를 획득할 수 있다. 이 경우, 외부 서버는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터가 새로운 파라미터로 업데이트되더라도 인공 지능 모델이 artifact가 없는 영상을 출력하도록 나머지 레이어의 파라미터를 학습할 수 있다. 예를 들어, 외부 서버는 두번째 레이어의 파라미터를 새로운 파라미터로 업데이트하여 고정하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 고정시킨 후, 첫번째 및 마지막 레이어의 파라미터를 학습하여 대응되는 보상 파라미터를 획득할 수 있다. 또한, 외부 서버는 두번째 레이어 및 세번째 레이어의 파라미터를 새로운 파라미터로 업데이트하여 고정하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 고정시킨 후, 첫번째 및 마지막 레이어의 파라미터를 학습하여 대응되는 보상 파라미터를 획득할 수 있다. 외부 서버는 이와 같이 학습에 기초하여 획득된 보상용 파라미터를 전자 장치(100)에 제공할 수 있다.
한편, 일 실시 예에 따라 영상이 인공 지능 모델에 프레임 단위로 입력되는 경우, 프로세서(120)는 적어도 하나의 프레임이 입력되는 동안 두번째 레이어(layer 2)의 파라미터를 업데이트할 수 있다. 예를 들어, 하나의 프레임이 입력되는 동안 레이어(layer 2)의 파라미터를 모두 업데이트할 수 있으나, 경우에 따라 복수의 프레임이 입력되는 동안 레이어(layer 2)의 파라미터를 나누어 업데이트할 수도 있다. 예를 들어, 프로세서(120)는 V sync signal(vertical synchronizing signal) 또는 H sync signal(horizontal synchronizing signal) 중 적어도 하나에 기초하여 블랭크 구간에서 파라미터 업데이트를 수행할 수 있으나, 반드시 이에 한정되는 것은 아니다.
또한, 프로세서(120)는 적어도 하나의 프레임이 입력되는 동안 두번째 레이어(layer 2)의 파라미터를 업데이트하고 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 보상할 수 있다. 예를 들어, 하나의 프레임이 입력되는 동안 레이어(layer 2)의 파라미터를 모두 업데이트하고, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 모두 보상할 수 있다. 하지만, 경우에 따라 하나의 프레임이 입력되는 동안 레이어(layer 2)의 파라미터를 모두 업데이트하고, 다음 프레임이 입력되는 동안 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 보상할 수도 있다. 또한, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터 보상 또한 적어도 하나의 프레임, 예를 들어 복수의 프레임에 걸쳐 이루어질 수도 있음은 물론이다.
도 3b는 본 개시의 일 실시 예에 따른 제1 모드에서의 순차적인 파라미터 업데이트 동작을 설명하기 위한 도면이다.
도 3b의 첫번째 라인은 인공 지능 모델(310)에 포함된 복수의 레이어 각각에 기 셋팅된 파라미터에 따라 영상 처리가 이루어지는 경우를 도시한 것이다.
이어서, 인공 지능 모델(310)에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터에 대한 업데이트가 필요한 이벤트가 발생될 수 있다. 예를 들어, 입력 영상의 데이터 전송 속도가 변경되거나, 입력 영상의 포맷이 변경되어 인공 지능 모델(310)에 포함된 파라미터를 새로운 파라미터 셋에 기초하여 세팅해야 하는 경우가 발생할 수 있다.
이 경우, 프로세서(120)는 도 3b의 두번째 라인에 도시된 바와 같이 중간 레이어 중 하나, 예를 들어 두번째 레이어의 파라미터를 새로운 파라미터 셋, 예를 들어 변경된 입력 영상의 포맷에 대응되는 파라미터 셋에 기초하여 업데이트하고, 첫번째 및 마지막 레이어의 파라미터를 임시 파라미터 0로 교체하여 두번째 레이어의 파라미터 업데이트를 보상할 수 있다. 여기서, 임시 파라미터 0는 두번째 레이어의 파라미터를 새로운 파라미터로 교체하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 유지시킨 상태에서 첫번째 및 마지막 레이어의 파라미터를 학습하여 획득될 수 있다.
이어서, 프로세서(120)는 도 3b의 세번째 라인에 도시된 바와 같이 업데이트가 필요한 다음 레이어, 예를 들어 네번째 레이어의 파라미터를 새로운 파라미터 셋에 기초하여 업데이트하고, 첫번째 및 마지막 레이어의 파라미터를 임시 파라미터 1으로 대체하여 보상할 수 있다. 여기서, 임시 파라미터 1은 두번째 및 네번째 레이어의 파라미터를 새로운 파라미터로 교체하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 유지시킨 상태에서 첫번째 및 마지막 레이어의 파라미터를 학습하여 획득될 수 있다. 이와 같은 방식으로 프로세서(120)는 도 3b의 세번째 라인에 도시된 바와 같이 나머지 중간 레이어, 예를 들어 세번째 레이어의 파라미터도 업데이트하고 첫번째 및 마지막 레이어의 파라미터를 임시 파라미터 2로 대체하여 보상할 수 있다. 여기서, 임시 파라미터 2는 업데이트가 필요한 모든 중간 레이어의 파라미터를 새로운 파라미터로 교체하고 첫번째 레이어 및 마지막 레이어의 파라미터를 학습하여 획득될 수 있다.
상술한 방식으로 업데이트가 필요한 중간 레이어의 파라미터가 모두 업데이트되면, 프로세서(120)는 도 3b의 마지막 라인에 도시된 바와 같이 첫번째 및 마지막 레이어의 파라미터도 업데이트할 수 있다. 예를 들어, 업데이트가 필요한 모든 중간 레이어 및 첫번째 레이어(또는 마지막 레이어)의 파라미터를 새로운 파라미터 셋에 기초하여 업데이트하고, 마지막 레이어(또는 첫번째 레이어)의 파라미터를 임시 파라미터 3로 대체하여 보상할 수 있다. 여기서, 임시 파라미터 3는 업데이트가 필요한 모든 중간 레이어 및 첫번째 레이어(또는 마지막 레이어)의 파라미터를 새로운 파라미터로 교체하고 마지막 레이어(또는 첫번째 레이어)의 파라미터를 학습하여 획득될 수 있다.
도 3c는 본 개시의 다른 실시 예에 따른 제1 모드에서의 순차적인 파라미터 업데이트 동작을 설명하기 위한 도면이다.
도 3b에서는 첫번째 레이어 및 마지막 레이어의 파라미터가 가장 마지막으로 업데이트되는 것으로 설명하였으나, 반드시 이에 한정되는 것은 아니다.
예를 들어, 도 3c의 세번째 라인까지의 동작은 도 3b의 세번째 라인까지의 동작과 동일하지만, 도 3c의 네번째 라인에 도시된 바와 같이 중간 레이어 중 일부 레이어의 파라미터가 업데이트된 후 첫번째 레이어의 파라미터가 업데이트되고 도 3c의 마지막 라인에 도시된 바와 같이 중간 레이어 중 나머지 레이어의 파라미터가 업데이트된 후 마지막 레이어의 파라미터가 업데이트될 수 있다.
이 경우, 도 3c의 네번째 및 마지막 라인에서는 이미 첫번째 레이어의 파라미터가 업데이트된 상태이므로, 마지막 레이어의 파라미터 만이 보상 파라미터로 대체될 수 있다. 이어서, 마지막 레이어의 파라미터가 업데이트되면, 파라미터 업데이트 동작이 완료될 수 있다.
도 4는 본 개시의 다른 실시 예에 따른 제1 모드에서의 동작을 설명하기 위한 도면들이다.
도 3a 내지 도 3c에서는 하나의 레이어에서 이용되는 파라미터가 모두 업데이트된 후 다음 레이어의 파라미터가 업데이트되는 것으로 설명하였지만, 본 개시의 다른 실시 예에 따르면 적어도 두 개 이상의 레이어에서 이용되는 파라미터가 동시에 업데이트되는 것도 가능하다.
도 4의 첫번째 라인은 인공 지능 모델(310)에 포함된 복수의 레이어 각각에 기 셋팅된 기존 파라미터에 따라 영상 처리가 이루어지는 경우를 도시한 것이다.
이어서, 인공 지능 모델(310)에 포함된 복수의 레이어에서 이용되는 파라미터에 대한 업데이트가 필요한 이벤트가 발생될 수 있다. 예를 들어, 데이터 전송 속도가 변경되거나, 영상의 해상도, 데이터 량 또는 영상의 품질이 변경된 경우 인공 지능 모델(310)에 포함된 파라미터를 새로운 파라미터 셋에 기초하여 세팅해야 하는 경우가 발생할 수 있다.
이 경우, 도 4의 두번째 라인에 도시된 바와 같이 프로세서(120)는 적어도 하나의 프레임이 입력되는 동안 두번째 레이어(layer 2)의 파라미터 중 일부 및 네번째 레이어(layer 4)의 파라미터 중 일부를 업데이트하고, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 임시 파라미터 0으로 대체하여 보상할 수 있다. 예를 들어, 하나의 프레임이 입력되는 동안 두번째 레이어(layer 2)의 파라미터 중 일부 및 네번째 레이어(layer 4)의 파라미터 중 일부를 업데이트하고, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 모두 보상할 수 있다. 하지만, 경우에 따라 하나의 프레임이 입력되는 동안 두번째 레이어(layer 2)의 파라미터 중 일부 및 네번째 레이어(layer 4)의 파라미터 중 일부를 업데이트하고, 다음 프레임이 입력되는 동안 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 보상할 수도 있다. 이 경우, 임시 파라미터 0는 두번째 레이어(layer 2)의 파라미터 중 일부 및 네번째 레이어(layer 4)의 파라미터 중 일부를 새로운 파라미터로 교체하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 유지시킨 상태에서 첫번째 및 마지막 레이어의 파라미터를 학습하여 획득될 수 있다.
이어서, 도 4의 세번째 라인에 도시된 바와 같이 프로세서(120)는 다음 적어도 하나의 프레임이 입력되는 동안 두번째 레이어(layer 2)의 파라미터 중 나머지 및 네번째 레이어(layer 4)의 파라미터 중 나머지를 업데이트하고, 첫번째 레이어(layer 1) 및 마지막 레이어(layer N) 각각의 파라미터를 임시 파라미터 1로 대체하여 보상할 수 있다. 이 경우, 임시 파라미터 1은 두번째 레이어(layer 2)의 파라미터 및 네번째 레이어(layer 4)의 파라미터를 모두 새로운 파라미터로 교체하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 유지시킨 상태에서 첫번째 및 마지막 레이어의 파라미터를 학습하여 획득될 수 있다.
두번째 레이어(layer 2)의 파라미터 및 네번째 레이어(layer 4)의 파라미터가 모두 업데이트된 후 계속된 동작에 따라 첫번째 레이어(layer 1), 세번째 레이어(layer 3) 및 마지막 레이어(layer N)의 파라미터 업데이트만 남은 것으로 가정하도록 한다.
이 경우, 도 4의 네번째 라인에 도시된 바와 같이 프로세서(120)는 다음 적어도 하나의 프레임이 입력되는 동안 다른 레이어, 예를 들어 첫번째 레이어(layer 1)의 파라미터 중 일부 및 세번째 레이어(layer 3)의 파라미터 중 일부를 업데이트하고, 마지막 레이어(layer N)의 파라미터를 임시 파라미터 2로 대체하여 보상할 수 있다.
이어서, 도 4의 마지막 라인에 도시된 바와 같이 프로세서(120)는 다음 적어도 하나의 프레임이 입력되는 동안 첫번째 레이어(layer 1)의 파라미터 중 나머지 및 세번째 레이어(layer 3)의 파라미터 중 나머지를 업데이트하고, 마지막 레이어(layer N) 각각의 파라미터를 임시 파라미터 3로 대체하여 보상할 수 있다.
한편, 상술한 실시 예들에서는 파라미터 업데이트 및 파라미터 보상 동작이 특정 프레임 구간에 걸쳐 이루어지는 것으로 설명하였으나, 파라미터 업데이트 및 파라미터 보상 동작은 하나의 프레임 구간의 일부, 하나의 프레임 구간 전부, 또는 복수의 프레임 구간 등 필요한 시간에 기초하여 이루어질 수 있음은 물론이다.
도 5a 내지 도 5c는 본 개시의 다양한 실시 예에 따른 제2 모드에서의 동작을 설명하기 위한 도면들이다.
도 5a에 도시된 바와 같이 본 개시의 일 실시 예에 따르면, 프로세서(120)는 제2 모드에서 보간 처리된 영상을 인공 지능 모델에 입력하지 않고, 보간 처리된 영상 만을 이용하여 출력 영상을 생성할 수 있다. 여기서, 인공 지능 모델은 상술한 바와 같이 잔차 영상을 생성하는 모델을 의미하며, 제2 모드에서는 해당 인공 지능 모델을 바이패스하는 영상 처리 경로를 이용할 뿐이며, 경우에 따라서는 보간 처리된 영상에 대한 일종의 후처리가 수행될 수도 있음은 물론이다.
도 5b에 도시된 바와 같이 본 개시의 다른 실시 예에 따르면, 프로세서(120)는 제2 모드에서 보간 처리된 영상을 인공 지능 모델에 입력하되, 인공 지능 모델로부터 출력되는 잔차 영상을 이용하지 않고 보간 처리된 영상 만을 이용하여 출력 영상을 생성할 수 있다. 예를 들어, 프로세서(120)는 제2 모드에서 인공 지능 모델의 파라미터를 업데이트하지 않고 기존의 영상 처리 방식과 같이 보간 처리된 영상을 인공 지능 모델에 입력하되, 인공 지능 모델로부터 출력되는 잔차 영상을 이용하지 않고 출력 영상을 생성할 수 있다.
도 5c에 도시된 바와 같이 본 개시의 또 다른 실시 예에 따르면, 프로세서(120)는 제2 모드에서 입력 영상의 보간 처리와 병렬적으로 입력 영상을 인공 지능 모델에 입력하되, 인공 지능 모델로부터 출력되는 잔차 영상을 이용하지 않고 보간 처리된 영상 만을 이용하여 출력 영상을 생성할 수 있다. 다만, 또 다른 실시 예에 따르면, 제2 모드에서 입력 영상을 인공 지능 모델에 입력하지 않고, 보간 처리된 영상 만을 이용하여 출력 영상을 생성하거나, 입력 영상 및 보간 처리된 영상을 함께 이용하여 출력 영상을 생성할 수 있다.
도 6은 본 개시의 다른 실시 예에 따라 제1 모드 및 제2 모드를 혼합한 혼합 모드에서의 동작을 설명하기 위한 도면이다.
본 개시의 일 실시 예에 따른 혼합 모드에서 프로세서(120)는 인공 지능 모델의 파라미터 업데이트가 필요한 경우, 프로세서(120)는 우선 제2 모드로 동작할 수 있다. 즉, 인공 지능 모델에 보간 처리된 영상을 입력하지 않거나, 인공 지능 모델로부터 출력되는 잔차 영상을 이용하지 않고 보간 처리된 영상 만을 이용하여 출력 영상을 획득할 수 있다. 다만, 프로세서(120)는 제2 모드로 동작하는 동안 인공 지능 모델에 포함된 적어도 하나의 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 제2 모드를 제1 모드로 전환할 수 있다. 이어서, 프로세서(120)는 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 제2 모드에서 업데이트된 제1 파라미터 및 제2 모드에서 업데이트된 제2 파라미터에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
예를 들어, 도 6의 첫번째 라인은 인공 지능 모델(310)에 포함된 복수의 레이어 각각에 기 셋팅된 파라미터에 따라 영상 처리가 이루어지는 경우를 도시한 것이다.
이어서, 인공 지능 모델(310)에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터에 대한 업데이트가 필요한 이벤트가 발생될 수 있다. 예를 들어, 입력 영상의 데이터 전송 속도가 변경되거나, 입력 영상의 포맷, 해상도, 압축율, 품질, 데이터 양 등이 변경되어 인공 지능 모델(310)에 포함된 파라미터를 새로운 파라미터 셋에 기초하여 세팅해야 하는 경우가 발생할 수 있다.
이 경우, 프로세서(120)는 도 6의 두번째 라인에 도시된 바와 같이 제2 모드로 동작하고, 도 6의 세번째 라인에 도시된 바와 같이 제2 모드로 동작하는 동안 중간 레이어 중 적어도 하나, 예를 들어 두번째 레이어의 파라미터를 새로운 파라미터 셋에 기초하여 업데이트할 수 있다. 즉, 입력되는 영상 프레임에 대해서 보간 처리된 영상 프레임 만을 이용하여 출력 영상 프레임을 생성하면서 이와 별도로 인공 지능 모델(310)에 포함된 두번째 레이어의 파라미터를 업데이트할 수 있다.
이어서, 프로세서(120)는 도 6의 네번째 라인에 도시된 바와 같이 제2 모드를 제1 모드로 전환하고 중간 레이어 중 적어도 다른 하나, 예를 들어 네번째 레이어의 파라미터를 새로운 파라미터 셋에 기초하여 업데이트하면서, 첫번째 레이어 및 마지막 레이어의 파라미터를 임시 파라미터 0로 대체하여 보상할 수 있다. 이 경우, 제1 모드로 동작하고 있으므로 프로세서(120)는 보간 처리된 영상 뿐 아니라 인공 지능 모델(310)로부터 출력되는 보간 영상을 함께 이용하여 출력 영상을 획득할 수 있다.
이어서, 프로세서(120)는 도 6의 다섯번째 라인에 도시된 바와 같이 제1 모드에서 중간 레이어 중 적어도 또 다른 하나, 예를 들어 세번째 레이어의 파라미터를 새로운 파라미터 셋에 기초하여 추가적으로 업데이트하면서, 첫번째 레이어 및 마지막 레이어의 파라미터를 임시 파라미터 1로 대체하여 보상할 수 있다.
상술한 방식으로 업데이트가 필요한 중간 레이어의 파라미터가 모두 업데이트되면, 프로세서(120)는 도 6의 마지막 라인에 도시된 바와 같이 첫번째 및 마지막 레이어의 파라미터도 업데이트할 수 있다.
상술한 실시 예와 같이 프로세서(120)는 파라미터의 업데이트가 필요한 경우 제1 모드를 기본으로 하지만 특정 시점에서 제2 모드로 동작하는 혼합 모드로 동작할 수 있다. 이는 특정 시점에 제1 모드의 결과가 제2 모드의 결과보다 결과가 안 좋을 수 있기 때문이다. 이에 따라, 프로세서(120)는 제1 모드 및 제2 모드를 적절히 혼합하여 동작함으로써 출력 영상의 화질 열화를 최소화시킬 수 있다.
한편, 상술한 실시 예에서는 인공 지능 모델(310)이 한 개인 경우를 상정하여 설명하였으나, 다른 실시 예에 따르면 프로세서(120)가 복수의 인공 지능 모델을 순차적 또는 병렬적으로 동작시키도록 구현될 수 있다. 이 경우, 프로세서(120)는 복수의 인공 지능 모델 각각에 포함된 파라미터의 업데이트가 필요한 경우 상술한 다양한 실시 예에 따라 복수의 인공 지능 모델 각각에 포함된 파라미터의 업데이트를 순차적으로 수행하거나, 병렬적으로 수행할 수 있다. 예를 들어, 프로세서(120)는 제1 인공 지능 모델에 포함된 파라미터의 업데이트를 상술한 다양한 실시 예에 따라 수행한 후, 제2 인공 지능 모델에 포함된 파라미터의 업데이트를 상술한 다양한 실시 예에 따라 수행할 수 있다. 또는, 프로세서(120)는 제1 인공 지능 모델 및 제2 인공 지능 모델 각각에 포함된 파라미터의 업데이트를 병렬적으로 수행할 수 있다. 이 경우, 프로세서(120)는 제1 인공 지능 모델 및 제2 인공 지능 모델 각각에 대해 동일한 방식 또는 상이한 방식으로 파라미터 업데이트를 수행할 수 있다. 예를 들어, 프로세서(120)는 제1 인공 지능 모델에 대해서는 도 3b에 도시된 방식으로, 제2 인공 지능 모델에 대해서는 도 3c에 도시된 방식으로 파라미터 업데이트를 수행할 수 있다.
도 7은 본 개시의 일 실시 예에 따른 인공 지능 모델의 다른 예를 설명하기 위한 도면이다.
도 1 내지 도 6에서는 초해상도(Super resolution) 처리의 경우를 예를 들어 설명하였지만, 본 개시에 따른 실시 예는 해당 영상 처리 뿐 아니라, 인공 지능 모델을 이용하는 다양한 영상 처리에 적용될 수 있다. 예를 들어 Style Transfer 처리에도 본 개시에 따른 실시 예가 적용될 수 있다. Style transfer란, 두 영상(content image & style image)이 주어졌을 때 그 이미지의 주된 형태는 content image와 유사하게 유지하면서 스타일만 우리가 원하는 style image와 유사하게 바꾸는 처리를 의미한다.
예를 들어 도 7에 도시된 바와 같이 도 7에 도시된 바와 같은 복수의 레이어를 포함하는 CNN 기반의 인공 지능 모델(“Perceptual Losses for Real-Time Style Transfer”(Justin Johnson, Alexandre Alahi, and Li Fei-Fei))을 이용하여 style Transfer 처리를 수행할 수 있으며, 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나의 레이어에 대한 파라미터 업데이트가 필요한 경우, 예를 들어 적용 style 이 변경되는 경우, 본 개시에 따른 다양한 실시 예를 적용하여 파라미터를 업데이트할 수 있다.
도 8은 본 개시의 일 실시 예에 따른 프로세서의 구현 예를 설명하기 위한 도면이다.
본 개시의 일 실시 예에 따른 프로세서(120)는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서 또는 NPU와 같은 인공 지능 전용 프로세서일 수 있다.
다만, 본 개시의 다른 실시 예에 따르면, 프로세서(120)는 특정 인공 지능 모델의 처리에 특화된 전용 하드웨어로 설계될 수 있다. 예를 들어, Neural network가 복잡하고 실시간 동작이 중요한 경우는 주로 전용 하드웨어를 사용하게 되는데 이 경우 파라미터 업데이트 속도를 빠르게 구현하기가 더욱 어려울 수 있다. 이에 따라, 전용 하드웨어의 경우 파라미터를 내부 레지스터(register)에 저장하거나 고정된 값의 neural network 모델 만 동작하도록 구현될 수 있다. 하지만, 본 개시의 다양한 실시 예에 따르면, 프로세서(120)가 전용 하드웨어로 구현되더라도 파라미터 업데이트 속도를 빠르게 구현할 수 있게 된다.
도 8은 프로세서(120)가 전용 하드웨어로 설계된 경우의 예시를 도시한다. 예를 들어, 도 8에 도시된 전용 하드웨어(800)는 ASIC, FPGA 등의 하드웨어 칩으로 설계될 수 있다. 도시된 바와 같이 실시간 처리를 위해 외부 메모리, 예를 들어 dram의 latency를 고려하도록 구현되고, 중간 결과는 내부 메모리, 예를 들어 sram에 저장하여 처리하도록 구현될 수 있다.
도 9는 본 개시의 일 실시 예에 따른 전자 장치의 동작을 개략적으로 설명하기 위한 도면이다.
도 9에 따르면, 전자 장치(100)는 입력 영상에 대한 정보에 기초하여 인공 지능 모델에 포함된 복수의 레이어에서 이용되는 파라미터 셋에 대한 업데이트가 필요한지 여부를 판단한다.
전자 장치(100)는 업데이트가 필요하지 않은 경우 노멀 모드(Normal Mode)로 동작하고, 업데이트가 필요한 경우 업데이트 모드(Update Mode)로 동작할 수 있다.
여기서, 노멀 모드는 기 셋팅된 파라미터를 포함하는 인공 지능 모델을 이용하여 입력 영상을 처리하는 모드일 수 있다. 예를 들어, 전자 장치(100)는 노멀 모드에서 입력 영상을 보간 처리하고, 기 셋팅된 파라미터를 포함하는 인공 지능 모델에 보간 처리된 영상을 입력하여 획득된 잔차 영상 및 보간 처리된 영상에 기초하여 출력 영상을 획득할 수 있다.
업데이트 모드는 제1 모드 및 제2 모드를 포함할 수 있으며, 전자 장치(100)는 기존 파라미터 및 업데이트될 파라미터 간 차이에 기초하여 제1 모드 또는 제2 모드를 선택할 수 있다. 제1 모드 및 제2 모드에 대해서는 상기에서 자세히 설명하였으므로 설명을 생략하도록 한다.
이에 따라, 전자 장치(100)는 노멀 모드, 제1 모드 또는 제2 모드 중 어느 하나의 모드에 기초하여 입력 영상을 처리하여 출력 영상을 획득할 수 있다. 여기서, 출력 영상은 4K 또는 8K 이상의 고해상도 영상일 수 있다.
도 10은 본 개시의 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.
도 10에 따르면, 전자 장치(100’)는 메모리(110), 프로세서(120), 입력부(130), 디스플레이(140), 출력부(150) 및 사용자 인터페이스(160)를 포함한다. 도 10에 도시된 구성 중 도 2에 도시된 구성과 중복되는 구성에 대해서는 자세한 설명을 생략하도록 한다.
프로세서(120)는 경우에 따라 입력 영상의 보간 처리 전에 추가 전 처리를 수행할 수 있다. 일 예에 따라, 프로세서(120)는 입력 영상의 노이즈를 제거하는 프리 필터링을 추가적으로 수행할 수 있다. 예를 들어, 가우시안 필터와 같은 스무딩 필터(Smoothing Filter), 입력 영상을 기설정된 가이던스(guidance)에 대비시켜 필터링하는 가이디드(guided) 필터 등을 적용하여 두드러진 노이즈를 제거할 수 있다.
입력부(130)는 다양한 타입의 컨텐츠를 입력받는다. 예를 들어 입력부(130)는 AP 기반의 Wi-Fi(와이파이, Wireless LAN 네트워크), 블루투스(Bluetooth), 지그비(Zigbee), 유/무선 LAN(Local Area Network), WAN(Wide Area Network), 이더넷(Ethernet), IEEE 1394, HDMI(High-Definition Multimedia Interface), USB(Universal Serial Bus), MHL(Mobile High-Definition Link), AES/EBU(Audio Engineering Society/ European Broadcasting Union), 옵티컬(Optical), 코액셜(Coaxial) 등과 같은 통신 방식을 통해 외부 장치(예를 들어, 소스 장치), 외부 저장 매체(예를 들어, USB 메모리), 외부 서버(예를 들어 웹 하드) 등으로부터 스트리밍 또는 다운로드 방식으로 영상 신호를 입력받을 수 있다. 여기서, 영상 신호는 SD(Standard Definition), HD(High Definition), Full HD 또는 Ultra HD 영상 중 어느 하나의 디지털 영상 신호가 될 수 있으나 이에 한정되는 것은 아니다.
또한, 입력부(130)는 입력되는 영상의 정보에 대응되는 파라미터 셋, 일부 파라미터의 실시간 업데이트를 보상하기 위한 보상 파라미터 등 본 개시의 다양한 실시 예와 관련된 파라미터 정보를 외부 서버로부터 수신할 수 있다.
디스플레이(140)는 자발광 소자를 포함하는 디스플레이 또는, 비자발광 소자 및 백라이트를 포함하는 디스플레이로 구현될 수 있다. 예를 들어, LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, LED(Light Emitting Diodes), 마이크로 LED(micro LED), Mini LED, PDP(Plasma Display Panel), QD(Quantum dot) 디스플레이, QLED(Quantum dot light-emitting diodes) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(140) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 디스플레이(140)는 터치 센서와 결합된 터치 스크린, 플렉시블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 3차원 디스플레이(3D display), 복수의 디스플레이 모듈이 물리적으로 연결된 디스플레이 등으로 구현될 수 있다. 프로세서(120)는 상술한 다양한 실시 예에 따라 획득된 출력 영상을 출력하도록 디스플레이(140)를 제어할 수 있다. 여기서, 출력 영상은, 4K 또는 8K 이상의 고해상도 영상일 수 있다.
출력부(150)는 음향 신호를 출력한다. 예를 들어, 출력부(150)는 프로세서(120)에서 처리된 디지털 음향 신호를 아날로그 음향 신호로 변환하고 증폭하여 출력할 수 있다. 예를 들어, 출력부(150)는 적어도 하나의 채널을 출력할 수 있는, 적어도 하나의 스피커 유닛, D/A 컨버터, 오디오 앰프(audio amplifier) 등을 포함할 수 있다. 일 예에 따라 출력부(150)는 다양한 멀티 채널 음향 신호를 출력하도록 구현될 수 있다. 이 경우, 프로세서(120)는 입력 영상의 인핸스 처리에 대응되도록 입력된 음향 신호를 인핸스 처리하여 출력하도록 출력부(150)를 제어할 수 있다. 예를 들어, 프로세서(120)는 입력된 2채널 음향 신호를 가상의 멀티 채널(예를 들어, 5.1 채널) 음향 신호로 변환하거나, 전자 장치(100’)가 놓인 위치를 인식해 공간에 최적화된 입체 음향 신호로 처리하거나, 입력 영상의 타입(예를 들어 컨텐츠 장르)에 따라 최적화된 음향 신호를 제공할 수 있다.
사용자 인터페이스(160)는 버튼, 터치 패드, 마우스 및 키보드와 같은 장치로 구현되거나, 상술한 디스플레이 기능 및 조작 입력 기능도 함께 수행 가능한 터치 스크린, 리모콘 송수신부 등으로 구현될 수 있다. 리모콘 송수신부는 적외선 통신, 블루투스 통신 또는 와이파이 통신 중 적어도 하나의 통신 방식을 통해 외부 원격 제어 장치로부터 리모콘 신호를 수신하거나, 리모콘 신호를 송신할 수 있다.
전자 장치 (100’)는 구현 예에 따라 튜너 및 복조부를 추가적으로 포함할 수 있다. 튜너(미도시)는 안테나를 통해 수신되는 RF(Radio Frequency) 방송 신호 중 사용자에 의해 선택된 채널 또는 기 저장된 모든 채널을 튜닝하여 RF 방송 신호를 수신할 수 있다. 복조부(미도시)는 튜너에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조하고, 채널 복호화 등을 수행할 수도 있다. 일 실시 예에 따라 튜너를 통해 수신된 입력 영상은 복조부(미도시)를 통해 처리된 후, 본 개시의 일 실시 예에 따른 영상 처리를 위해 프로세서(120)로 제공될 수 있다.
도 11은 본 개시의 일 실시 예에 따른 서버의 구성을 나타내는 블럭도이다.
도 11에 따르면 본 개시의 일 실시 예에 따른 서버(200)는 메모리(210), 프로세서(220) 및 통신 인터페이스(230)를 포함한다.
메모리(210)의 구현 예는 전자 장치(100)의 메모리(110) 구현 예와 유사하므로 자세한 설명을 생략하도록 한다.
메모리(210)는 전자 장치(100)에서 이용되는 인공 지능 모델과 관련된 정보를 저장한다.
일 예에 따라, 메모리(210)는 전자 장치(100, 100')로 입력되는 입력 영상의 특성(예를 들어, 포맷, 해상도, 압축율 등), 입력 영상의 데이터 전송 속도 등에 따른 인공 지능 모델의 다양한 파라미터 셋을 저장할 수 있다. 여기서, 다양한 파라미터 셋은 입력되는 입력 영상의 특성, 예를 들어, 포맷, 해상도, 압축율. 품질, 데이터 양, 입력 영상의 데이터 전송 속도 등에 따라 인공 지능 모델을 학습하여 획득될 수 있다.
다른 예에 따라, 메모리(210)는 전자 장치(100, 100')에서 이용되는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 일부 레이어의 파라미터가 업데이트된 경우 이를 보상하기 위한 보상 파라미터를 저장할 수 있다. 보상 파라미터 또한 학습에 의해 획득될 수 있는데 이는 프로세서(220)의 동작에서 자세히 설명하도록 한다.
통신 인터페이스(220)는 전자 장치(100, 100')를 포함하는 다양한 외부 장치와 통신을 수행한다. 통신 인터페이스(220)의 구현 예는 전자 장치(100')의 입력부(130) 구현 예와 유사하므로 자세한 설명을 생략하도록 한다.
프로세서(230)는 서버(200)의 전반적인 동작을 제어한다. 프로세서(230)의 구현 예는 전자 장치(100, 100')의 프로세서(120) 구현 예와 유사하므로 자세한 설명을 생략하도록 한다.
프로세서(230)는 전자 장치(100, 100')로 입력되는 입력 영상의 특성, 예를 들어, 포맷, 해상도, 압축율, 품질, 데이터양, 입력 영상의 데이터 전송 속도 등에 따라 인공 지능 모델의 다양한 파라미터 셋을 획득하고, 획득된 파라미터 셋을 메모리(210)에 저장할 수 있다. 이 후, 프로세서(130)는 전자 장치(100, 100')의 요청 등 다양한 이벤트에 따라 메모리(210)에 저장된 파라미터 셋을 전자 장치(100. 100')로 전송하도록 통신 인터페이스(220)를 제어할 수 있다.
또한, 프로세서(230)는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터를 업데이트한 후, 나머지 레이어의 파라미터를 학습하여 보상 파라미터 셋을 획득할 수 있다. 이 경우, 프로세서(230)는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터가 새로운 파라미터로 업데이트되더라도 인공 지능 모델이 artifact가 없는 영상을 출력하도록 나머지 레이어의 파라미터를 학습할 수 있다. 예를 들어, 프로세서(230)는 특정 제1 중간 레이어의 파라미터를 새로운 파라미터로 업데이트하여 고정하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 고정시킨 후, 첫번째 및 마지막 레이어의 파라미터를 학습하여 대응되는 제1 보상 파라미터 셋을 획득할 수 있다. 또한, 프로세서(230)는 특정 제1 중간 레이어 뿐 아니라, 다른 제2 중간 레이어의 파라미터를 새로운 파라미터로 업데이트하여 고정하고 나머지 중간 레이어의 파라미터는 기존 파라미터로 고정시킨 후, 첫번째 및 마지막 레이어의 파라미터를 학습하여 대응되는 제2 보상 파라미터 셋을 획득할 수 있다. 이어서, 프로세서(230)는 획득된 보상 파라미터 셋을 메모리(210)에 저장할 수 있다.
이와 같이 프로세서(130)는 인공 지능 모델에 포함된 적어도 하나의 레이어의 파라미터가 업데이트된 경우, 나머지 레이어 중 적어도 하나를 통해 이를 보상하도록 나머지 레이어 중 적어도 하나의 대응되는 보상 파라미터 셋을 각 케이스 별로 학습하여 획득한 후, 메모리(210)에 저장할 수 있다.
이 후, 프로세서(130)는 전자 장치(100, 100')의 요청 등 다양한 이벤트에 따라 메모리(210)에 저장된 보상 파라미터를 전자 장치(100. 100')로 전송하도록 통신 인터페이스(220)를 제어할 수 있다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
도 12에 도시된 복수의 레이어를 포함하는 인공 지능 모델에 대한 정보를 저장하는 전자 장치의 제어 방법에 따르면, 우선 전자 장치(100, 100')는 입력 영상을 보간 처리한다(S1210). 여기서, 인공 지능 모델에 포함된 복수의 레이어 각각은, 상이한 파라미터를 포함하는 필터를 이용하여 보간 처리된 영상에 대한 잔차 영상을 생성할 수 있다.
이어서, 전자 장치(100, 100')는 인공 지능 모델에 포함된 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한지 여부를 식별한다(S1210).
파라미터의 업데이트가 필요한 것으로 식별되면(S1220:Y), 전자 장치(100)는 업데이트 모드, 즉 제1 모드 또는 제2 모드에 따라 출력 영상을 획득한다(S1230).
여기서, 제1 모드는, 파라미터가 실시간으로 업데이트되는 인공 지능 모델을 이용하여 처리된 영상, 예를 들어 잔차 영상 및 보간 처리된 영상에 기초하여 출력 영상을 획득하는 모드일 수 있다. 또한, 제2 모드는, 보간 처리된 영상에 기초하여 출력 영상을 획득하는 모드일 수 있다. 여기서, 출력 영상은, 4K 또는 8K 이상의 고해상도 영상일 수 있다.
한편, 파라미터의 업데이트가 필요하지 않은 것으로 식별되면(S1220:N), 전자 장치(100)는 노멀 모드에 따라 출력 영상을 획득한다. 여기서, 노멀 모드는 기존에 셋팅된 파라미터를 포함하는 인공 지능 모델에 보간 처리된 영상을 입력하여 획득된 잔차 영상 및 보간 처리된 영상에 기초하여 출력 영상을 획득하는 모드일 수 있다.
또한, 제1 모드 또는 제2 모드에 따라 입력 영상을 처리하는 단계(S1230)에서는, 복수의 레이어 중 적어도 하나에서 이용되는 필터의 파라미터에 대한 업데이트가 필요한 경우, 필터의 현재 파라미터 및 업데이트될 대상 파라미터 간 차이에 기초하여 제1 모드 또는 제2 모드를 선택할 수 있다.
또한, 제어 방법은, 제1 모드가 선택되면 복수의 레이어 중 적어도 하나의 레이어에서 이용되는 파라미터를 실시간으로 업데이트하고, 파라미터의 업데이트에 기초하여 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 실시간으로 보상하는 단계를 더 포함할 수 있다.
이 경우, 파라미터를 실시간으로 보상하는 단계에서는, 적어도 하나의 중간 레이어에서 이용되는 파라미터의 실시간 업데이트에 기초하여 복수의 레이어 중 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 파라미터를 실시간으로 보상하는 단계에서는, 제1 중간 레이어에서 이용되는 제1 파라미터가 실시간으로 업데이트되면, 제1 파라미터의 업데이트에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하고, 제1 중간 레이어가 업데이트된 후 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 제1 파라미터 및 제2 파라미터의 업데이트에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
또한, 제1 모드 또는 제2 모드에 따라 입력 영상을 처리하는 단계(S1230)에서는, 제2 모드로 동작하는 동안 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 제2 모드를 제1 모드로 전환하는 단계 및, 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 제1 파라미터 및 제2 파라미터의 업데이트에 기초하여 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상할 수 있다.
여기서, 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 보상하기 위한 보상 파라미터는, 적어도 하나의 중간 레이어가 업데이트된 파라미터를 포함하는 인공 지능 모델의 학습에 기초하여 획득될 수 있다.
또한, 제1 모드 또는 제2 모드에 따라 입력 영상을 처리하는 단계(S1230)에서는, 입력 영상의 데이터 전송 속도 또는 입력 영상에 대한 정보 중 적어도 하나에 기초하여 파라미터의 업데이트가 필요한지 여부를 식별할 수 있다.
상술한 다양한 실시 예들에 따르면, 인공 지능 모델에 포함된 복수의 레이어에서 이용되는 파라미터에 대한 업데이트가 필요한 경우 적은 하드웨어 자원으로 파라미터를 효과적으로 업데이트할 수 있게 된다. 또한, 파라미터 업데이트에 따라 발생될 수 있는 영상의 artifact를 최소한으로 감소시킬 수 있게 된다.
또한, 본 개시의 다양한 실시 예에 따르면, 입력 정보가 변경됨에 따라 파라미터 업데이트가 필요한 경우 복수의 모드 중 하나의 모드로 동작하므로, 디스플레이되는 영상의 화질에 기초하여 본 개시의 실시 예가 적용되었는지 여부를 식별할 수 있다. 예를 들어, 입력 정보가 변경됨에 따라 파라미터 업데이트가 필요한 경우 어느 경우, 예를 들어 제2 모드를 이용하는 경우에는 에지 처리, 텍스처 처리 등이 충분하지 않아 화질이 저하된 출력 영상이 디스플레이되고, 다른 경우, 예를 들어 제1 모드를 이용하는 경우에는 에지 처리, 텍스처 처리 등이 충분히 이루어져 화질이 향상된 출력 영상이 디스플레이되므로, 본 개시의 실시 예가 적용되었는지 여부를 식별할 수 있다.
본 개시의 다양한 실시 예들은 디스플레이 장치 뿐 아니라, 셋탑 박스와 같은 영상 수신 장치, 영상 처리 장치 등 영상 처리가 가능한 모든 전자 장치에 적용될 수 있음은 물론이다.
한편, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 설치 가능한 어플리케이션 또는 소프트웨어 형태로 구현될 수 있다. 또는 상술한 본 개시의 다양한 실시 예들에 따른 방법들은 딥 러닝 기반의 인공 신경망(또는 심층 인공 신경망) 즉, 학습 네트워크 모델을 이용하여 수행될 수 있다.
또한, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드 만으로도 구현될 수 있다.
또한, 상술한 본 개시의 다양한 실시 예들은 전자 장치에 구비된 임베디드 서버, 또는 영상 처리 장치의 외부 서버를 통해 수행되는 것도 가능하다.
한편, 본 개시의 일시 예에 따르면, 이상에서 설명된 다양한 실시 예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media)에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시 예들에 따른 영상 처리 장치(예: 영상 처리 장치(A))를 포함할 수 있다. 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 프로세서의 제어 하에 다른 구성요소들을 이용하여 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.
또한, 본 개시의 일 실시 예에 따르면, 이상에서 설명된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
또한, 상술한 다양한 실시 예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 해당 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시 예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 해당 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.
100: 전자 장치 110: 메모리
120: 프로세서

Claims (20)

  1. 복수의 레이어를 포함하는 인공 지능 모델에 관한 정보가 저장된 메모리; 및
    입력 영상을 보간 처리하고 상기 보간 처리된 영상을 상기 인공 지능 모델을 이용하여 처리한 출력 영상을 획득하는 프로세서;를 포함하며,
    상기 프로세서는,
    상기 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드로 동작하며,
    상기 제1 모드는, 상기 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리된 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며,
    상기 제2 모드는, 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하는, 전자 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 복수의 레이어 중 적어도 하나에서 이용되는 필터의 파라미터에 대한 업데이트가 필요한 경우, 상기 필터의 현재 파라미터 및 업데이트될 대상 파라미터 간 차이에 기초하여 상기 제1 모드 또는 상기 제2 모드를 선택하는, 전자 장치.
  3. 제1항에 있어서,
    상기 인공 지능 모델에 포함된 상기 복수의 레이어 각각은,
    상이한 파라미터를 포함하는 필터를 이용하여 상기 보간 처리된 영상에 대한 잔차 영상을 생성하며,
    상기 프로세서는,
    상기 인공 지능 모델로부터 출력되는 잔차 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하는, 전자 장치.
  4. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 모드가 선택되면 상기 복수의 레이어 중 적어도 하나의 레이어에서 이용되는 파라미터를 실시간으로 업데이트하고, 상기 파라미터의 업데이트에 기초하여 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 실시간으로 보상하는, 전자 장치.
  5. 제4항에 있어서,
    상기 프로세서는,
    상기 적어도 하나의 중간 레이어에서 이용되는 상기 파라미터의 실시간 업데이트에 기초하여 상기 복수의 레이어 중 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는, 전자 장치.
  6. 제5항에 있어서,
    상기 프로세서는,
    제1 중간 레이어에서 이용되는 제1 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하고,
    상기 제1 중간 레이어가 업데이트된 후 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는, 전자 장치.
  7. 제5항에 있어서,
    상기 프로세서는,
    상기 제2 모드로 동작하는 동안 상기 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 상기 제2 모드를 상기 제1 모드로 전환하며,
    상기 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는, 전자 장치.
  8. 제4항에 있어서,
    상기 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 보상하기 위한 보상 파라미터는,
    상기 적어도 하나의 중간 레이어가 상기 업데이트된 파라미터를 포함하는 상기 인공 지능 모델의 학습에 기초하여 획득되는, 전자 장치.
  9. 제1항에 있어서,
    상기 프로세서는,
    상기 입력 영상의 데이터 전송 속도 또는 상기 입력 영상에 대한 정보 중 적어도 하나에 기초하여 상기 파라미터의 업데이트가 필요한지 여부를 식별하는, 전자 장치.
  10. 제1항에 있어서,
    디스플레이;를 더 포함하며,
    상기 프로세서는,
    상기 출력 영상을 출력하도록 상기 디스플레이를 제어하며,
    상기 출력 영상은,
    4K 또는 8K 이상의 고해상도 영상인, 전자 장치.
  11. 복수의 레이어를 포함하는 인공 지능 모델에 대한 정보를 저장하는 전자 장치의 제어 방법에 있어서,
    입력 영상을 보간 처리하는 단계; 및
    상기 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드에 따라 출력 영상을 획득하는 단계;를 포함하며,
    상기 제1 모드는, 상기 보간 처리된 영상을 상기 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리한 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며,
    상기 제2 모드는, 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하는, 제어 방법.
  12. 제11항에 있어서,
    상기 입력 영상을 처리하는 단계는,
    상기 복수의 레이어 중 적어도 하나에서 이용되는 필터의 파라미터에 대한 업데이트가 필요한 경우, 상기 필터의 현재 파라미터 및 업데이트될 대상 파라미터 간 차이에 기초하여 상기 제1 모드 또는 상기 제2 모드를 선택하는, 제어 방법.
  13. 제11항에 있어서,
    상기 인공 지능 모델에 포함된 상기 복수의 레이어 각각은,
    상이한 파라미터를 포함하는 필터를 이용하여 상기 보간 처리된 영상에 대한 잔차 영상을 생성하며,
    상기 전자 장치는,
    상기 인공 지능 모델로부터 출력되는 잔차 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하는, 제어 방법.
  14. 제11항에 있어서,
    상기 제1 모드가 선택되면 상기 복수의 레이어 중 적어도 하나의 레이어에서 이용되는 파라미터를 실시간으로 업데이트하고, 상기 파라미터의 업데이트에 기초하여 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 실시간으로 보상하는 단계;를 더 포함하는, 전자 장치.
  15. 제14항에 있어서,
    상기 파라미터를 실시간으로 보상하는 단계는,
    상기 적어도 하나의 중간 레이어에서 이용되는 상기 파라미터의 실시간 업데이트에 기초하여 상기 복수의 레이어 중 첫번째 레이어 및 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는, 제어 방법.
  16. 제15항에 있어서,
    상기 파라미터를 실시간으로 보상하는 단계는,
    제1 중간 레이어에서 이용되는 제1 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하고,
    상기 제1 중간 레이어가 업데이트된 후 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는, 제어 방법.
  17. 제15항에 있어서,
    상기 입력 영상을 처리하는 단계는,
    상기 제2 모드로 동작하는 동안 상기 인공 지능 모델에 포함된 제1 중간 레이어에서 이용되는 제1 파라미터를 업데이트하고 상기 제2 모드를 상기 제1 모드로 전환하는 단계; 및
    상기 제1 모드에서 제2 중간 레이어에서 이용되는 제2 파라미터가 실시간으로 업데이트되면, 상기 제1 파라미터 및 상기 제2 파라미터의 업데이트에 기초하여 상기 첫번째 레이어 및 상기 마지막 레이어 각각에서 이용되는 파라미터를 실시간으로 보상하는 단계;를 포함하는, 제어 방법.
  18. 제14항에 있어서,
    상기 나머지 레이어 중 적어도 하나에서 이용되는 파라미터를 보상하기 위한 보상 파라미터는,
    상기 적어도 하나의 중간 레이어가 상기 업데이트된 파라미터를 포함하는 상기 인공 지능 모델의 학습에 기초하여 획득되는, 제어 방법.
  19. 제11항에 있어서,
    상기 입력 영상을 처리하는 단계는,
    상기 입력 영상의 데이터 전송 속도 또는 상기 입력 영상에 대한 정보 중 적어도 하나에 기초하여 상기 파라미터의 업데이트가 필요한지 여부를 식별하는, 제어 방법.
  20. 복수의 레이어를 포함하는 인공 지능 모델에 관한 정보를 저장하는 전자 장치의 프로세서에 의해 실행되는 경우 상기 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서, 상기 동작은,
    입력 영상을 보간 처리하는 단계; 및
    상기 복수의 레이어 중 적어도 하나에서 이용되는 파라미터의 업데이트가 필요한 경우 제1 모드 또는 제2 모드에 따라 출력 영상을 획득하는 단계;를 포함하며,
    상기 제1 모드는, 상기 보간 처리된 영상을 상기 파라미터가 업데이트되는 상기 인공 지능 모델을 이용하여 처리한 영상 및 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하며,
    상기 제2 모드는, 상기 보간 처리된 영상에 기초하여 상기 출력 영상을 획득하는, 비일시적 컴퓨터 판독 가능 매체.
KR1020190099609A 2019-08-14 2019-08-14 전자 장치 및 그 제어 방법 KR20210020387A (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
KR1020190099609A KR20210020387A (ko) 2019-08-14 2019-08-14 전자 장치 및 그 제어 방법
US16/720,433 US11100607B2 (en) 2019-08-14 2019-12-19 Electronic apparatus and control method for updating parameters of neural networks while generating high-resolution images
EP21182796.9A EP3907695B1 (en) 2019-08-14 2020-01-10 Electronic apparatus and control method thereof
EP20151293.6A EP3779862B1 (en) 2019-08-14 2020-01-10 Electronic apparatus and control method thereof
PCT/KR2020/001262 WO2021029505A1 (en) 2019-08-14 2020-01-28 Electronic apparatus and control method thereof
CN202010112631.8A CN112399120B (zh) 2019-08-14 2020-02-24 电子装置及其控制方法
JP2020066303A JP6978542B2 (ja) 2019-08-14 2020-04-01 電子装置及びその制御方法
US17/364,941 US11574385B2 (en) 2019-08-14 2021-07-01 Electronic apparatus and control method for updating parameters of neural networks while generating high-resolution images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190099609A KR20210020387A (ko) 2019-08-14 2019-08-14 전자 장치 및 그 제어 방법

Publications (1)

Publication Number Publication Date
KR20210020387A true KR20210020387A (ko) 2021-02-24

Family

ID=69159578

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190099609A KR20210020387A (ko) 2019-08-14 2019-08-14 전자 장치 및 그 제어 방법

Country Status (6)

Country Link
US (2) US11100607B2 (ko)
EP (2) EP3779862B1 (ko)
JP (1) JP6978542B2 (ko)
KR (1) KR20210020387A (ko)
CN (1) CN112399120B (ko)
WO (1) WO2021029505A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024043731A1 (ko) * 2022-08-24 2024-02-29 삼성전자 주식회사 인터폴레이션을 수행하는 전자 장치, 동작 방법, 및 저장 매체

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200137380A1 (en) * 2018-10-31 2020-04-30 Intel Corporation Multi-plane display image synthesis mechanism
CN110727633A (zh) * 2019-09-17 2020-01-24 广东高云半导体科技股份有限公司 基于SoC FPGA的边缘人工智能计算系统构架
TWI733341B (zh) * 2020-02-20 2021-07-11 瑞昱半導體股份有限公司 用於圖像放大與增強的方法與裝置
CN113707101B (zh) * 2021-08-23 2022-11-04 深圳创维-Rgb电子有限公司 一种Mini LED背光控制方法、装置及相关设备
CN115861343A (zh) * 2022-12-12 2023-03-28 中山大学·深圳 基于动态隐式图像函数的任意尺度图像表示方法及系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9819965B2 (en) 2012-11-13 2017-11-14 Intel Corporation Content adaptive transform coding for next generation video
US9153231B1 (en) 2013-03-15 2015-10-06 Amazon Technologies, Inc. Adaptive neural network speech recognition models
US20170127045A1 (en) * 2015-10-28 2017-05-04 Toppano Co., Ltd. Image calibrating, stitching and depth rebuilding method of a panoramic fish-eye camera and a system thereof
US11024009B2 (en) 2016-09-15 2021-06-01 Twitter, Inc. Super resolution using a generative adversarial network
CN108205813B (zh) * 2016-12-16 2022-06-03 微软技术许可有限责任公司 基于学习网络的图像风格化
JP6704583B2 (ja) 2016-12-27 2020-06-03 株式会社デンソーアイティーラボラトリ 学習システムおよび学習方法
US20180181864A1 (en) * 2016-12-27 2018-06-28 Texas Instruments Incorporated Sparsified Training of Convolutional Neural Networks
KR102592721B1 (ko) 2017-01-11 2023-10-25 한국전자통신연구원 이진 파라미터를 갖는 컨볼루션 신경망 시스템 및 그것의 동작 방법
US10586310B2 (en) 2017-04-06 2020-03-10 Pixar Denoising Monte Carlo renderings using generative adversarial neural networks
US10489887B2 (en) 2017-04-10 2019-11-26 Samsung Electronics Co., Ltd. System and method for deep learning image super resolution
US10176551B2 (en) * 2017-04-27 2019-01-08 Apple Inc. Configurable convolution engine for interleaved channel data
CN107087201B (zh) * 2017-05-10 2019-11-08 西安万像电子科技有限公司 图像处理方法和装置
CN109218727B (zh) * 2017-06-30 2021-06-25 书法报视频媒体(湖北)有限公司 视频处理的方法和装置
JP6925911B2 (ja) * 2017-08-30 2021-08-25 株式会社日立製作所 機械学習装置及び機械学習方法
US20190095794A1 (en) 2017-09-26 2019-03-28 Intel Corporation Methods and apparatus for training a neural network
US10776688B2 (en) 2017-11-06 2020-09-15 Nvidia Corporation Multi-frame video interpolation using optical flow
CN109862370A (zh) * 2017-11-30 2019-06-07 北京大学 视频超分辨率处理方法及装置
JP7242185B2 (ja) * 2018-01-10 2023-03-20 キヤノン株式会社 画像処理方法、画像処理装置、画像処理プログラム、および、記憶媒体
CN108259997B (zh) 2018-04-02 2019-08-23 腾讯科技(深圳)有限公司 图像相关处理方法及装置、智能终端、服务器、存储介质
CN109903221B (zh) 2018-04-04 2023-08-22 华为技术有限公司 图像超分方法及装置
CN108596841B (zh) 2018-04-08 2021-01-19 西安交通大学 一种并行实现图像超分辨率及去模糊的方法
CN109785279B (zh) * 2018-12-28 2023-02-10 江苏师范大学 一种基于深度学习的图像融合重建方法
US10997690B2 (en) * 2019-01-18 2021-05-04 Ramot At Tel-Aviv University Ltd. Method and system for end-to-end image processing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024043731A1 (ko) * 2022-08-24 2024-02-29 삼성전자 주식회사 인터폴레이션을 수행하는 전자 장치, 동작 방법, 및 저장 매체

Also Published As

Publication number Publication date
US11574385B2 (en) 2023-02-07
EP3779862A1 (en) 2021-02-17
EP3779862B1 (en) 2021-09-15
EP3907695A1 (en) 2021-11-10
CN112399120A (zh) 2021-02-23
WO2021029505A1 (en) 2021-02-18
US20210049740A1 (en) 2021-02-18
JP2021034009A (ja) 2021-03-01
US20210327027A1 (en) 2021-10-21
JP6978542B2 (ja) 2021-12-08
EP3907695B1 (en) 2022-09-28
US11100607B2 (en) 2021-08-24
CN112399120B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
CN112399120B (zh) 电子装置及其控制方法
US11861809B2 (en) Electronic apparatus and image processing method thereof
US11978178B2 (en) Electronic device, control method thereof, and system
US11893748B2 (en) Apparatus and method for image region detection of object based on seed regions and region growing
CN112866803B (zh) 电子装置及其控制方法
US11483585B2 (en) Electronic apparatus and controlling method thereof
KR102246954B1 (ko) 영상 처리 장치 및 그 영상 처리 방법
US20140267321A1 (en) Image Generation
US11436442B2 (en) Electronic apparatus and control method thereof
US11373280B2 (en) Electronic device and method of training a learning model for contrast ratio of an image
KR20210108027A (ko) 전자 장치 및 그 제어 방법
US20230386057A1 (en) Electronic apparatus and image processing method thereof
US20230045334A1 (en) Electronic device and operation method thereof
KR20240058071A (ko) 영상 처리 장치 및 그 영상 처리 방법
KR20220158525A (ko) 전자 장치 및 그 영상 처리 방법

Legal Events

Date Code Title Description
A201 Request for examination