KR20200073079A - 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 - Google Patents

기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 Download PDF

Info

Publication number
KR20200073079A
KR20200073079A KR1020180161366A KR20180161366A KR20200073079A KR 20200073079 A KR20200073079 A KR 20200073079A KR 1020180161366 A KR1020180161366 A KR 1020180161366A KR 20180161366 A KR20180161366 A KR 20180161366A KR 20200073079 A KR20200073079 A KR 20200073079A
Authority
KR
South Korea
Prior art keywords
frame
machine learning
output
reconstructed
unit
Prior art date
Application number
KR1020180161366A
Other languages
English (en)
Other versions
KR102192980B1 (ko
Inventor
신재섭
류성걸
손세훈
김형덕
김효성
Original Assignee
주식회사 픽스트리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 픽스트리 filed Critical 주식회사 픽스트리
Priority to KR1020180161366A priority Critical patent/KR102192980B1/ko
Priority to US17/413,947 priority patent/US11575897B2/en
Priority to PCT/KR2019/016719 priority patent/WO2020122481A2/ko
Publication of KR20200073079A publication Critical patent/KR20200073079A/ko
Application granted granted Critical
Publication of KR102192980B1 publication Critical patent/KR102192980B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 코덱 내에서 기계 학습을 통해 학습된 파라미터를 학습하여 인코딩 시 압축 과정에서 발생하는 영상의 품질 저하를 보상하는 기술적 사상에 관한 것으로서, 일실시예에 따른 영상 처리 장치는 입력된 원본 프레임을 저장하는 입력 프레임 버퍼, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 다중화 처리부를 포함하고, 상기 인코딩 처리부는, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 한다.

Description

기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법{Image processing device of learning parameter based on machine Learning and method of the same}
본 발명은 코덱 내에서 수행되는 기계 학습을 기반으로 학습된 파라미터를 학습하여 인코딩 시 압축 과정에서 발생하는 영상의 품질 저하를 보상하는 기술적 사상에 관한 것이다.
영상, 이미지 또는 소리 데이터를 생성할 때, 원래의 데이터양을 줄이기 위하여 데이터를 코드화하고 압축하는 것을 인코딩이라고 한다.
인코딩 기술은 영상을 원격지로 송출하는 등의 과정에서 수행될 수 있고, 원격지에서는 인코딩된 데이터를 디코딩하여 복원한다.
대부분의 인코딩 과정에서는 압축에 의해서 정보의 손실이 발생한다. 따라서, 이러한 손실에 의해 디코딩되는 영상은 원본 프레임의 품질보다 저하된 품질을 갖는다.
손실에 의한 품질 저하를 방지하기 위한 취지에서 현재에는 영상을 원본 수준으로 디코딩하려는 다양한 방식이 제시되고 있다.
그럼에도 불구하고, 영상의 인코딩이나 디코딩 시간을 크게 늘리지 않으면서 원본 프레임에 가까운 품질로 디코딩하는 기술은 부족한 실정이다. 최근 TV의 해상도가 높아지고 양질의 컨텐츠가 유통됨에 따라 인코딩과 디코딩에 따른 품질 열화를 줄이려는 니즈 역시 증가되는 추세이다.
한국등록특허 제10-1803471호 "컨볼루션 신경망 기반의 영상 패턴화를 이용한 딥러닝 시스템 및 이를 이용한 영상 학습방법" 한국등록특허 제10-1906796호 "딥러닝 기반 영상 분석 장치 및 영상 분석 방법" 한국공개특허 제10-2017-0070715호 "딥러닝 기반 영상 처리 장치 및 방법, 학습 장치"
본 발명은 인코딩 과정에서 손실되는 이미지의 품질을 코덱 내에서 수행되는 기계 학습에 기반하여 학습한 파라미터를 통해 보완하는 것을 목적으로 한다.
본 발명은 인코딩과 디코딩 중에 코덱 내에서 수행되는 기계 학습을 통해 파라미터를 학습하는 것을 목적으로 한다.
일실시예에 따른 영상 처리 장치는 입력된 원본 프레임을 저장하는 입력 프레임 버퍼, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 다중화 처리부를 포함하고, 상기 인코딩 처리부는, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 한다.
일실시예에 따른 상기 다중화 처리부는, 상기 출력된 필터 파라미터와 상기 다중화된 출력 스트림을 서로 연관지어 디코딩 측으로 전송되도록 처리할 수 있다.
일실시예에 따른 상기 인코딩 처리부는, 상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 프리딕션부, 상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 순방향 처리부, 상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 엔트로피 코딩부, 상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 역방향 처리부, 및 상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 기계 학습 인루프 필터부를 포함하고, 상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송될 수 있다.
일실시예에 따른 상기 기계 학습 인루프 필터부는, 상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 제1 기계 학습 추론부, 상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하고, 미리 설정된 기준에 따라 상기 산출된 오류값을 상기 기계 학습 추론부로 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 상기 기계 학습 추론부에 요청하고, 상기 업데이트된 필터 파라미터를 출력하는 오류 역전파부, 및 상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 제2 기계 학습 추론부를 포함할 수 있다.
일실시예에 따른 상기 기계 학습 인루프 필터부는, 상기 복원 프레임 및 상기 원본 프레임 중에서 적어도 하나를 복수의 부영상으로 분할하는 학습 부영상 분할부를 더 포함하고, 상기 제1 기계 학습 추론부는 상기 복원 프레임에서 분할된 복수의 부영상을 상기 기 학습된 파라미터로 각각 초기화 하여 기계 학습 추론하고, 상기 오류 역전파부는 상기 원본 프레임에서 분할된 복수의 부영상과 상기 복원 프레임에서 분할된 복수의 부영상을 비교하여 오류값을 산출할 수 있다.
일실시예에 따른 영상 처리 장치는 인코딩 장치로부터 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터를 추출하는 역다중화 처리부, 상기 추출된 입력 스트림을 저장하는 입력 스트림 버퍼, 상기 저장된 입력 스트림을 디코딩하여 출력 프레임을 생성하는 디코딩 처리부, 및 상기 생성된 출력 프레임을 저장하는 출력 프레임 버퍼를 포함하고, 상기 디코딩 처리부는, 상기 추출된 필터 파라미터를 복원 프레임에 적용해서 화질 개선 처리된 상기 출력 프레임을 생성하고, 상기 인코딩 장치는 저장된 원본 프레임과, 상기 원본 프레임으로부터 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 상기 필터 파라미터를 다중화하여 송출하는 것을 특징으로 한다.
일실시예에 따른 상기 디코딩 처리부는, 상기 수신된 입력 스트림을 엔트로피 디코딩 후 출력하는 엔트로피 디코딩 처리부, 상기 엔트로피 디코딩 처리된 스트림을 역양자화 및 역변환 처리하는 역방향 처리부, 및 상기 역양자화 및 역변환 처리된 스트림, 상기 역양자화 및 역변환 처리된 스트림에 상기 프리딕션 정보가 반영된 스트림, 엔트로피 디코딩 후 출력된 스트림을 입력으로 기계 학습 인루프 기반 필터링 처리하는 기계 학습 인루프 필터부를 포함할 수 있다.
일실시예에 따른 상기 기계 학습 인루프 필터부는, 상기 필터 파라미터를 디코딩하는 파라미터 정보 디코딩 처리부, 상기 추출된 필터 파라미터와, 기 학습된 필터 파라미터의 차이를 고려하여 파라미터를 업데이트 하는 파라미터 결정부, 및 상기 복원 프레임 버퍼에 저장된 복원 프레임에 상기 업데이트된 필터 파라미터를 적용해서 상기 복원 프레임에 대한 화질을 개선하도록 처리하는 기계 학습 추론부를 포함할 수 있다.
일실시예에 따른 영상 처리 장치의 동작 방법은 입력 프레임 버퍼에서, 입력된 원본 프레임을 저장하는 단계, 인코딩 처리부에서, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 단계, 출력 스트림 버퍼에서, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 단계, 다중화 처리부에서, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 단계를 포함하고, 상기 인코딩을 처리하는 단계는, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하는 단계를 포함하고, 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 한다.
일실시예에 따른 상기 인코딩을 처리하는 단계는, 상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 단계, 상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 단계, 상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 단계, 상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 단계, 및 상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 단계를 포함하고, 상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송될 수 있다.
일실시예에 따른 상기 학습된 필터 파라미터를 출력하는 단계는, 상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 단계, 상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하는 단계, 미리 설정된 기준에 따라 상기 산출된 오류값을 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하는 단계, 상기 업데이트된 필터 파라미터를 출력하는 단계, 및 상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 단계를 포함할 수 있다.
일실시예에 따르면, 인코딩 과정에서 손실되는 이미지의 품질을 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있다.
일실시예에 따르면, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.
도 1은 일실시예에 따른 영상 처리 장치 중에서 인코딩 측 시스템을 설명하는 도면이다.
도 2는 일실시예에 따른 기계 학습 인루프 필터부를 구체적으로 설명하는 도면이다.
도 3은 일실시예에 따른 영상 처리 장치 중에서 디코딩 측 시스템을 설명하는 도면이다.
도 4는 일실시예에 따른 기계 학습 인루프 필터부를 설명하는 도면이다.
도 5는 일실시예에 따른 영상 처리 장치의 동작 방법을 설명하는 도면이다.
도 6은 일실시예에 따른 영상 처리 장치의 동작 방법 중에서 인코딩을 보다 구체적으로 설명하는 도면이다.
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
본 명세서에서는 통상적인 기계 학습에 기반하여 본 발명의 컨셉을 설명하지만, 이는 딥러닝 또는 컨볼루션 뉴럴 네트워크 등의 다양한 학습 기술로 해석될 수 있다.
도 1은 일실시예에 따른 영상 처리 장치 중에서 인코딩 측 시스템을 설명하는 도면이다.
일실시예에 따른 영상 처리 장치(100)는 인코딩 과정에서 손실되는 이미지의 품질을 코덱 내에서 수행되는 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있다. 또한, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.
이를 위해, 일실시예에 따른 영상 처리 장치(100)는 제어 시스템(110)의 통제하에 동작하는 입력 제어부(120), 입력 프레임 버퍼(130), 인코딩 처리부(140), 출력 스트림 버퍼(150), 다중화 처리부(160), 출력 포맷팅 처리부(170) 중에서 적어도 일부의 구성요소들을 포함할 수 있다.
먼저, 일실시예에 따른 입력 제어부(120)는 입력되는 원본 프레임을 제어하여 입력 프레임 버퍼(130)에 저장할 수 있다.
다음으로, 인코딩 처리부(140)는 저장된 원본 프레임에 대한 인코딩을 처리할 수 있다. 인코딩 과정에서는 일반적으로 널리 사용되는 인코딩 알고리즘들이 다양하게 적용될 수 있다.
다음으로, 출력 스트림 버퍼(150)는 인코딩된 원본 프레임을 저장하고 출력 전 다중화를 위해 다중화 처리부(106)로 인코딩된 원본 프레임을 제공할 수 있다.
다중화 처리부(160)에서는 인코딩된 음성 정보, 영상 정보, 메타 정보 등을 다중화 처리하고, 출력 포맷팅 처리부(170)는 다중화 처리된 정보들을 출력을 위한 포맷으로 가공 처리하여 출력을 준비할 수 있다.
일례로 다중화 처리부(160)는 출력된 필터 파라미터와 다중화된 출력 스트림을 서로 연관지어 디코딩 측으로 전송되도록 출력 포맷팅 처리부(170)에 요청할 수 있다.
한편, 출력 스트림 버퍼(150)에 저장된 인코딩된 원본 프레임은 로컬에 위치하는 로컬 디코딩 처리부를 통해 디코딩될 수 있다. 로컬 디코딩 처리부는 프레임의 인코딩 시 인접한 프레임을 참조하기 위해 인코딩 측에 위치하는 로컬 디코더의 기능도 수행할 수 있다.
일실시예에 따른 인코딩 처리부(140)는 저장된 원본 프레임과, 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력할 수 있다. 또한, 디코딩 측 장치에서는 출력된 필터 파라미터를 이용해서 출력 스트림을 디코딩할 수 있다.
보다 구체적으로, 인코딩 처리부(140)는 프리딕션부(141), 순방향 처리부(142), 엔트로피 코딩부(143), 역방향 처리부(144), 기계 학습 인루프 필터부(145), 및 피쳐버퍼(146)를 포함할 수 있다.
먼저, 프리딕션부(141)는 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영할 수 있다.
또한, 순방향 처리부(142)는 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리할 수 있다.
엔트로피 코딩부(143)는 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력할 수 있다.
역방향 처리부(144)는 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 원본 프레임에 상응하는 복원 프레임을 생성할 수 있다.
기계 학습 인루프 필터부(145)는 입력 프레임 버퍼에 저장된 원본 프레임과, 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력할 수 있다. 기계 학습 인루프 필터부(145)에 대해서는 추후 도 2를 통해 상세하게 설명한다.
피쳐버퍼(146)는 버퍼로써 동작하며 필터링된 복원 프레임을 저장할 수 있다.
출력된 복원 프레임은 프리딕션 정보에 반영되고, 출력된 필터 파라미터는 디코딩 측으로 전송될 수 있다.
본 발명은 코덱 내에서 적용될 수 있다. 즉, 코덱 내에서 기계 학습을 적용함으로써 화질을 개선할 수 있다.
특히, 인접한 피쳐들을 다음 번 프리딕션으로 사용하기 위해, 인코딩 처리부(140)에서 역변화, 역양자화를 통해 프레임을 복원하게 되고, 복원된 프레임을 피쳐버퍼(146)에 기록했다가 다음 번 프레임에 대해 기 저장된 복원된 프레임을 프리딕션으로 사용할 수 있다.
이는 복원된 프레임 자체를 필터링을 해서 다음 번 예측에서 사용하기 좋게 할 수 있다.
이와 유사한 기술로서, H.264에서는 디블로킹 필터가 도입, HEVC에서는 SAO 픽셀 단위로 미세조정하는 알고리즘이 있다.
본 발명은 이들을 기계 학습 기반의 필터인 기계 학습 인루프 필터부(145)로 대체할 수 있다.
기계 학습 인루프 필터부(145)는 복원된 프레임이 있으면, 이 복원된 프레임을 인코딩에 의해서 화질이 왜곡되기 이전의 원본 프레임으로 변환하는 필터를 기계 학습 기반으로 학습할 수 있다.
기계 학습 인루프 필터부(145)는 원본 프레임과 복원 프레임의 필터의 차이를 최소화 하는 필터를 학습하고, 그 학습된 파라미터를 엔트로피 코딩부(143)에 같이 전달해서 전송할 수 있다.
기계 학습 인루프 필터가 적용된 필터링된 피쳐가 피쳐버퍼(146)에 저장되고, 다음 번 프레임을 프리딕션 하기 위한 피쳐로 사용될 수 있다.
결국, 본 발명에 따른 영상 처리 장치에 따르면 전체적인 시스템의 인코딩의 효율이 높아질 수 있다.
도 2는 일실시예에 따른 기계 학습 인루프 필터부(200)를 구체적으로 설명하는 도면이다.
일실시예에 따른 기계 학습 인루프 필터부(200)는 제1 기계 학습 추론부(202), 오류 역전파부(203), 및 제2 기계 학습 추론부(205)를 포함할 수 있다.
먼저, 일실시예에 따른 제1 기계 학습 추론부(202)는 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론할 수 있다.
다음으로, 일실시예에 따른 오류 역전파부(203)는 기계 학습 추론된 복원 프레임과 입력된 원본 프레임을 비교하여 오류값을 산출하고, 미리 설정된 기준에 따라 산출된 오류값을 기계 학습 추론부(202)로 역전파하여 기계 학습 추론을 다시 수행하여 기 학습된 필터 파라미터를 업데이트 하도록 기계 학습 추론부(202)에 요청할 수 있다. 또한, 오류 역전파부(203)는 업데이트된 필터 파라미터를 출력할 수 있다.
또한, 제2 기계 학습 추론부(205)는 오류 역전파부(203)로부터 출력된 필터 파라미터를 이용해서 입력되는 복원 프레임을 기계 학습 추론하여 필터링하여 필터링된 복원 프레임을 출력할 수 있다.
일실시예에 따른 기계 학습 인루프 필터부(200)는 옵셔널한 구성요소로서 입력되는 복원 프레임의 크기를 고려하여 복원 프레임을 여러 프레임들로 분할하는 학습 부영상 분할부(201)를 포함할 수도 있다. 또한, 입력되는 원본 프레임의 크기를 고려하여 원본 프레임을 여러 프레임들로 분할하는 학습 부영상 분할부(204)를 포함할 수도 있다.
도 3는 일실시예에 따른 영상 처리 장치 중에서 디코딩 측 시스템을 설명하는 도면이다.
일실시예에 따른 영상 처리 장치(300)는 인코딩 과정에서 손실되는 이미지의 품질을 코덱 내에서 수행되는 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있고, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.
이를 위해, 일실시예에 따른 영상 처리 장치(300)는 제어 시스템(310)의 통제하에 동작하는 입력 제어부(320), 역다중화 처리부(330), 입력 스트림 버퍼(340), 디코딩 처리부(350), 출력 프레임 버퍼(360), 및 출력 제어부(370)를 포함할 수 있다.
먼저, 일실시예에 따른 입력 제어부(320)는 인코더로부터 전달되는 입력 스트림을 제어하여 역다중화 처리부(330)의 입력을 전달할 수 있다.
역다중화 처리부(330)는 인코딩 장치로부터 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터 정보를 추출할 수 있다.
필터 파라미터 정보는 업데이트된 파라미터 또는 기 학습된 필터 파라미터와 업데이트된 필터 파라미터의 차이값을 포함할 수도 있다.
다음으로, 입력 스트림 버퍼(340)는 추출된 입력 스트림을 저장할 수 있다.
또한, 디코딩 처리부(350)는 저장된 입력 스트림을 디코딩하여 복원 프레임을 생성하여 복원 프레임 버퍼(360)에 저장할 수 있다.
일실시예에 따른 디코딩 처리부(350)에서는 입력 스트림을 원본 수준으로 품질 향상 시킬 수 있다. 일례로, 디코딩 처리부(350)는 추출된 필터 파라미터를 복원 프레임에 적용해서 화질 개선 처리된 출력 프레임을 생성할 수 있다.
구체적으로, 디코딩 처리부(350)는, 엔트로피 디코딩부(351), 역방향 처리부(352), 프리딕션부(353), 및 기계 학습 인루프 필터부(354)를 포함할 수 있다.
먼저, 엔트로피 디코딩부(351)는 수신된 입력 스트림을 엔트로피 디코딩 후 출력할 수 있다.
다음으로, 역방향 처리부(352)는 상기 엔트로피 디코딩 처리된 스트림을 역양자화 및 역변환 처리할 수 있다.
또한, 프리딕션부(353)는 저장된 피쳐를 활용해서 스트림에 피쳐를 적용할 수 있다.
다음으로, 기계 학습 인루프 필터부(354)는 역양자화 및 역변환 처리된 스트림, 역양자화 및 역변환 처리된 스트림에 상기 프리딕션 정보가 반영된 스트림, 엔트로피 디코딩 후 출력된 스트림을 입력으로 기계 학습 인루프 기반 필터링 처리하여 화질을 개선할 수 있다.
기계 학습 인루프 필터부(354)는 이하 도 6을 통해 보다 구체적으로 설명한다.
도 6은 일실시예에 따른 기계 학습 인루프 필터부(400)를 설명하는 도면이다.
일실시예에 따른 기계 학습 인루프 필터부(400)는 파라미터 정보 디코딩 처리부(410), 파라미터 결정부(420), 기계 학습 추론부(430)를 포함할 수 있다.
일실시예에 따른 파라미터 정보 디코딩 처리부(410)는 필터 파라미터 정보를 디코딩하여 필터 파라미터를 추출할 수 있다. 본 발명에 따른 필터 파라미터 정보는 업데이트된 필터 파라미터일 수 있고, 기 산출된 필터 파라미터와 업데이트된 필터 파라미터의 차이에 대한 정보일 수 있다.
일실시예에 따른 파라미터 결정부(420)는 추출된 필터 파라미터와, 기 학습된 필터 파라미터의 차이를 고려하여 기계 학습을 위한 필터 파라미터를 선택할 수 있다.
또한, 일실시예에 따른 기계 학습 추론부(430)는 선택된 복원 프레임 버퍼에 저장된 복원 프레임에 선택된 필터 파라미터를 적용할 수 있다.
결국, 기계 학습 추론부(430)는 필터링된 복원 프레임을 출력함으로써, 복원 프레임에 대한 화질을 개선할 수 있다.
도 5는 일실시예에 따른 영상 처리 장치의 동작 방법을 설명하는 도면이다.
일실시예에 따른 영상 처리 장치의 동작 방법은 입력된 원본 프레임을 저장하고(단계 501), 저장된 원본 프레임에 대한 인코딩을 처리할 수 있다(단계 502).
특히, 일실시예에 따른 영상 처리 장치의 동작 방법은 화질 개선을 위한 디코딩을 고려하여 저장된 원본 프레임과, 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력할 수 있다.
또한, 영상 처리 장치의 동작 방법은 출력 스트림 버퍼를 통해 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하고(단계 503), 다중화 처리부를 통해 출력 스트림을 다중화하여 송출하도록 제어할 수 있다(단계 504).
디코딩 측 장치에서는 출력된 필터 파라미터를 이용해서 출력 스트림을 디코딩하여 원본 프레임과 비슷한 수준의 영상을 출력할 수 있다.
도 6은 일실시예에 따른 영상 처리 장치의 동작 방법 중에서 인코딩을 보다 구체적으로 설명하는 도면이다.
일실시예에 따른 영상 처리 장치의 동작 방법은 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영할 수 있다(단계 601).
영상 처리 장치의 동작 방법은 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리할 수 있다(단계 602).
영상 처리 장치의 동작 방법은 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력 할 수 있다(단계 602).
또한, 영상 처리 장치의 동작 방법은 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성할 수 있다(단계 603).
영상 처리 장치의 동작 방법은 입력 프레임 버퍼에 저장된 원본 프레임과, 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력할 수 있다(단계 604).
특히, 영상 처리 장치의 동작 방법은 학습된 필터 파라미터를 출력하기 위해, 오류값을 산출할 수 있다.
보다 구체적으로, 영상 처리 장치의 동작 방법은 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하고, 기계 학습 추론된 복원 프레임과 입력된 원본 프레임을 비교하여 오류값을 산출할 수 있다. 또한, 영상 처리 장치의 동작 방법은 미리 설정된 기준에 따라 산출된 오류값을 역전파하여 기계 학습 추론을 다시 수행하여 기 학습된 필터 파라미터를 업데이트 하도록 요청할 수 있다.
결국, 영상 처리 장치의 동작 방법은 업데이트된 필터 파라미터를 출력하고, 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링에 이용할 수 있다.
또한, 출력된 복원 프레임은 프리딕션 정보에 반영되고, 출력된 필터 파라미터는 디코딩 측으로 전송할 수 있다.
결국, 본 발명을 이용하는 경우 인코딩 과정에서 손실되는 이미지의 품질을 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있다. 뿐만 아니라, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (13)

  1. 입력된 원본 프레임을 저장하는 입력 프레임 버퍼;
    상기 저장된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부;
    상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼;
    상기 출력 스트림을 다중화하여 송출하도록 제어하는 다중화 처리부
    를 포함하고,
    상기 인코딩 처리부는,
    상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 하는 영상 처리 장치.
  2. 제1항에 있어서,
    상기 다중화 처리부는,
    상기 출력된 필터 파라미터와 상기 다중화된 출력 스트림을 서로 연관지어 디코딩 측으로 전송되도록 처리하는 영상 처리 장치.
  3. 제1항에 있어서,
    상기 인코딩 처리부는,
    상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 프리딕션부;
    상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 순방향 처리부;
    상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 엔트로피 코딩부;
    상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 역방향 처리부
    상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 기계 학습 인루프 필터부
    를 포함하고,
    상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송되는 것을 특징으로 하는 영상 처리 장치.
  4. 제3항에 있어서,
    상기 기계 학습 인루프 필터부는,
    상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 제1 기계 학습 추론부;
    상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하고, 미리 설정된 기준에 따라 상기 산출된 오류값을 상기 기계 학습 추론부로 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 상기 기계 학습 추론부에 요청하고, 상기 업데이트된 필터 파라미터를 출력하는 오류 역전파부; 및
    상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 제2 기계 학습 추론부
    를 포함하는 영상 처리 장치.
  5. 제4항에 있어서,
    상기 기계 학습 인루프 필터부는,
    상기 복원 프레임 및 상기 원본 프레임 중에서 적어도 하나를 복수의 부영상으로 분할하는 학습 부영상 분할부
    를 더 포함하고,
    상기 제1 기계 학습 추론부는 상기 복원 프레임에서 분할된 복수의 부영상을 상기 기 학습된 필터 파라미터로 각각 초기화 하여 기계 학습 추론하고,
    상기 오류 역전파부는 상기 원본 프레임에서 분할된 복수의 부영상과 상기 복원 프레임에서 분할된 복수의 부영상을 비교하여 오류값을 산출하는 영상 처리 장치.
  6. 인코딩 장치로부터 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터를 추출하는 역다중화 처리부;
    상기 추출된 입력 스트림을 저장하는 입력 스트림 버퍼;
    상기 저장된 입력 스트림을 디코딩하여 출력 프레임을 생성하는 디코딩 처리부;
    상기 생성된 출력 프레임을 저장하는 출력 프레임 버퍼
    를 포함하고,
    상기 디코딩 처리부는,
    상기 추출된 필터 파라미터를 복원 프레임에 적용해서 화질 개선 처리된 상기 출력 프레임을 생성하고,
    상기 인코딩 장치는 저장된 원본 프레임과, 상기 원본 프레임으로부터 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 상기 필터 파라미터를 다중화하여 송출하는 것을 특징으로 하는 영상 처리 장치.
  7. 제6항에 있어서,
    상기 디코딩 처리부는,
    상기 수신된 입력 스트림을 엔트로피 디코딩 후 출력하는 엔트로피 디코딩 처리부;
    상기 엔트로피 디코딩 처리된 스트림을 역양자화 및 역변환 처리하는 역방향 처리부; 및
    상기 역양자화 및 역변환 처리된 스트림, 상기 역양자화 및 역변환 처리된 스트림에 상기 프리딕션 정보가 반영된 스트림, 엔트로피 디코딩 후 출력된 스트림을 입력으로 기계 학습 인루프 기반 필터링 처리하는 기계 학습 인루프 필터부
    를 포함하는 영상 처리 장치.
  8. 제7항에 있어서,
    상기 기계 학습 인루프 필터부는,
    상기 필터 파라미터를 디코딩하는 파라미터 정보 디코딩 처리부;
    상기 추출된 필터 파라미터와, 기 학습된 필터 파라미터의 차이를 고려하여 기계 학습을 위한 필터 파라미터를 선택 하는 파라미터 결정부; 및
    상기 복원 프레임 버퍼에 저장된 복원 프레임에 상기 선택된 필터 파라미터를 적용해서 상기 복원 프레임에 대한 화질을 개선하도록 처리하는 기계 학습 추론부
    를 포함하는 영상 처리 장치.
  9. 입력된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부;
    상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼;
    상기 출력 스트림을 다중화하여 저장매체에 전달하도록 제어하는 다중화 처리부
    를 포함하고,
    상기 인코딩 처리부는,
    상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하고, 상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하며, 상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하고, 상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하며, 상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하고, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 상기 저장매체에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하고, 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터를 추출하는 것을 특징으로 하는 영상 처리 장치.
  10. 입력 프레임 버퍼에서, 입력된 원본 프레임을 저장하는 단계;
    인코딩 처리부에서, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 단계;
    출력 스트림 버퍼에서, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 단계;
    다중화 처리부에서, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 단계
    를 포함하고,
    상기 인코딩을 처리하는 단계는,
    상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하는 단계
    를 포함하고,
    디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 하는 영상 처리 장치의 동작 방법.
  11. 제10항에 있어서,
    상기 인코딩을 처리하는 단계는,
    상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 단계;
    상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 단계;
    상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 단계;
    상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 단계; 및
    상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 단계
    를 포함하고,
    상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송되는 것을 특징으로 하는 영상 처리 장치의 동작 방법.
  12. 제11항에 있어서,
    상기 학습된 필터 파라미터를 출력하는 단계는,
    상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 단계;
    상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하는 단계;
    미리 설정된 기준에 따라 상기 산출된 오류값을 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하는 단계;
    상기 업데이트된 필터 파라미터를 출력하는 단계; 및
    상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 단계
    를 포함하는 영상 처리 장치의 동작 방법.
  13. 제12항에 있어서,
    상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하는 단계는,
    상기 산출된 오류값이 기준값 이상인 경우에 상기 산출된 오류값을 역전파하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하거나, 상기 산출된 오류값이 상기 기준값 이하인 경우에 업데이트된 필터 파라미터를 출력하도록 요청하는 단계
    를 포함하는 영상 처리 장치의 동작 방법.
KR1020180161366A 2018-12-13 2018-12-13 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 KR102192980B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020180161366A KR102192980B1 (ko) 2018-12-13 2018-12-13 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법
US17/413,947 US11575897B2 (en) 2018-12-13 2019-11-29 Image processing apparatus and operation method for learning parameiers based on machine learning
PCT/KR2019/016719 WO2020122481A2 (ko) 2018-12-13 2019-11-29 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180161366A KR102192980B1 (ko) 2018-12-13 2018-12-13 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법

Publications (2)

Publication Number Publication Date
KR20200073079A true KR20200073079A (ko) 2020-06-23
KR102192980B1 KR102192980B1 (ko) 2020-12-18

Family

ID=71076909

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180161366A KR102192980B1 (ko) 2018-12-13 2018-12-13 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법

Country Status (3)

Country Link
US (1) US11575897B2 (ko)
KR (1) KR102192980B1 (ko)
WO (1) WO2020122481A2 (ko)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120100448A (ko) * 2011-03-04 2012-09-12 (주)스프링웨이브 머신 러닝을 이용한 동영상 압축 기법 및 장치
KR20170070715A (ko) 2015-12-14 2017-06-22 삼성전자주식회사 딥러닝 기반 영상 처리 장치 및 방법, 학습 장치
KR101803471B1 (ko) 2016-02-15 2017-12-01 성균관대학교 산학협력단 컨볼루션 신경망 기반의 영상 패턴화를 이용한 딥러닝 시스템 및 이를 이용한 영상 학습방법
KR20180001428A (ko) * 2016-06-24 2018-01-04 한국과학기술원 Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치
KR20180003609A (ko) * 2015-05-11 2018-01-09 넷플릭스, 인크. 지각 비디오 품질을 예측하기 위한 기술
KR20180052651A (ko) * 2015-09-03 2018-05-18 미디어텍 인크. 비디오 코딩에서의 신경망 기반 프로세싱의 방법 및 장치
KR20180100976A (ko) * 2017-03-03 2018-09-12 한국전자통신연구원 딥 신경망 기반 블러 영상 학습을 이용한 영상 부호화/복호화 방법 및 장치
KR101906796B1 (ko) 2017-07-03 2018-10-11 한국씨텍(주) 딥러닝 기반 영상 분석 장치 및 영상 분석 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY186413A (en) * 2012-09-28 2021-07-22 Sony Corp Image processing device and method
US10542262B2 (en) 2016-11-15 2020-01-21 City University Of Hong Kong Systems and methods for rate control in video coding using joint machine learning and game theory
KR101990092B1 (ko) * 2017-03-24 2019-06-17 주식회사 엔씨소프트 영상 압축 장치 및 방법
KR102053242B1 (ko) 2017-04-26 2019-12-06 강현인 압축 파라미터를 이용한 영상 복원용 머신러닝 알고리즘 및 이를 이용한 영상 복원방법
GB2611192B (en) * 2018-01-26 2023-06-14 Mediatek Inc Method and apparatus of neural networks with grouping for video coding
US11889070B2 (en) * 2018-03-23 2024-01-30 Sharp Kabushiki Kaisha Image filtering apparatus, image decoding apparatus, and image coding apparatus

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120100448A (ko) * 2011-03-04 2012-09-12 (주)스프링웨이브 머신 러닝을 이용한 동영상 압축 기법 및 장치
KR20180003609A (ko) * 2015-05-11 2018-01-09 넷플릭스, 인크. 지각 비디오 품질을 예측하기 위한 기술
KR20180052651A (ko) * 2015-09-03 2018-05-18 미디어텍 인크. 비디오 코딩에서의 신경망 기반 프로세싱의 방법 및 장치
KR20170070715A (ko) 2015-12-14 2017-06-22 삼성전자주식회사 딥러닝 기반 영상 처리 장치 및 방법, 학습 장치
KR101803471B1 (ko) 2016-02-15 2017-12-01 성균관대학교 산학협력단 컨볼루션 신경망 기반의 영상 패턴화를 이용한 딥러닝 시스템 및 이를 이용한 영상 학습방법
KR20180001428A (ko) * 2016-06-24 2018-01-04 한국과학기술원 Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치
KR20180100976A (ko) * 2017-03-03 2018-09-12 한국전자통신연구원 딥 신경망 기반 블러 영상 학습을 이용한 영상 부호화/복호화 방법 및 장치
KR101906796B1 (ko) 2017-07-03 2018-10-11 한국씨텍(주) 딥러닝 기반 영상 분석 장치 및 영상 분석 방법

Also Published As

Publication number Publication date
WO2020122481A2 (ko) 2020-06-18
WO2020122481A3 (ko) 2020-08-06
US20220086442A1 (en) 2022-03-17
WO2020122481A9 (ko) 2020-09-24
KR102192980B1 (ko) 2020-12-18
US11575897B2 (en) 2023-02-07

Similar Documents

Publication Publication Date Title
KR101974261B1 (ko) Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치
KR101644208B1 (ko) 이전에 계산된 모션 정보를 이용하는 비디오 인코딩
US8315304B2 (en) Method and apparatus for encoding and decoding transform coefficients
US8320448B2 (en) Encoder with multiple re-entry and exit points
US20060233250A1 (en) Method and apparatus for encoding and decoding video signals in intra-base-layer prediction mode by selectively applying intra-coding
US7702017B2 (en) Moving picture encoding apparatus, moving picture encoding method, moving picture encoding program, moving picture decoding apparatus, moving picture decoding method, and moving picture decoding program
WO2017033560A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP2005039837A (ja) 映像雑音除去方法及び装置
KR101633459B1 (ko) 컬러 간의 상관 관계를 이용한 영상 데이터 인코딩 장치 및 방법, 그리고 영상 데이터 디코딩 장치 및 방법
JP2023527663A (ja) ニューラル画像圧縮における画像置換を用いたコンテンツ適応型オンライン訓練
KR102212442B1 (ko) 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법
JP2001519988A (ja) ビデオデータから符号化パラメータを抽出するシステム
CN108353180B (zh) 具有延迟重构的视频编码
WO2006109985A1 (en) Method and apparatus for encoding and decoding video signals in intra-base-layer prediction mode by selectively applying intra-coding
CN115529457B (zh) 基于深度学习的视频压缩方法和装置
KR102192980B1 (ko) 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법
JP2023528176A (ja) ビデオ符号化のための方法、装置及びコンピュータプログラム
WO2011161823A1 (ja) 動画像符号化方法および復号方法
KR20240068012A (ko) 영상 코딩을 위한 영상 처리 방법 및 이를 수행하는 전자 장치
EP4369710A1 (en) Method and device with image processing
JP6055268B2 (ja) 色変換装置、色復元装置およびそれらのプログラム
JP2011109390A (ja) 画像符号化装置、画像符号化方法、画像復号装置、及び、画像復号方法
US20240048764A1 (en) Method and apparatus for multi view video encoding and decoding, and method for transmitting bitstream generated by the multi view video encoding method
JP6649212B2 (ja) 符号化装置、復号装置、および画像処理システム
KR20230067492A (ko) Ai를 이용하는 영상 부호화 장치 및 영상 복호화 장치, 및 이들에 의한 영상의 부호화 및 복호화 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant