KR20200073079A

KR20200073079A - 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법

Info

Publication number: KR20200073079A
Application number: KR1020180161366A
Authority: KR
Inventors: 신재섭; 류성걸; 손세훈; 김형덕; 김효성
Original assignee: 주식회사 픽스트리
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2020-06-23
Also published as: WO2020122481A2; WO2020122481A3; US20220086442A1; WO2020122481A9; KR102192980B1; US11575897B2

Abstract

본 발명은 코덱 내에서 기계 학습을 통해 학습된 파라미터를 학습하여 인코딩 시 압축 과정에서 발생하는 영상의 품질 저하를 보상하는 기술적 사상에 관한 것으로서, 일실시예에 따른 영상 처리 장치는 입력된 원본 프레임을 저장하는 입력 프레임 버퍼, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 다중화 처리부를 포함하고, 상기 인코딩 처리부는, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 한다.

Description

기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법{Image processing device of learning parameter based on machine Learning and method of the same}

본 발명은 코덱 내에서 수행되는 기계 학습을 기반으로 학습된 파라미터를 학습하여 인코딩 시 압축 과정에서 발생하는 영상의 품질 저하를 보상하는 기술적 사상에 관한 것이다.

영상, 이미지 또는 소리 데이터를 생성할 때, 원래의 데이터양을 줄이기 위하여 데이터를 코드화하고 압축하는 것을 인코딩이라고 한다.

인코딩 기술은 영상을 원격지로 송출하는 등의 과정에서 수행될 수 있고, 원격지에서는 인코딩된 데이터를 디코딩하여 복원한다.

대부분의 인코딩 과정에서는 압축에 의해서 정보의 손실이 발생한다. 따라서, 이러한 손실에 의해 디코딩되는 영상은 원본 프레임의 품질보다 저하된 품질을 갖는다.

손실에 의한 품질 저하를 방지하기 위한 취지에서 현재에는 영상을 원본 수준으로 디코딩하려는 다양한 방식이 제시되고 있다.

그럼에도 불구하고, 영상의 인코딩이나 디코딩 시간을 크게 늘리지 않으면서 원본 프레임에 가까운 품질로 디코딩하는 기술은 부족한 실정이다. 최근 TV의 해상도가 높아지고 양질의 컨텐츠가 유통됨에 따라 인코딩과 디코딩에 따른 품질 열화를 줄이려는 니즈 역시 증가되는 추세이다.

한국등록특허 제10-1803471호 "컨볼루션 신경망 기반의 영상 패턴화를 이용한 딥러닝 시스템 및 이를 이용한 영상 학습방법" 한국등록특허 제10-1906796호 "딥러닝 기반 영상 분석 장치 및 영상 분석 방법" 한국공개특허 제10-2017-0070715호 "딥러닝 기반 영상 처리 장치 및 방법, 학습 장치"

본 발명은 인코딩 과정에서 손실되는 이미지의 품질을 코덱 내에서 수행되는 기계 학습에 기반하여 학습한 파라미터를 통해 보완하는 것을 목적으로 한다.

본 발명은 인코딩과 디코딩 중에 코덱 내에서 수행되는 기계 학습을 통해 파라미터를 학습하는 것을 목적으로 한다.

일실시예에 따른 영상 처리 장치는 입력된 원본 프레임을 저장하는 입력 프레임 버퍼, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 다중화 처리부를 포함하고, 상기 인코딩 처리부는, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 한다.

일실시예에 따른 상기 다중화 처리부는, 상기 출력된 필터 파라미터와 상기 다중화된 출력 스트림을 서로 연관지어 디코딩 측으로 전송되도록 처리할 수 있다.

일실시예에 따른 상기 인코딩 처리부는, 상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 프리딕션부, 상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 순방향 처리부, 상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 엔트로피 코딩부, 상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 역방향 처리부, 및 상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 기계 학습 인루프 필터부를 포함하고, 상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송될 수 있다.

일실시예에 따른 상기 기계 학습 인루프 필터부는, 상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 제1 기계 학습 추론부, 상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하고, 미리 설정된 기준에 따라 상기 산출된 오류값을 상기 기계 학습 추론부로 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 상기 기계 학습 추론부에 요청하고, 상기 업데이트된 필터 파라미터를 출력하는 오류 역전파부, 및 상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 제2 기계 학습 추론부를 포함할 수 있다.

일실시예에 따른 상기 기계 학습 인루프 필터부는, 상기 복원 프레임 및 상기 원본 프레임 중에서 적어도 하나를 복수의 부영상으로 분할하는 학습 부영상 분할부를 더 포함하고, 상기 제1 기계 학습 추론부는 상기 복원 프레임에서 분할된 복수의 부영상을 상기 기 학습된 파라미터로 각각 초기화 하여 기계 학습 추론하고, 상기 오류 역전파부는 상기 원본 프레임에서 분할된 복수의 부영상과 상기 복원 프레임에서 분할된 복수의 부영상을 비교하여 오류값을 산출할 수 있다.

일실시예에 따른 영상 처리 장치는 인코딩 장치로부터 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터를 추출하는 역다중화 처리부, 상기 추출된 입력 스트림을 저장하는 입력 스트림 버퍼, 상기 저장된 입력 스트림을 디코딩하여 출력 프레임을 생성하는 디코딩 처리부, 및 상기 생성된 출력 프레임을 저장하는 출력 프레임 버퍼를 포함하고, 상기 디코딩 처리부는, 상기 추출된 필터 파라미터를 복원 프레임에 적용해서 화질 개선 처리된 상기 출력 프레임을 생성하고, 상기 인코딩 장치는 저장된 원본 프레임과, 상기 원본 프레임으로부터 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 상기 필터 파라미터를 다중화하여 송출하는 것을 특징으로 한다.

일실시예에 따른 상기 디코딩 처리부는, 상기 수신된 입력 스트림을 엔트로피 디코딩 후 출력하는 엔트로피 디코딩 처리부, 상기 엔트로피 디코딩 처리된 스트림을 역양자화 및 역변환 처리하는 역방향 처리부, 및 상기 역양자화 및 역변환 처리된 스트림, 상기 역양자화 및 역변환 처리된 스트림에 상기 프리딕션 정보가 반영된 스트림, 엔트로피 디코딩 후 출력된 스트림을 입력으로 기계 학습 인루프 기반 필터링 처리하는 기계 학습 인루프 필터부를 포함할 수 있다.

일실시예에 따른 상기 기계 학습 인루프 필터부는, 상기 필터 파라미터를 디코딩하는 파라미터 정보 디코딩 처리부, 상기 추출된 필터 파라미터와, 기 학습된 필터 파라미터의 차이를 고려하여 파라미터를 업데이트 하는 파라미터 결정부, 및 상기 복원 프레임 버퍼에 저장된 복원 프레임에 상기 업데이트된 필터 파라미터를 적용해서 상기 복원 프레임에 대한 화질을 개선하도록 처리하는 기계 학습 추론부를 포함할 수 있다.

일실시예에 따른 영상 처리 장치의 동작 방법은 입력 프레임 버퍼에서, 입력된 원본 프레임을 저장하는 단계, 인코딩 처리부에서, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 단계, 출력 스트림 버퍼에서, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 단계, 다중화 처리부에서, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 단계를 포함하고, 상기 인코딩을 처리하는 단계는, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하는 단계를 포함하고, 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 한다.

일실시예에 따른 상기 인코딩을 처리하는 단계는, 상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 단계, 상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 단계, 상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 단계, 상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 단계, 및 상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 단계를 포함하고, 상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송될 수 있다.

일실시예에 따른 상기 학습된 필터 파라미터를 출력하는 단계는, 상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 단계, 상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하는 단계, 미리 설정된 기준에 따라 상기 산출된 오류값을 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하는 단계, 상기 업데이트된 필터 파라미터를 출력하는 단계, 및 상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 단계를 포함할 수 있다.

일실시예에 따르면, 인코딩 과정에서 손실되는 이미지의 품질을 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있다.

일실시예에 따르면, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.

도 1은 일실시예에 따른 영상 처리 장치 중에서 인코딩 측 시스템을 설명하는 도면이다.
도 2는 일실시예에 따른 기계 학습 인루프 필터부를 구체적으로 설명하는 도면이다.
도 3은 일실시예에 따른 영상 처리 장치 중에서 디코딩 측 시스템을 설명하는 도면이다.
도 4는 일실시예에 따른 기계 학습 인루프 필터부를 설명하는 도면이다.
도 5는 일실시예에 따른 영상 처리 장치의 동작 방법을 설명하는 도면이다.
도 6은 일실시예에 따른 영상 처리 장치의 동작 방법 중에서 인코딩을 보다 구체적으로 설명하는 도면이다.

본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.

본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다.

제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.

본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

본 명세서에서는 통상적인 기계 학습에 기반하여 본 발명의 컨셉을 설명하지만, 이는 딥러닝 또는 컨볼루션 뉴럴 네트워크 등의 다양한 학습 기술로 해석될 수 있다.

도 1은 일실시예에 따른 영상 처리 장치 중에서 인코딩 측 시스템을 설명하는 도면이다.

일실시예에 따른 영상 처리 장치(100)는 인코딩 과정에서 손실되는 이미지의 품질을 코덱 내에서 수행되는 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있다. 또한, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.

이를 위해, 일실시예에 따른 영상 처리 장치(100)는 제어 시스템(110)의 통제하에 동작하는 입력 제어부(120), 입력 프레임 버퍼(130), 인코딩 처리부(140), 출력 스트림 버퍼(150), 다중화 처리부(160), 출력 포맷팅 처리부(170) 중에서 적어도 일부의 구성요소들을 포함할 수 있다.

먼저, 일실시예에 따른 입력 제어부(120)는 입력되는 원본 프레임을 제어하여 입력 프레임 버퍼(130)에 저장할 수 있다.

다음으로, 인코딩 처리부(140)는 저장된 원본 프레임에 대한 인코딩을 처리할 수 있다. 인코딩 과정에서는 일반적으로 널리 사용되는 인코딩 알고리즘들이 다양하게 적용될 수 있다.

다음으로, 출력 스트림 버퍼(150)는 인코딩된 원본 프레임을 저장하고 출력 전 다중화를 위해 다중화 처리부(106)로 인코딩된 원본 프레임을 제공할 수 있다.

다중화 처리부(160)에서는 인코딩된 음성 정보, 영상 정보, 메타 정보 등을 다중화 처리하고, 출력 포맷팅 처리부(170)는 다중화 처리된 정보들을 출력을 위한 포맷으로 가공 처리하여 출력을 준비할 수 있다.

일례로 다중화 처리부(160)는 출력된 필터 파라미터와 다중화된 출력 스트림을 서로 연관지어 디코딩 측으로 전송되도록 출력 포맷팅 처리부(170)에 요청할 수 있다.

한편, 출력 스트림 버퍼(150)에 저장된 인코딩된 원본 프레임은 로컬에 위치하는 로컬 디코딩 처리부를 통해 디코딩될 수 있다. 로컬 디코딩 처리부는 프레임의 인코딩 시 인접한 프레임을 참조하기 위해 인코딩 측에 위치하는 로컬 디코더의 기능도 수행할 수 있다.

일실시예에 따른 인코딩 처리부(140)는 저장된 원본 프레임과, 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력할 수 있다. 또한, 디코딩 측 장치에서는 출력된 필터 파라미터를 이용해서 출력 스트림을 디코딩할 수 있다.

보다 구체적으로, 인코딩 처리부(140)는 프리딕션부(141), 순방향 처리부(142), 엔트로피 코딩부(143), 역방향 처리부(144), 기계 학습 인루프 필터부(145), 및 피쳐버퍼(146)를 포함할 수 있다.

먼저, 프리딕션부(141)는 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영할 수 있다.

또한, 순방향 처리부(142)는 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리할 수 있다.

엔트로피 코딩부(143)는 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력할 수 있다.

역방향 처리부(144)는 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 원본 프레임에 상응하는 복원 프레임을 생성할 수 있다.

기계 학습 인루프 필터부(145)는 입력 프레임 버퍼에 저장된 원본 프레임과, 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력할 수 있다. 기계 학습 인루프 필터부(145)에 대해서는 추후 도 2를 통해 상세하게 설명한다.

피쳐버퍼(146)는 버퍼로써 동작하며 필터링된 복원 프레임을 저장할 수 있다.

출력된 복원 프레임은 프리딕션 정보에 반영되고, 출력된 필터 파라미터는 디코딩 측으로 전송될 수 있다.

본 발명은 코덱 내에서 적용될 수 있다. 즉, 코덱 내에서 기계 학습을 적용함으로써 화질을 개선할 수 있다.

특히, 인접한 피쳐들을 다음 번 프리딕션으로 사용하기 위해, 인코딩 처리부(140)에서 역변화, 역양자화를 통해 프레임을 복원하게 되고, 복원된 프레임을 피쳐버퍼(146)에 기록했다가 다음 번 프레임에 대해 기 저장된 복원된 프레임을 프리딕션으로 사용할 수 있다.

이는 복원된 프레임 자체를 필터링을 해서 다음 번 예측에서 사용하기 좋게 할 수 있다.

이와 유사한 기술로서, H.264에서는 디블로킹 필터가 도입, HEVC에서는 SAO 픽셀 단위로 미세조정하는 알고리즘이 있다.

본 발명은 이들을 기계 학습 기반의 필터인 기계 학습 인루프 필터부(145)로 대체할 수 있다.

기계 학습 인루프 필터부(145)는 복원된 프레임이 있으면, 이 복원된 프레임을 인코딩에 의해서 화질이 왜곡되기 이전의 원본 프레임으로 변환하는 필터를 기계 학습 기반으로 학습할 수 있다.

기계 학습 인루프 필터부(145)는 원본 프레임과 복원 프레임의 필터의 차이를 최소화 하는 필터를 학습하고, 그 학습된 파라미터를 엔트로피 코딩부(143)에 같이 전달해서 전송할 수 있다.

기계 학습 인루프 필터가 적용된 필터링된 피쳐가 피쳐버퍼(146)에 저장되고, 다음 번 프레임을 프리딕션 하기 위한 피쳐로 사용될 수 있다.

결국, 본 발명에 따른 영상 처리 장치에 따르면 전체적인 시스템의 인코딩의 효율이 높아질 수 있다.

도 2는 일실시예에 따른 기계 학습 인루프 필터부(200)를 구체적으로 설명하는 도면이다.

일실시예에 따른 기계 학습 인루프 필터부(200)는 제1 기계 학습 추론부(202), 오류 역전파부(203), 및 제2 기계 학습 추론부(205)를 포함할 수 있다.

먼저, 일실시예에 따른 제1 기계 학습 추론부(202)는 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론할 수 있다.

다음으로, 일실시예에 따른 오류 역전파부(203)는 기계 학습 추론된 복원 프레임과 입력된 원본 프레임을 비교하여 오류값을 산출하고, 미리 설정된 기준에 따라 산출된 오류값을 기계 학습 추론부(202)로 역전파하여 기계 학습 추론을 다시 수행하여 기 학습된 필터 파라미터를 업데이트 하도록 기계 학습 추론부(202)에 요청할 수 있다. 또한, 오류 역전파부(203)는 업데이트된 필터 파라미터를 출력할 수 있다.

또한, 제2 기계 학습 추론부(205)는 오류 역전파부(203)로부터 출력된 필터 파라미터를 이용해서 입력되는 복원 프레임을 기계 학습 추론하여 필터링하여 필터링된 복원 프레임을 출력할 수 있다.

일실시예에 따른 기계 학습 인루프 필터부(200)는 옵셔널한 구성요소로서 입력되는 복원 프레임의 크기를 고려하여 복원 프레임을 여러 프레임들로 분할하는 학습 부영상 분할부(201)를 포함할 수도 있다. 또한, 입력되는 원본 프레임의 크기를 고려하여 원본 프레임을 여러 프레임들로 분할하는 학습 부영상 분할부(204)를 포함할 수도 있다.

도 3는 일실시예에 따른 영상 처리 장치 중에서 디코딩 측 시스템을 설명하는 도면이다.

일실시예에 따른 영상 처리 장치(300)는 인코딩 과정에서 손실되는 이미지의 품질을 코덱 내에서 수행되는 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있고, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.

이를 위해, 일실시예에 따른 영상 처리 장치(300)는 제어 시스템(310)의 통제하에 동작하는 입력 제어부(320), 역다중화 처리부(330), 입력 스트림 버퍼(340), 디코딩 처리부(350), 출력 프레임 버퍼(360), 및 출력 제어부(370)를 포함할 수 있다.

먼저, 일실시예에 따른 입력 제어부(320)는 인코더로부터 전달되는 입력 스트림을 제어하여 역다중화 처리부(330)의 입력을 전달할 수 있다.

역다중화 처리부(330)는 인코딩 장치로부터 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터 정보를 추출할 수 있다.

필터 파라미터 정보는 업데이트된 파라미터 또는 기 학습된 필터 파라미터와 업데이트된 필터 파라미터의 차이값을 포함할 수도 있다.

다음으로, 입력 스트림 버퍼(340)는 추출된 입력 스트림을 저장할 수 있다.

또한, 디코딩 처리부(350)는 저장된 입력 스트림을 디코딩하여 복원 프레임을 생성하여 복원 프레임 버퍼(360)에 저장할 수 있다.

일실시예에 따른 디코딩 처리부(350)에서는 입력 스트림을 원본 수준으로 품질 향상 시킬 수 있다. 일례로, 디코딩 처리부(350)는 추출된 필터 파라미터를 복원 프레임에 적용해서 화질 개선 처리된 출력 프레임을 생성할 수 있다.

구체적으로, 디코딩 처리부(350)는, 엔트로피 디코딩부(351), 역방향 처리부(352), 프리딕션부(353), 및 기계 학습 인루프 필터부(354)를 포함할 수 있다.

먼저, 엔트로피 디코딩부(351)는 수신된 입력 스트림을 엔트로피 디코딩 후 출력할 수 있다.

다음으로, 역방향 처리부(352)는 상기 엔트로피 디코딩 처리된 스트림을 역양자화 및 역변환 처리할 수 있다.

또한, 프리딕션부(353)는 저장된 피쳐를 활용해서 스트림에 피쳐를 적용할 수 있다.

다음으로, 기계 학습 인루프 필터부(354)는 역양자화 및 역변환 처리된 스트림, 역양자화 및 역변환 처리된 스트림에 상기 프리딕션 정보가 반영된 스트림, 엔트로피 디코딩 후 출력된 스트림을 입력으로 기계 학습 인루프 기반 필터링 처리하여 화질을 개선할 수 있다.

기계 학습 인루프 필터부(354)는 이하 도 6을 통해 보다 구체적으로 설명한다.

도 6은 일실시예에 따른 기계 학습 인루프 필터부(400)를 설명하는 도면이다.

일실시예에 따른 기계 학습 인루프 필터부(400)는 파라미터 정보 디코딩 처리부(410), 파라미터 결정부(420), 기계 학습 추론부(430)를 포함할 수 있다.

일실시예에 따른 파라미터 정보 디코딩 처리부(410)는 필터 파라미터 정보를 디코딩하여 필터 파라미터를 추출할 수 있다. 본 발명에 따른 필터 파라미터 정보는 업데이트된 필터 파라미터일 수 있고, 기 산출된 필터 파라미터와 업데이트된 필터 파라미터의 차이에 대한 정보일 수 있다.

일실시예에 따른 파라미터 결정부(420)는 추출된 필터 파라미터와, 기 학습된 필터 파라미터의 차이를 고려하여 기계 학습을 위한 필터 파라미터를 선택할 수 있다.

또한, 일실시예에 따른 기계 학습 추론부(430)는 선택된 복원 프레임 버퍼에 저장된 복원 프레임에 선택된 필터 파라미터를 적용할 수 있다.

결국, 기계 학습 추론부(430)는 필터링된 복원 프레임을 출력함으로써, 복원 프레임에 대한 화질을 개선할 수 있다.

도 5는 일실시예에 따른 영상 처리 장치의 동작 방법을 설명하는 도면이다.

일실시예에 따른 영상 처리 장치의 동작 방법은 입력된 원본 프레임을 저장하고(단계 501), 저장된 원본 프레임에 대한 인코딩을 처리할 수 있다(단계 502).

특히, 일실시예에 따른 영상 처리 장치의 동작 방법은 화질 개선을 위한 디코딩을 고려하여 저장된 원본 프레임과, 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력할 수 있다.

또한, 영상 처리 장치의 동작 방법은 출력 스트림 버퍼를 통해 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하고(단계 503), 다중화 처리부를 통해 출력 스트림을 다중화하여 송출하도록 제어할 수 있다(단계 504).

디코딩 측 장치에서는 출력된 필터 파라미터를 이용해서 출력 스트림을 디코딩하여 원본 프레임과 비슷한 수준의 영상을 출력할 수 있다.

도 6은 일실시예에 따른 영상 처리 장치의 동작 방법 중에서 인코딩을 보다 구체적으로 설명하는 도면이다.

일실시예에 따른 영상 처리 장치의 동작 방법은 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영할 수 있다(단계 601).

영상 처리 장치의 동작 방법은 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리할 수 있다(단계 602).

영상 처리 장치의 동작 방법은 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력 할 수 있다(단계 602).

또한, 영상 처리 장치의 동작 방법은 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성할 수 있다(단계 603).

영상 처리 장치의 동작 방법은 입력 프레임 버퍼에 저장된 원본 프레임과, 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력할 수 있다(단계 604).

특히, 영상 처리 장치의 동작 방법은 학습된 필터 파라미터를 출력하기 위해, 오류값을 산출할 수 있다.

보다 구체적으로, 영상 처리 장치의 동작 방법은 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하고, 기계 학습 추론된 복원 프레임과 입력된 원본 프레임을 비교하여 오류값을 산출할 수 있다. 또한, 영상 처리 장치의 동작 방법은 미리 설정된 기준에 따라 산출된 오류값을 역전파하여 기계 학습 추론을 다시 수행하여 기 학습된 필터 파라미터를 업데이트 하도록 요청할 수 있다.

결국, 영상 처리 장치의 동작 방법은 업데이트된 필터 파라미터를 출력하고, 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링에 이용할 수 있다.

또한, 출력된 복원 프레임은 프리딕션 정보에 반영되고, 출력된 필터 파라미터는 디코딩 측으로 전송할 수 있다.

결국, 본 발명을 이용하는 경우 인코딩 과정에서 손실되는 이미지의 품질을 기계 학습에 기반하여 학습한 파라미터를 통해 보완할 수 있다. 뿐만 아니라, 인코딩과 디코딩 중에 실시간 기계 학습을 통해 파라미터를 학습할 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

입력된 원본 프레임을 저장하는 입력 프레임 버퍼;
상기 저장된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부;
상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼;
상기 출력 스트림을 다중화하여 송출하도록 제어하는 다중화 처리부
를 포함하고,
상기 인코딩 처리부는,
상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 하는 영상 처리 장치.
제1항에 있어서,
상기 다중화 처리부는,
상기 출력된 필터 파라미터와 상기 다중화된 출력 스트림을 서로 연관지어 디코딩 측으로 전송되도록 처리하는 영상 처리 장치.
제1항에 있어서,
상기 인코딩 처리부는,
상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 프리딕션부;
상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 순방향 처리부;
상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 엔트로피 코딩부;
상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 역방향 처리부
상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 기계 학습 인루프 필터부
를 포함하고,
상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송되는 것을 특징으로 하는 영상 처리 장치.
제3항에 있어서,
상기 기계 학습 인루프 필터부는,
상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 제1 기계 학습 추론부;
상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하고, 미리 설정된 기준에 따라 상기 산출된 오류값을 상기 기계 학습 추론부로 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 상기 기계 학습 추론부에 요청하고, 상기 업데이트된 필터 파라미터를 출력하는 오류 역전파부; 및
상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 제2 기계 학습 추론부
를 포함하는 영상 처리 장치.
제4항에 있어서,
상기 기계 학습 인루프 필터부는,
상기 복원 프레임 및 상기 원본 프레임 중에서 적어도 하나를 복수의 부영상으로 분할하는 학습 부영상 분할부
를 더 포함하고,
상기 제1 기계 학습 추론부는 상기 복원 프레임에서 분할된 복수의 부영상을 상기 기 학습된 필터 파라미터로 각각 초기화 하여 기계 학습 추론하고,
상기 오류 역전파부는 상기 원본 프레임에서 분할된 복수의 부영상과 상기 복원 프레임에서 분할된 복수의 부영상을 비교하여 오류값을 산출하는 영상 처리 장치.
인코딩 장치로부터 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터를 추출하는 역다중화 처리부;
상기 추출된 입력 스트림을 저장하는 입력 스트림 버퍼;
상기 저장된 입력 스트림을 디코딩하여 출력 프레임을 생성하는 디코딩 처리부;
상기 생성된 출력 프레임을 저장하는 출력 프레임 버퍼
를 포함하고,
상기 디코딩 처리부는,
상기 추출된 필터 파라미터를 복원 프레임에 적용해서 화질 개선 처리된 상기 출력 프레임을 생성하고,
상기 인코딩 장치는 저장된 원본 프레임과, 상기 원본 프레임으로부터 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 상기 필터 파라미터를 다중화하여 송출하는 것을 특징으로 하는 영상 처리 장치.
제6항에 있어서,
상기 디코딩 처리부는,
상기 수신된 입력 스트림을 엔트로피 디코딩 후 출력하는 엔트로피 디코딩 처리부;
상기 엔트로피 디코딩 처리된 스트림을 역양자화 및 역변환 처리하는 역방향 처리부; 및
상기 역양자화 및 역변환 처리된 스트림, 상기 역양자화 및 역변환 처리된 스트림에 상기 프리딕션 정보가 반영된 스트림, 엔트로피 디코딩 후 출력된 스트림을 입력으로 기계 학습 인루프 기반 필터링 처리하는 기계 학습 인루프 필터부
를 포함하는 영상 처리 장치.
제7항에 있어서,
상기 기계 학습 인루프 필터부는,
상기 필터 파라미터를 디코딩하는 파라미터 정보 디코딩 처리부;
상기 추출된 필터 파라미터와, 기 학습된 필터 파라미터의 차이를 고려하여 기계 학습을 위한 필터 파라미터를 선택 하는 파라미터 결정부; 및
상기 복원 프레임 버퍼에 저장된 복원 프레임에 상기 선택된 필터 파라미터를 적용해서 상기 복원 프레임에 대한 화질을 개선하도록 처리하는 기계 학습 추론부
를 포함하는 영상 처리 장치.
입력된 원본 프레임에 대한 인코딩을 처리하는 인코딩 처리부;
상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 출력 스트림 버퍼;
상기 출력 스트림을 다중화하여 저장매체에 전달하도록 제어하는 다중화 처리부
를 포함하고,
상기 인코딩 처리부는,
상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하고, 상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하며, 상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하고, 상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하며, 상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하고, 상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하고 상기 저장매체에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하고, 수신된 입력 스트림을 역다중화 처리하여 입력 스트림 및 필터 파라미터를 추출하는 것을 특징으로 하는 영상 처리 장치.
입력 프레임 버퍼에서, 입력된 원본 프레임을 저장하는 단계;
인코딩 처리부에서, 상기 저장된 원본 프레임에 대한 인코딩을 처리하는 단계;
출력 스트림 버퍼에서, 상기 인코딩된 원본 프레임을 다중화를 위해 출력 스트림으로서 출력하는 단계;
다중화 처리부에서, 상기 출력 스트림을 다중화하여 송출하도록 제어하는 단계
를 포함하고,
상기 인코딩을 처리하는 단계는,
상기 저장된 원본 프레임과, 상기 인코딩 처리 후 복원된 복원 프레임을 이용한 기계 학습에 기초하여 학습된 필터 파라미터를 출력하는 단계
를 포함하고,
디코딩 측 장치에서는 상기 출력된 필터 파라미터를 이용해서 상기 출력 스트림을 디코딩하는 것을 특징으로 하는 영상 처리 장치의 동작 방법.
제10항에 있어서,
상기 인코딩을 처리하는 단계는,
상기 저장된 원본 프레임에 대해 기준거리 이내로 인접한 특징정보를 프리딕션 정보로 반영하는 단계;
상기 프리딕션 정보가 반영된 프레임을 변환 및 양자화 처리하는 단계;
상기 변환 및 양자화 처리된 프레임을 엔트로피 코딩 후 출력하는 단계;
상기 변환 및 양자화 처리된 프레임을 역양자화 및 역변환 처리하여 상기 원본 프레임에 상응하는 복원 프레임을 생성하는 단계; 및
상기 입력 프레임 버퍼에 저장된 원본 프레임과, 상기 생성된 복원 프레임을 수신하여 기계 학습 추론하여 필터링된 복원 프레임과 학습된 필터 파라미터를 출력하는 단계
를 포함하고,
상기 출력된 복원 프레임은 상기 프리딕션 정보에 반영되고, 상기 출력된 필터 파라미터는 디코딩 측으로 전송되는 것을 특징으로 하는 영상 처리 장치의 동작 방법.
제11항에 있어서,
상기 학습된 필터 파라미터를 출력하는 단계는,
상기 출력된 복원 프레임을 기 학습된 필터 파라미터로 초기화 하여 기계 학습 추론하는 단계;
상기 기계 학습 추론된 상기 복원 프레임과 상기 입력된 원본 프레임을 비교하여 오류값을 산출하는 단계;
미리 설정된 기준에 따라 상기 산출된 오류값을 역전파하여 상기 기계 학습 추론을 다시 수행하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하는 단계;
상기 업데이트된 필터 파라미터를 출력하는 단계; 및
상기 출력된 필터 파라미터를 이용해서 상기 복원 프레임을 기계 학습 추론하여 필터링 하는 단계
를 포함하는 영상 처리 장치의 동작 방법.
제12항에 있어서,
상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하는 단계는,
상기 산출된 오류값이 기준값 이상인 경우에 상기 산출된 오류값을 역전파하여 상기 기 학습된 필터 파라미터를 업데이트 하도록 요청하거나, 상기 산출된 오류값이 상기 기준값 이하인 경우에 업데이트된 필터 파라미터를 출력하도록 요청하는 단계
를 포함하는 영상 처리 장치의 동작 방법.