KR102053317B1 - 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 - Google Patents

비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 Download PDF

Info

Publication number
KR102053317B1
KR102053317B1 KR1020190084680A KR20190084680A KR102053317B1 KR 102053317 B1 KR102053317 B1 KR 102053317B1 KR 1020190084680 A KR1020190084680 A KR 1020190084680A KR 20190084680 A KR20190084680 A KR 20190084680A KR 102053317 B1 KR102053317 B1 KR 102053317B1
Authority
KR
South Korea
Prior art keywords
video signal
bit depth
transform
value
scaling
Prior art date
Application number
KR1020190084680A
Other languages
English (en)
Other versions
KR20190085907A (ko
Inventor
엘레나 알쉬나
홍윤미
한우진
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20190085907A publication Critical patent/KR20190085907A/ko
Application granted granted Critical
Publication of KR102053317B1 publication Critical patent/KR102053317B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치가 개시된다. 본 발명에 따른 비디오 신호의 부호화 방법은 변환 과정에서 발생하는 중간값의 최대 비트와 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 비디오 신호의 최적 스케일링 비트 뎁스를 결정하고, 결정된 최적 스케일링 비트 뎁스의 값 및 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 비디오 신호를 스케일링하여 변환을 수행하는 것을 특징으로 한다.

Description

비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치{Method and apparatus for video encoding, and method and apparatus for video decoding}
본 발명은 비디오의 부호화 및 복호화에 관한 것이다.
고해상도 또는 고화질 비디오 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 비디오 컨텐트를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 필요성이 증대하고 있다. 기존의 비디오 코덱에 따르면, 비디오는 소정 크기의 매크로블록에 기반하여 제한된 부호화 방식에 따라 부호화되고 있다.
디스플레이되는 영상의 화질은 영상 데이터 값을 표현하는 비트수에 영향을 받는다. 영상 데이터의 정밀도를 나타내는 비트 뎁스(bit depth), 즉 영상 데이터 값을 표현하는 비트 수가 증가할수록 더욱 다양한 레벨로 데이터를 표현할 수 있기 때문이다. 그러나, 영상 데이터의 정밀도를 증가시키기 위해서 비트 뎁스를 무작정 증가시키는 경우, 영상 데이터 처리시 오버플로우(overflow)가 발생하거나 고정 소수점 연산으로 인해 반올림 에러(rounding error)가 발생할 수 있다.
본 발명이 해결하고자 하는 기술적 과제는 비디오 신호의 변환 및 역변환시에 비디오 신호의 비트 뎁스를 증가시킴으로써 연산 정밀도를 향상시키는 한편, 비트 뎁스의 증가에도 불구하고 연산 과정에서 허용가능한 비트 뎁스를 초과하는 오버플로우가 발생되지 않도록 비디오 신호 처리를 수행하는 비디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치를 제공하는 것이다.
본 발명의 일 실시예에 따른 비디오 신호의 부호화 방법은 상기 비디오 신호의 변환 과정에서 발생하는 중간값의 최대 비트와 상기 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 상기 비디오 신호의 최적 스케일링 비트 뎁스를 결정하는 단계; 상기 결정된 최적 스케일링 비트 뎁스의 값 및 상기 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 상기 비디오 신호를 스케일링하는 단계; 및 상기 스케일링된 비디오 신호에 대한 변환을 수행하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법은 수신된 비트스트림을 파싱하여 비디오 신호의 부호화된 데이터를 추출하는 단계; 상기 추출된 부호화된 데이터에 대해 엔트로피 복호화를 수행하여 엔트로피 복호화된 데이터를 복원하는 단계; 상기 엔트로피 복호화된 데이터의 역변환 과정에서 발생하는 중간값의 최대 비트와 상기 엔트로피 복호화된 데이터가 갖을 수 있는 최대 비트 정밀도를 고려하여 상기 엔트로피 복호화된 데이터의 최적 스케일링 비트 뎁스를 결정하는 단계; 상기 결정된 최적 스케일링 비트 뎁스의 값 및 상기 엔트로피 복호화된 데이터의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 상기 엔트로피 복호화된 데이터를 스케일링하는 단계; 및 상기 스케일링된 엔트로피 복호화된 데이터에 대한 역변환을 수행하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 비디오 신호의 복호화 방법은 상기 비디오 신호의 변환 과정에서 발생하는 중간값의 최대 비트와 상기 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 결정된 최적 스케일링 비트 뎁스의 값 및 상기 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 스케일링되어 부호화된 비디오 신호를 수신하는 단계; 상기 수신된 비디오 신호에 대한 엔트로피 복호화, 양자화 및 역변환을 수행하여 복호화된 비디오 신호를 생성하는 단계; 상기 복호화된 비디오 신호에 대한 디스케일링을 수행하기 위한 상기 로컬 쉬프트 값을 결정하는 단계; 및 상기 결정된 로컬 쉬프트 값에 따라서 상기 복호화된 비디오 신호에 대한 디스케일링을 수행하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 비디오 신호의 부호화 장치는 상기 비디오 신호의 변환 과정에서 발생하는 중간값의 최대 비트와 상기 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 상기 비디오 신호의 최적 스케일링 비트 뎁스를 결정하고, 결정된 최적 스케일링 비트 뎁스의 값 및 상기 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 상기 비디오 신호를 스케일링하는 스케일링부; 및 상기 스케일링된 비디오 신호에 대한 변환을 수행하는 변환부를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 비디오 신호의 복호화 장치는 수신된 비트스트림을 파싱하여 비디오 신호의 부호화된 데이터를 추출하는 파싱부; 상기 추출된 부호화된 데이터에 대해 엔트로피 복호화를 수행하여 엔트로피 복호화된 데이터를 복원하는 엔트로피 복호화부; 상기 엔트로피 복호화된 데이터의 역변환 과정에서 발생하는 중간값의 최대 비트와 상기 엔트로피 복호화된 데이터가 갖을 수 있는 최대 비트 정밀도를 고려하여 상기 엔트로피 복호화된 데이터의 최적 스케일링 비트 뎁스를 결정하고, 상기 결정된 최적 스케일링 비트 뎁스의 값 및 상기 엔트로피 복호화된 데이터의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 상기 엔트로피 복호화된 데이터를 스케일링하는 스케일링부; 및 상기 스케일링된 엔트로피 복호화된 데이터에 대한 역변환을 수행하는 단계를 역변환부를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 비디오 신호의 복호화 장치는 상기 비디오 신호의 변환 과정에서 발생하는 중간값의 최대 비트와 상기 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 결정된 최적 스케일링 비트 뎁스의 값 및 상기 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 스케일링되어 부호화된 비디오 신호에 대한 엔트로피 복호화, 양자화 및 역변환을 수행하여 복호화된 비디오 신호를 생성하는 복호화부; 및 상기 복호화된 비디오 신호에 대한 디스케일링을 수행하기 위한 상기 로컬 쉬프트 값을 결정하고, 상기 결정된 로컬 쉬프트 값에 따라서 상기 복호화된 비디오 신호에 대한 디스케일링을 수행하는 디스케일링부를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 현재 코덱에서 허용 가능한 비트 뎁스를 초과하지 않는 범위 내에서, 즉 오버 플로우를 발생시키지 않으면서 비디오 신호 처리시 연산 정밀도를 향상시킬 수 있다.
도 1 은 본 발명의 일 실시예에 따른 비디오 부호화 장치의 블록도를 도시한다.
도 2는 도 1의 변환부(130)의 구체적인 구성을 나타낸 블록도이다.
도 3은 본 발명의 제 2 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 4는 본 발명의 제 3 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 5는 본 발명의 제 4 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 6은 본 발명의 제 5 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 7은 본 발명의 일 실시예에 따른 비디오 신호의 변환 과정을 설명하기 참조도이다.
도 8은 본 발명의 다른 실시예에 따른 스케일링 동작을 설명하기 위한 참조도이다.
도 9는 본 발명의 실시예에 따른 비디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 10은 본 발명의 일 실시예에 따른 비디오 신호의 복호화 장치를 나타낸 블록도이다.
도 11은 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 장치의 구성을 나타낸 블록도이다.
도 12는 본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
도 13은 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들에 대하여 구체적으로 설명한다.
도 1 은 본 발명의 일 실시예에 따른 비디오 부호화 장치의 블록도를 도시한다.
일 실시예에 따른 비디오 부호화 장치(100)는 예측부(110), 스케일링부(120), 변환부(130), 디스케일링부(140), 양자화부(150) 및 엔트로피 부호화부(160)를 포함한다.
예측부(110)는, 입력 비디오 신호를 소정 크기의 블록들로 분할하고, 분할된 각 블록에 대하여 인터 예측 또는 인트라 예측을 통해 예측 블록을 생성한다. 구체적으로, 예측부(110)는 이전에 부호화된 후 복원된 참조 픽처의 소정 탐색 범위 내에서 현재 블록과 유사한 영역을 가리키는 움직임 벡터를 생성하는 인터 예측 및 현재 블록에 인접한 주변 블록의 데이터를 이용하여 예측 블록을 생성하는 인트라 예측을 수행하고, 예측 블록과 원 입력 블록 사이의 차이값이 레지듀얼 신호를 생성하여 출력한다.
스케일링부(120)는 레지듀얼 신호의 비트 뎁스를 변경하는 스케일링을 수행한다. 변환부(130)는 비트 뎁스가 변경된 레지듀얼 신호를 주파수 영역으로 변환하는 주파수 변환을 수행한다. 디스케일링부(140)는 주파수 영역으로 변환된 변환 신호의 변경된 비트 뎁스를 복원하는 디스케일링을 수행한다. 양자화부(150)는 디스케일링된 변환 신호에 대한 양자화를 수행한다. 미도시되었으나, 본 발명의 일 실시예에 따른 비디오 부호화 장치(100)는 예측부(110)에서 참조 데이터로 이용하기 위해서 양자화된 신호를 역양자화 및 역변환하는 역양자화부 및 역변환부를 포함할 수 있다. 엔트로피 부호화부(160)는 양자화된 변환 신호에 대하여 가변 길이 부호화를 수행하여 비트스트림을 생성한다.
이하, 본 발명에 따른 비디오 신호의 스케일링 및 디스케일링 동작에 대하여 구체적으로 설명한다.
일 실시예에 따른 비디오 신호의 부호화 장치(100)는 입력 비디오 신호를 2차원 블록들로 나누며, 변환부(130)에서는 공간-주파수 분석을 행하는 선형 변환을 통해 분할된 블록들을 주파수 영역으로 변환한다. 이러한 선형 변환의 예로는 Karhuhen-Loeve Transform(KLT), Singular Value Decomposition(SVD), 및 이산 여현 변환(Discrete Cosine Transform, 이하 "DCT"라 함), 이산 웨이블릿 변환(Discrete Wavelet Transform) 등이 있다. 이러한 선형 변환 과정은 입력 블록과 소정의 계수들로 구성된 변환 행렬 사이의 행렬 곱으로 표현될 수 있다. 이하의 설명에서 선형 변환의 예로서 가장 대표적인 DCT를 중심으로 본 발명의 실시예들에 대하여 설명하지만, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 사상은 이러한 DCT 변환 과정 이외에 다른 선형 변환 과정에도 적용될 수 있음을 본 발명의 상세한 설명을 통해 이해할 수 있을 것이다.
도 7은 본 발명의 일 실시예에 따른 비디오 신호의 변환 과정을 설명하기 참조도이다.
전술한 바와 같이, 일 실시예에 따른 변환부(130)는 비디오 신호를 주파수 영역으로 변환한다. 예를 들어, 변환부(130)는 NxN(N은 정수) 입력 블록에 대해서 열 방향 변환(column-wise transform) 및 행 방향 변환(row-wise transform)을 수행하여 NxN 변환 계수 블록을 생성한다. NxN 입력 블록을 Input, 행 방향의 DCT 변환 행렬을 Transform_hor, 열 방향의 DCT 변환 행렬을 Transform_ver, 변환 결과에 따른 출력값을 Output이라고 한다면, 도 7에 도시된 바와 같이 변환 과정은 다음의 수학식; Output=Transform_hor x Input x Transform_ver 과 같은 행렬곱으로 표현될 수 있다. 여기서, 첫 번째 행렬 곱셈 Transform_hor x Input는 N×N 입력 블록인 Input의 각 행에 대해서 1차원 DCT를 수행하는 것에 해당되며, Transform_hor x Input에 Transform_ver 를 곱하는 것은 각 열에 대해 1차원 DCT를 수행하는 것에 해당된다. 행 방향의 DCT 변환 행렬 Transform_hor과 열 방향의 DCT 변환 행렬 Transform_ver 는 서로 이항(transpose) 행렬 관계이다.
행 방향의 변환 행렬 Transform_hor의 (i,k)번째(i,k는 정수)에 위치한 계수값을 Hik, 입력 블록 Input의 (i,k)번째 위치한 값을 Iik, 열 방향의 변환 행렬 Transform_ver의 (i,k)번째에 위치한 계수값을 Vik라고 정의한다. 행 방향의 DCT 변환 행렬을 Transform_hor의 (i,k)번째의 성분 Hik 는 다음의 수학식 1과 같이 정의될 수 있다.
Figure 112019071748269-pat00001
(i,k=0,...,N-1 ,
Figure 112019071748269-pat00002
,
Figure 112019071748269-pat00003
)
열 방향의 DCT 변환 행렬 Transform_ver의 (i,k)번째의 성분 Vik는 이항 행렬인 행 방향의 DCT 변환 행렬 Transform_hor의 성분 Hik 와 유사하게 코사인 함수를 이용한 값으로 표현된다. 일반적으로, 변환 과정에서 이러한 변환 행렬의 계수값은 그대로 이용되지 않고, 덧셈과 쉬프트 연산만으로 변환 과정을 수행하기 위해서 소정의 스케일링 계수를 곱한 값을 이용한다. 수학식 1에서는 유동 소수점(floating point)를 이용하는 DCT 변환인 경우이지만, DCT 변환은 유동 소수점을 이용한 변환 이외에 고정 소숫점 변환(fixed point transform)을 이용할 수 있다. 본 발명에 따른 사상은 모든 변환 행렬에 적용될 수 있으며, 변환의 유형에 제한되지 않는다.
입력 블록(730)에 대하여 행 방향의 1차원 DCT를 수행하는 경우, 즉 첫 번째 행렬 곱셈 Transform_hor x Input을 계산하는 경우, 행렬 곱셈 Transform_hor x Input의 연산에 따른 중간값 행렬의 각 성분은 HabxIcd(a,b,c,d는 1에서 4까지의 정수 중 임의의 값)와 같은 곱셉값들을 더한 값을 갖게 된다. 일 예로, Transform_hor x Input의 연산 결과에 따른 중간값 행렬의 (1,1) 번째 성분은 H11xI11+H12xI21+H13xI31 +H14xI41 이다. 만약, 현재 변환되는 입력 블록의 입력값의 비트 뎁스를 m(m은 정수)이라고 한다면, 입력값 Icd의 절대값은 2^m 이하의 값을 갖는다. 즉 Icd≤2m이다. 또한, 변환 블록을 구성하는 각 성분 Hab의 절대값이 2p(p는 정수) 이하의 값을 갖는다고 가정한다면, 행 방향의 1차원 변환, 즉 Transform_hor x Input의 연산 결과에 따른 행렬의 각 성분은 4x2mx2p, 즉 2m+p+2 이하의 값을 갖게 된다. 이러한 결과를 다른 측면에서 살펴보면, 행 방향의 1차원 DCT를 수행함으로써, m의 비트 뎁스를 갖었던 입력값이 최대 p+2 만큼 비트 뎁스가 증가할 수 있는 것으로 이해할 수 있다. 즉, 변환 과정에서는 곱셈과 덧셈 연산을 통해서 입력값에 소정의 값이 곱해진 것과 같이 비트 뎁스가 증가한다. 유사하게, 열 방향의 1차원 DCT를 수행하는 경우에도, 변환 과정에서 곱셈과 덧셈 연산으로 인해서, 연산 과정 중의 중간값은 입력값에 비하여 큰 값을 갖게 되어 비트 뎁스가 증가한다.
따라서, 본 발명은 이러한 변환 과정에서 발생하는 중간값이 부호화 장치 및 복호화 장치 내에서 이용가능한 최대 비트 정밀도 이하의 값을 갖게 함으로써 연산 과정에서 발생할 수 있는 오버 플로우를 방지하는 한편, 변환 과정에서 증가하는 비트 뎁스를 고려하여 비디오 신호의 비트 뎁스를 증가시킴으로써 연산의 정밀도를 향상시키는 스케일링 방식을 제공한다.
1차원의 변환 과정에서 발생하는 비트 뎁스 증가량을 TransformBitIncreasement, 변환부(110)에 입력되는 입력 비디오 신호의 비트 뎁스를 m, 디스케일링부(140)에 의하여 감소하는 비트 뎁스 감소량을 de_scaling_bits , 도 7에 도시된 바와 같은 행 방향과 열 방향의 2번의 1차원 변환 과정을 통해서 각각 TransformBitIncreasement 만큼의 비트 뎁스가 증가한다고 하면, 디스케일링부(140)을 통해 출력되는 신호의 비트 뎁스의 최대값은 m+2xTransformBitIncreasement-de_scaling_bits 이다. 즉, 디스케일링부(140)을 통해 출력되는 신호의 절대값은 2^(m+2xTransformBitIncreasement-de_scaling_bits) 이하의 값을 갖게 된다. 따라서, 오버 플로우를 방지하기 위해서는 이러한 연산 과정에서 발생하는 중간값이 갖을 수 있는 최대값인 2^(m+2xTransformBitIncreasement-de_scaling_bits)가 부호화 장치(100)에서 이용가능한 최대값 이하가 되어야 한다. 즉, 비트 뎁스 측면에서 중간값이 갖을 수 있는 최대 비트 m+2xTransformBitIncreasement-de_scaling_bits가 부호화 장치(100)에서 이용가능한 최대 비트 정밀도 이하가 되어야 한다.
따라서, 스케일링부(120)는 이러한 중간값이 갖을 수 있는 최대값을 고려하여 예측부(110)에서 출력되는 레지듀얼 신호의 최적 스케일링 비트 뎁스를 결정한다. 구체적으로, 스케일링부(120)에서 비트 뎁스가 변경되어 변환부(130)로 입력되는 레지듀얼 신호의 비트 뎁스를 최적 스케일링 비트 뎁스인 mopt라고 가정해 보면, 변환부(130) 및 디스케일링부(140)에 의해 변환 및 디스케일링 과정을 거친 중간값은 2^(mopt+2xTransformBitIncreasement-de_scaling_bits) 이므로 중간값의 비트 뎁스는 mopt+2xTransformBitIncreasement-de_scaling_bits 이다. 부호화 장치(100)에서 이용가능한 최대 비트 정밀도를 Maxbit라고 할 때, 오버 플로우를 방지하기 위해서는 다음의 수학식 2의 조건을 만족하여야 한다.
Figure 112019071748269-pat00004
스케일링부(120)는 수학식 2를 만족시키는 최대값인 mopt를 결정하고, 이러한 최대 mopt값을 최적 스케일링 비트 뎁스 mopt를 결정한다. 스케일링부(120)는 결정된 최적 스케일링 비트 뎁스 mopt와 예측부(110)로부터 입력되는 레지듀얼 신호의 비트 뎁스 m을 비교하여, 최적 스케일링 비트 뎁스 mopt와 레지듀얼 신호의 비트 뎁스 m의 차이값인 로컬 쉬프트값(local_shift)을 다음의 수학식 3과 같이 결정한다.
Figure 112019071748269-pat00005
스케일링부(120)는 로컬 쉬프트값(local_shift)이 0보다 큰 경우, 즉 결정된 최적 스케일링 비트 뎁스 mopt가 레지듀얼 신호의 비트 뎁스 m보다 큰 경우, 로컬 쉬프트값만큼 레지듀얼 신호를 좌향 쉬프트('<<')하여 레지듀얼 신호의 비트 뎁스를 증가시킴으로써 레지듀얼 신호의 비트 정밀도를 증가시킨다. 즉, 원 레지듀얼 신호를 Input, 비트 뎁스가 변경된 레지듀얼 신호를 Adjusted_Input이라고 할 때, 스케일링부(120)는 다음의 수학식 4와 같이 레지듀얼 신호의 비트 뎁스를 변경한다.
Figure 112019071748269-pat00006
예를 들어, 레지듀얼 신호의 비트 뎁스가 5, 최적 스케일링 비트 뎁스 mopt 가 8인 경우 레지듀얼 신호를 3비트만큼 좌향 쉬프트하여 레지듀얼 신호의 비트 뎁스를 8로 증가시킨다.
또한, 스케일링부(120)는 로컬 쉬프트값(local_shift)이 0보다 작은 경우, 즉 결정된 최적 스케일링 비트 뎁스 mopt가 레지듀얼 신호의 비트 뎁스 m보다 작은 경우, 로컬 쉬프트의 절대값만큼 레지듀얼 신호를 우향 쉬프트('>>')하여 레지듀얼 신호의 비트 뎁스를 감소시킨다. 즉, 스케일링부(120)는 다음의 수학식 5와 같이 레지듀얼 신호의 비트 뎁스를 변경한다.
Figure 112019071748269-pat00007
수학식 5에서
Figure 112019071748269-pat00008
으로써, 스케일링부(120)는 로컬 쉬프트값(local_shift)이 0보다 작은 경우에는 수학식 5와 같이 반올림 및 부호 정보를 고려하여 좌향 쉬프트 연산을 수행하여 비트 뎁스를 감소시킨다. 로컬 쉬프트값(local_shift)이 0인 경우, 스케일링부(120)는 스케일링 과정을 스킵한다.
한편, 디스케일링부(140)는 스케일링부(120)에서 변경된 비트 뎁스를 원 비트 뎁스로 복원하는 스케일링의 역과정을 수행한다. 구체적으로, 로컬 쉬프트값(local_shift)이 0보다 큰 경우, 즉 결정된 최적 스케일링 비트 뎁스 mopt가 레지듀얼 신호의 비트 뎁스 m보다 큰 경우, 디스케일링부(140)는 변환된 비디오 신호에 소정 오프셋을 더한 값을 우향 쉬프트하여 변환된 비디오 신호의 비트 정밀도를 감소시킨다. 로컬 쉬프트값(local_shift)이 0보다 작은 경우, 즉 결정된 최적 스케일링 비트 뎁스 mopt가 레지듀얼 신호의 비트 뎁스 m보다 작은 경우, 디스케일링부(140)는 변환된 비디오 신호를 좌향 쉬프트하여 변환된 비디오 신호의 비트 정밀도를 증가시킨다. 변환부(130)에서 출력되는 스케일링되어 변환된 신호를 Adjusted_Output, 디스케일링부(140)에서 원래 스케일로 복원된 비디오 신호를 Output이라고 하면, 디스케일링 알고리즘은 다음과 같다.
{
If (local_shift>0)
{ If (Adjusted_output≥0)
Output=(Adjusted_output+Offset)>>local_shift
else
Output=-((-Adjusted_output+Offset)>>local_shift
}
else
Output=Adjusted_output << local_shift
}
이러한 알고리즘에서 off_set=(1<<(local_shift-1)) 과 같이 정의된다.
도 2는 도 1의 변환부(130)의 구체적인 구성을 나타낸 블록도이다.
일반적으로 변환부(240)는 도 2에 도시된 바와 같이 a(a는 정수) 단계의 변환부들을 포함할 수 있다. 전술한 도 7에서와 같이, DCT 변환 과정 역시 행 방향의 1차원 변환 및 열 방향의 1차원 변환의 2 단계의 변환 과정으로 구성된다. a 단계의 변환부들(241 내지 243) 각각에 의하여 증가되는 비트 뎁스를 TransformBitIncreasementk(k는 1부터 a까지의 정수)라고 하면, 도 2의 변환부(240)에 의하여 증가되는 비트 뎁스량은
Figure 112019071748269-pat00009
이다.
따라서, 도 1의 변환부(130)가 도 2에 도시된 바와 같은 a 단계의 변환부들(241 내지 243)로 구성된 경우, 스케일링부(120)는 전술한 수학식 2와 유사하게
Figure 112019071748269-pat00010
을 만족시키는 최대값인 mopt를 결정하고, 최대 mopt값을 최적 스케일링 비트 뎁스로 결정한다. 유사하게 만약 디스케일링부(140)가 b(b는 정수) 단계의 디스케일링부들로 구성되며 각 단계의 디스케일링에 의하여 감소되는 비트 뎁스를 de_scaling_bitsk(k는 1부터 b까지의 정수)라고 한다면, 스케일링부(120)는 다음의 수학식 6을 만족시키는 최대값인 mopt를 결정하고, 이러한 최대 mopt값을 최적 스케일링 비트 뎁스로 결정한다.
Figure 112019071748269-pat00011
일반적으로 a 단계의 변환을 거치는 경우, 디스케일링 단계는 최대 a-1 단계까지 수행될 수 있으므로 b=a-1이다.
도 3은 본 발명의 제 2 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 3을 참조하면, 본 발명의 제 2 실시예에 따른 부호화 장치(300)는 예측부(310), 스케일링부(320), 변환부(330), 양자화부(340) 및 엔트로피 부호화부(350)를 포함한다. 본 발명의 제 2 실시예에 따른 부호화 장치(300)는 도 1과 비교하여, 변환부(330)가 a(a는 정수)개의 변환부들(331,332,333)을 포함하며 어느 하나의 변환부 다음에 하나의 디스케일링부(334)를 포함하는 차이점이 있다. 도 3에서 디스케일링부(334)는 제 1 변환부(331) 다음에 위치하는 경우를 도시하였으나, 이에 한정되지 않고 디스케일링부(334)는 변환부들 사이의 어떤 위치에든 배치될 수 있다. 스케일링부(320)는 변환부(330)에 포함된 변환부들(331,332,333) 각각에 의하여 증가하는 비트 뎁스 증가량을 고려하여 전술한 수학식 6과 같은 조건을 만족시키는 최대값 mopt를 결정하고, 이러한 최대 mopt값을 최적 스케일링 비트 뎁스 mopt으로 결정한다. 제 2 실시예에 따른 부호화 장치(300)의 나머지 구성 요소는 전술한 제 1 실시예와 중복되므로 구체적인 설명은 생략한다.
도 4는 본 발명의 제 3 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 4를 참조하면, 본 발명의 제 3 실시예에 따른 부호화 장치(400)는 예측부(410), a개의 변환 처리부들(420, 430, 440), 양자화부(450) 및 엔트로피 부호화부(460)를 포함한다. a개의 변환 처리부들(420, 430, 440) 각각은 도시된 바와 같이 스케일링부(421,431,441), 변환부(422,432,442) 및 디스케일링부(423,433,443)를 포함한다. 본 발명의 제 3 실시예에 따른 부호화 장치(400)의 a개의 변환 처리부들(420, 430, 440) 각각은 전술한 제 1 실시예와 유사하게 레지듀얼 신호의 각 변환 단계에서 발생하는 중간값의 최대 비트와 최대 비트 정밀도를 고려하여 최적 스케일링 비트 뎁스를 결정하고, 결정된 최적 스케일링 비트 뎁스의 값 및 레지듀얼 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 스케일링을 수행하는 한편, 스케일링된 신호에 대한 변환 처리를 수행한 후 변환된 신호를 원 비트 뎁스로 복원하는 디스케일링을 수행한다. 예를 들어, 제 1 변환부(422)에 의하여 증가되는 비트 뎁스를 TransformBitIncreasement, 제 1 디스케일링부(423)에 의하여 감소되는 비트 뎁스를 de_scaling_bits, 제 1 스케일링부(421)에서 출력되는 신호의 mopt라고 할 때, 제 1 스케일링부(421)는 mopt+TransformBitIncreasement-de_scaling_bits≤Maxbits를 만족하는 최적 스케일링 비트 뎁스 mopt를 결정하고, 전술한 수학식 3과 같이 최적 스케일링 비트 뎁스 mopt와 레지듀얼 신호의 비트 뎁스 m의 차이값인 로컬 쉬프트값(local_shift)을 계산한다.
그리고, 제 1 스케일링부(421)는 로컬 쉬프트값(local_shift)이 0보다 큰 경우 로컬 쉬프트값만큼 레지듀얼 신호를 좌향 쉬프트('<<')하여 레지듀얼 신호의 비트 뎁스를 증가시키고, 로컬 쉬프트값(local_shift)이 0보다 작은 경우 레지듀얼 신호를 우향 쉬프프트하여 레지듀얼 신호의 비트 뎁스를 감소시킨다. 제 1 스케일링부(421)에 의하여 비트 뎁스가 변경된 신호는 제 1 변환부(422)로 출력되고, 제 1 변환부(422)에 의하여 주파수 영역으로 변환된 신호는 제 1 디스케일링부(423)에 의하여 원 비트 뎁스로 복원된다. 다른 변환 처리부(430, 440)에 의하여 수행되는 스케일링, 변환 및 디스케일링 과정은 입력 신호로써 이전 변환 처리부에서 출력되는 신호를 이용한다는 차이만 있을 뿐, 구체적인 동작은 제 1 변환 처리부(420)와 동일하다.
도 5는 본 발명의 제 4 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 5를 참조하면, 본 발명의 제 4 실시예에 따른 부호화 장치(500)는 예측부(510), 스케일링부(520), 변환부(530), 양자화부(540), 디스케일링부(550) 및 엔트로피 부호화부(560)를 포함한다. 본 발명의 제 4 실시예에 따른 부호화 장치(500)는 디스케일링부(550)에 의한 디스케일링 동작이 양자화부(540)에 의한 양자화 이후에 수행된다는 차이점을 제외하고는 제 1 실시예에 따른 부호화 장치(100)의 동작과 동일한 바 구체적인 설명은 생략한다.
도 6은 본 발명의 제 5 실시예에 따른 부호화 장치의 구성을 나타낸 블록도이다.
도 6을 참조하면, 본 발명의 제 5 실시예에 따른 부호화 장치(600)는 예측부(610), 스케일링부(620), 변환부(630), 양자화부(640) 및 엔트로피 부호화부(650)를 포함한다. 본 발명의 제 5 실시예에 따른 부호화 장치(600)는 디스케일링부를 구비하고 있지 않다는 점을 제외하고는 제 1 실시예에 따른 부호화 장치(100)와 유사하게 동작한다. 본 발명의 제 5 실시예에 따른 부호화 장치(600)에서 디스케일링 동작이 수행되지 않는 대신에, 후술되는 도 11의 본 발명의 다른 실시예에 따른 복호화 장치(1100)에서 디스케일링 동작이 수행되어 복호화측에서 복원된 신호가 부호화된 원 비디오 신호와 동일한 비트 뎁스를 갖도록 한다. 본 발명의 제 5 실시예에 따른 부호화 장치(600)에는 디스케일링부가 구비되어 있지 않기 때문에, 스케일링부(620)는 다음의 수학식 7과 같이 변환부(630)에 의한 변환 과정에서 발생하는 중간값(Temp)의 최대값을 계산할 수 있다.
Figure 112019071748269-pat00012
수학식 7에서 중간값은 변환부(630)가 a 단계의 변환부들을 구비하며, 각 a개의 변환부들에 의하여 증가되는 비트 뎁스를 TransformBitIncreasementk(k는 1부터 a까지의 정수)라고 가정한 경우이다.
스케일링부(620)는 다음의 수학식 8을 만족시키는 최대값인 mopt를 결정하고, 이러한 최대 mopt값을 최적 스케일링 비트 뎁스 mopt로 결정한다.
Figure 112019071748269-pat00013
스케일링부(620)는 결정된 최적 스케일링 비트 뎁스 mopt와 예측부(610)로부터 입력되는 레지듀얼 신호의 비트 뎁스 m을 비교하여, 최적 스케일링 비트 뎁스 mopt와 레지듀얼 신호의 비트 뎁스 m의 차이값인 로컬 쉬프트값(local_shift)을 결정하고, 결정된 로컬 쉬프트값이 0보다 큰지 작은지에 따라서 레지듀얼 신호에 대한 쉬프트 연산을 수행하여 레지듀얼 신호의 비트 뎁스를 변경시킨다. 전술한 바와 같이 비트 뎁스가 변경된 레지듀얼 신호는 변환, 양자화 및 엔트로피 부호화 과정을 거쳐 비트스트림이 생성된다.
한편, 본 발명의 제 5 실시예에 따른 부호화 장치(600)에 대응되는 도 11의 복호화 장치(1100)에서 디스케일링 동작을 수행하기 위해서는 부호화 장치(600)에서 어떠한 로컬 쉬프트값(local_shift)에 따라서 스케일링 동작이 수행되었는지 여부를 시그널링할 필요가 있다. 스케일링부(620)에 의하여 결정되는 로컬 쉬프트값은 변환시에 이용되는 변환 블록의 크기, 비디오 신호의 원 비트 뎁스 및 양자화 파라메터 중 적어도 하나를 고려하여 미리 결정된 소정값을 갖을 수 있다. 이와 같이 로컬 쉬프트값이 변환 블록의 크기, 비디오 신호의 원 비트 뎁스 및 양자화 파라메터 중 적어도 하나를 이용하여 결정되는 경우, 복호화 장치에서도 이러한 파라메터를 고려하여 로컬 쉬프트값을 결정할 수 있기 때문에 부가적인 로컬 쉬프트값의 부호화 과정을 생략할 수 있다.
스케일링부(620)에서 전술한 수학식 8과 같이 최적 스케일링 비트 뎁스를 결정하여 로컬 쉬프트값을 결정하는 경우, 각 블록 단위로 스케일링에 이용된 로컬 쉬프트값을 시그널링할 필요가 있다. 이 경우, 실제 로컬 쉬프트값을 시그널링하는 대신에, 블록 단위로 현재 블록의 로컬 쉬프트값과 주변 블록의 로컬 쉬프트값의 차이값만을 비트스트림에 포함시킴으로써 로컬 쉬프트값을 복호화단에 전송할 수 있다. 전술한 본 발명의 제 1 내지 제 4 실시예에 따른 부호화 장치에서도 전술한 제 5 실시예와 유사하게, 스케일링부에서 최적 스케일링 비트 뎁스를 계산하여 로컬 쉬프트값을 결정한 경우에는 현재 블록의 로컬 쉬프트값과 주변 블록의 로컬 쉬프트값의 차이값만을 비트스트림에 포함시킴으로써 로컬 쉬프트값에 대한 정보를 복호화단에 전송할 수 있다.
도 8은 본 발명의 다른 실시예에 따른 스케일링 동작을 설명하기 위한 참조도이다.
일반적으로 디지털 비디오 처리 장치의 비디오 포맷은 고정 비트뎁스를 사용한다. 현재 가장 널리 쓰이는 비디오 포맷은, 컬러별로 픽셀마다 8비트가 할당된다. N비트 비트뎁스의 비디오 포맷에서, 픽셀값은 [0, 2N-1]의 구간, 즉 0으로부터 2N-1 중에 분포하므로, 8비트 비트뎁스의 비디오 시퀀스의 픽셀값 구간은 [0, 28-1]이다. 비디오 시퀀스의 픽셀값은, 픽셀값 구간 중 중앙 근처에 분포할 확률이 더 높고, 구간 중 외곽 근처에 분포할 확률은 희박하다. 즉, 원본 비디오 시퀀스의 픽셀값의 분포는 다음과 같은 수학식 9에 따를 수 있다.
Figure 112019071748269-pat00014
원본 픽셀값 Org, 원본 픽셀값 중 최소값 Min 및 최대값 Max은 0보다 크거나 같고 2N-1보다 작거나 같으므로, 원본 픽셀값은 실제 가능한 최대 범위 2N-1보다 좁은 범위의 픽셀값 구간에 분포할 수 있다.
도 8을 참조하면, 8비트의 비트 뎁스를 갖는 픽셀값은 [0,255]의 구간(810)사이의 값을 갖을 수 있는데, 실제 원본 픽셀값은 [Min, Max]의 구간(820)에 분포할 수 있다. 이와 같이 원본 픽셀값이 원 비트 뎁스로 표현 가능한 최대한계값 내지 최소 한계값의 범위가 아닌 일부 구간에만 분포하는 경우, 원본 픽셀값의 다이나믹 레인지(dynamic range)를 원 비트 뎁스로 표현 가능한 최대 한계값 내지 최소 한계값의 범위로 확장하는 경우 픽셀값을 보다 다양한 레벨로 표현할 수 있기 때문에 향상된 영상 처리가 가능하다. 따라서, 본 발명의 다른 실시예에 따른 스케일링부에서는 원본 픽셀값의 최소값, 최대값을 알고 있는 경우, 결정된 최적 스케일링 비트 뎁스만큼 다이나믹 레인지를 변화하여 비디오 신호를 스케일링할 수 있다.
구체적으로, 비디오 신호의 픽셀값의 최소값을 Min(821), 최대값을 Max(822), [Min,Max]의 구간(820) 사이의 임의의 값을 In(823)이라고 할 때, [Min,Max]의 구간(820)을 결정된 최적 스케일링 비트 뎁스인 mopt 비트로 표현 가능한 [0,2^mopt-1]로 확장하는 경우 In(832)의 값은 다음의 수학식 10과 같이 Adjusted_In의 값으로 변경된다.
Figure 112019071748269-pat00015
스케일링부는 수학식 10에 의하여 변경된 비디오 신호에 대해서 전술한 바와 같이 로컬 쉬프트값에 따라서 좌향 쉬프트하거나 우향 쉬프트하여 스케일링을 수행한다.
수학식 10에 따라서 비디오 신호의 다이나믹 레인지가 변경된 경우, 디스케일링부는 비디오 신호의 최소값(Min) 및 최대값(Max)을 이용하여 변환된 비디오 신호를 원래 레인지로 복원하고, 복원된 레인지를 갖는 비디오 신호에 대하여 디스케일링을 수행한다.
구체적으로, 다이나믹 레인지가 변경되고, 변환부에 의하여 변환되어 출력되는 비디오 신호를 Adjusted_Output이라고 하면, 디스케일링부는 다음의 수학식 11과 같이 Adjusted_Output의 값을 비디오 신호의 원래 레인지로 복원하고, 복원된 레인지의 비디오 신호를 원 비트 뎁스로 디스케일링하여 복원된 레인지 및 원 비트 뎁스를 갖는 출력값 Output을 생성한다.
Figure 112019071748269-pat00016
도 9는 본 발명의 실시예에 따른 비디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 9를 참조하면, 단계 910에서 비디오 신호의 변환 과정에서 발생하는 중간값의 최대 비트와 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 상기 비디오 신호의 최적 스케일링 비트 뎁스를 결정한다. 전술한 바와 같이, 중간값의 최대 비트는 비디오 신호의 원 비트 뎁스와 비디오 신호의 변환 과정에서 발생되는 비트 증가량인 변환 비트 증가량을 더한 값에, 비디오 신호의 비트 뎁스를 확장하기 위한 스케일링에 대응하여 확장된 비트뎁스를 축소하기 위한 디스케일링에 의해 축소되는 디스케일링 비트량을 감산한 값이다. 만약, a 단계의 변환들과 b 단계의 디스케일링을 포함하는 경우, 스케일링부는 전술한 수학식 6과 같이 최적 스케일링 비트 뎁스와 a 단계의 변환들 각각에 의한 변환 비트 증가량을 합산한 값으로부터 b단계의 디스케일링 각각에 의한 디스케일링 비트량을 합산한 값을 감산한 값이 최대 비트 정밀도보다 작도록 최적 스케일링 비트 뎁스를 결정한다.
단계 920에서 결정된 최적 스케일링 비트 뎁스의 값 및 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 비디오 신호를 스케일링한다. 구체적으로, 만약 결정된 최적 스케일링 비트 뎁스가 비디오 신호의 원 비트 뎁스보다 큰 경우, 결정된 최적 스케일링 비트 뎁스와 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값만큼 비디오 신호를 좌향 쉬프트하여 비디오 신호의 비트 정밀도를 증가시킨다. 만약 결정된 최적 스케일링 비트 뎁스가 비디오 신호의 원 비트 뎁스보다 작은 경우, 결정된 최적 스케일링 비트 뎁스와 비디오 신호의 원 비트 뎁스의 차이값만큼 비디오 신호를 우향 쉬프트하여 비디오 신호의 비트 정밀도를 감소시킨다.
단계 930에서 스케일링된 비디오 신호에 대한 변환을 수행한다.
본 발명의 실시예에 따른 비디오 신호의 부호화 방법은 스케일링되어 변환된 비디오 신호를 원 비트 뎁스로 복원하기 위하여 변환된 비디오 신호에 대하여 디스케일링을 더 수행할 수 있다. 이러한 디스케일링은 스케일링 과정의 역과정으로써, 최적 스케일링 비트 뎁스가 비디오 신호의 원 비트 뎁스보다 큰 경우 변환된 비디오 신호에 소정 오프셋을 더한 값을 우향 쉬프트하여 변환된 비디오 신호의 비트 정밀도를 감소시키거나, 최적 스케일링 비트 뎁스가 비디오 신호의 원 비트 뎁스보다 작은 경우에는 변환된 비디오 값을 좌향 쉬프트하여 변환된 비디오 신호의 비트 정밀도를 증가시킴으로써 수행될 수 있다.
도 10은 본 발명의 일 실시예에 따른 비디오 신호의 복호화 장치를 나타낸 블록도이다.
도 10을 참조하면, 본 발명의 일 실시예에 따른 비디오 신호의 복호화 장치(1000)는 파싱부(1010), 엔트로피 복호화부(1020), 역양자화부(1030), 스케일링부(1040), 역변환부(1050), 디스케일링부(1060), 예측부(1070) 및 영상 복원부(1080)를 포함한다.
파싱부(1010)는 수신된 비트스트림을 파싱하여 비디오 신호의 부호화된 데이터를 추출한다. 엔트로피 복호화부(1020)는 추출된 부호화된 데이터에 대해 엔트로피 복호화를 수행하여 엔트로피 복호화된 데이터를 복원한다. 역양자화부(1030)는 엔트로피 복호화된 데이터에 대한 역양자화를 수행한다. 스케일링부(1040)는 엔트로피 복호화된 데이터의 역변환 과정에서 발생하는 중간값의 최대 비트와 엔트로피 복호화된 데이터가 갖을 수 있는 최대 비트 정밀도를 고려하여 엔트로피 복호화된 데이터의 최적 스케일링 비트 뎁스를 결정하고, 결정된 최적 스케일링 비트 뎁스의 값 및 엔트로피 복호화된 데이터의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 엔트로피 복호화된 데이터를 스케일링한다. 스케일링부(1040)의 동작은 그 입력값으로 엔트로피 복호화된 데이터를 이용하고 최적 스케일링 비트 뎁스를 결정할 때 역변환부(1050)에 의하여 발생하는 중간값의 최대 비트를 고려한다는 차이점만 있을 뿐 그 구체적인 동작은 본 발명의 일 실시예에 따른 부호화 장치(100)의 스케일링부(120)의 동작과 유사하다.
역변환부(1050)는 스케일링된 엔트로피 복호화된 데이터에 대한 역변환을 수행하며, 디스케일링부(1060)는 역변환된 데이터의 비트 뎁스를 원 비트 뎁스로 복원하는 디스케일링을 수행한다. 디스케일링부(1060)의 출력값은 부호화 과정에서 스케일링부로 입력되는 원 비트 뎁스의 레지듀얼 신호이다. 예측부(1070)는 인터 예측 또는 인트라 예측을 통해 예측 신호를 생성하고, 영상 복원부(1080)는 예측 신호와 복원된 원 비트 뎁스의 레지듀얼 신호를 가산하여 비디오 신호를 복원한다.
도 11은 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 장치의 구성을 나타낸 블록도이다.
도 11을 참조하면, 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 장치(1100)는 파싱부(1110), 엔트로피 복호화부(1120), 역양자화부(1130), 역변환부(1140), 디스케일링부(1150), 예측부(1160) 및 영상 복원부(1170)를 포함한다. 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 장치(1100)는 전술한 도 6의 제 5 실시예에 따른 부호화 장치(600)에서 스킵된 디스케일링 동작을 수행한다. 디스케일링부(1150)는 복호화된 비디오 신호에 대한 디스케일링을 수행하기 위한 로컬 쉬프트 값을 결정하고, 결정된 로컬 쉬프트 값에 따라서 복호화된 비디오 신호에 대한 디스케일링을 수행한다. 만약, 로컬 쉬프트값이 변환 블록의 크기, 비디오 신호의 원 비트 뎁스 및 양자화 파라메터 중 적어도 하나를 고려하여 결정된 소정값을 갖는 경우라면, 디스케일링부(1150)는 이러한 파라메터 중 적어도 하나를 이용하여 부호화시에 이용된 것과 동일할 로컬 쉬프트값을 결정하여 디스케일링을 수행한다. 만약, 로컬 쉬프트값이 비디오 신호를 구성하는 소정 크기의 블록 단위로, 현재 블록의 로컬 쉬프트값과 주변 블록의 로컬 쉬프트값의 차이를 통해 시그널링된 경우라면, 디스케일링부(1150)는 이전에 복호화된 주변 블록의 로컬 쉬프트값과 비트스트림으로부터 복원된 로컬 쉬프트 차이값을 가산하여 현재 블록의 로컬 쉬프트값을 복원하고, 복원된 로컬 쉬프트값을 이용하여 디스케일링을 수행한다. 복호화 장치(1100)의 다른 구성 성분의 동작은 전술한 일 실시예의 복호화 장치(1000)와 유사한 바 구체적인 설명은 생략한다.
도 12는 본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
도 12를 참조하면, 단계 1210에서 수신된 비트스트림을 파싱하여 비디오 신호의 부호화된 데이터를 추출한다. 단계 1220에서 추출된 부호화된 데이터에 대해 엔트로피 복호화를 수행하여 엔트로피 복호화된 데이터를 복원한다.
단계 1230에서 엔트로피 복호화된 데이터의 역변환 과정에서 발생하는 중간값의 최대 비트와 엔트로피 복호화된 데이터가 갖을 수 있는 최대 비트 정밀도를 고려하여 엔트로피 복호화된 데이터의 최적 스케일링 비트 뎁스를 결정한다. 여기서, 중간값의 최대 비트는 엔트로피 복호화된 데이터의 원 비트 뎁스와 엔트로피 복호화된 데이터의 역변환 과정에서 발생되는 비트 증가량인 역변환 비트 증가량을 더한 값에, 엔트로피 복호화된 데이터의 비트 뎁스를 확장하기 위한 스케일링에 대응하여 확장된 비트뎁스를 축소하기 위한 디스케일링에 의해 축소되는 디스케일링 비트량을 감산한 값이다. 만약, c(c는 정수) 단계의 역변환들과 엔트로피 복호화된 데이터의 비트 뎁스를 확장하기 위한 스케일링에 대응하여 확장된 비트뎁스를 축소하기 위한 d(d는 정수) 단계의 디스케일링을 포함하는 경우, 최적 스케일링 비트 뎁스와 c 단계의 역변환들 각각에 의한 역변환 비트 증가량을 합산한 값으로부터 d단계의 디스케일링 각각에 의한 디스케일링 비트량을 합산한 값을 감산한 값이 최대 비트 정밀도보다 작도록 최적 스케일링 비트 뎁스를 결정할 수 있다.
단계 1240에서, 결정된 최적 스케일링 비트 뎁스의 값 및 엔트로피 복호화된 데이터의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 엔트로피 복호화된 데이터를 스케일링한다. 구체적으로, 최적 스케일링 비트 뎁스가 엔트로피 복호화된 데이터의 원 비트 뎁스보다 큰 경우, 최적 스케일링 비트 뎁스와 엔트로피 복호화된 데이터의 원 비트 뎁스의 차이값만큼 엔트로피 복호화된 데이터를 좌향 쉬프트하여 엔트로피 복호화된 데이터의 비트 정밀도를 증가시킨다. 만약, 최적 스케일링 비트 뎁스가 엔트로피 복호화된 데이터의 원 비트 뎁스보다 작은 경우, 최적 스케일링 비트 뎁스와 엔트로피 복호화된 데이터의 원 비트 뎁스의 차이값만큼 엔트로피 복호화된 데이터를 우향 쉬프트하여 엔트로피 복호화된 데이터의 비트 정밀도를 감소시킨다.
단계 1250에서 스케일링된 엔트로피 복호화된 데이터에 대한 역변환을 수행한다.
본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법은 역변환된 데이터에 대한 디스케일링 과정을 더 포함할 수 있다. 디스케일링 과정은 스케일링 과정의 역과정으로써 최적 스케일링 비트 뎁스가 엔트로피 복호화된 데이터의 원 비트 뎁스보다 큰 경우 역변환된 데이터에 소정 오프셋을 더한 값을 우향 쉬프트하여 역변환된 데이터의 비트 정밀도를 감소시키며, 최적 스케일링 비트 뎁스가 엔트로피 복호화된 데이터의 원 비트 뎁스보다 작은 경우 역변환된 데이터 값을 좌향 쉬프트하여 역변환된 데이터의 비트 정밀도를 증가시킨다.
도 13은 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 방법을 나타낸 플로우 차트이다. 본 발명의 다른 실시예에 따른 비디오 신호의 복호화 방법은 전술한 도 11의 복호화 장치(1100)과 같이 부호화측에서 생략된 디스케일링 동작을 수행하여 원 비트 뎁스를 갖는 비디오 신호를 복호화하는 과정에 대응된다.
도 13을 참조하면, 단계 1310에서 비디오 신호의 변환 과정에서 발생하는 중간값의 최대 비트와 비디오 신호가 갖을 수 있는 최대 비트 정밀도를 고려하여 결정된 최적 스케일링 비트 뎁스의 값 및 비디오 신호의 원 비트 뎁스의 차이값인 로컬 쉬프트값에 따라서 스케일링되어 부호화된 비디오 신호를 수신한다.
단계 1320에서, 수신된 비디오 신호에 대한 엔트로피 복호화, 양자화 및 역변환을 수행하여 복호화된 비디오 신호를 생성한다.
단계 1330에서, 복호화된 비디오 신호에 대한 디스케일링을 수행하기 위한 상기 로컬 쉬프트 값을 결정한다. 전술한 바와 같이, 이러한 로컬 쉬프트 값은 비디오 신호의 원 비트 뎁스 및 양자화 파라메터 중 적어도 하나를 고려하여 결정되거나, 이전에 복호화된 주변 블록의 로컬 쉬프트값과 비트스트림으로부터 복원된 로컬 쉬프트 차이값을 가산하여 결정될 수 있다.
단계 1340에서, 결정된 로컬 쉬프트값에 따라서 복호화된 비디오 신호에 대한 디스케일링르 수행하여 부호화 시의 원 비트 뎁스로 복호화된 비디오 신호의 비트 뎁스를 변경한다.
본 발명에 따르면 비디오 신호의 변환 및 역변환시에 비디오 신호의 비트 뎁스를 증가시킴으로써 연산 정밀도를 향상시키는 한편, 비트 뎁스의 증가에도 불구하고 연산 과정에서 허용가능한 비트 뎁스를 초과하는 오버플로우가 발생되지 않도록 비디오 신호 처리를 수행할 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등) 및 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (3)

  1. 비디오 신호를 복호화하는 복호화 방법에 있어서,
    비트스트림으로부터 비디오 신호 내 변환 블록의 변환 계수를 획득하는 단계;
    상기 변환 블록의 상기 변환 계수에 대해 역양자화를 수행하여 역양자화된 변환 계수를 생성하는 단계; 및
    상기 역양자화된 변환 계수에 역변환 및 디스케일링을 수행하여 레지듀얼 값을 생성하는 단계를 포함하고,
    상기 디스케일링은 로컬 시프트 값에 따라 비트 쉬프트를 수행하는 것을 포함하고,
    상기 로컬 시프트 값은 상기 비디오 신호의 비트뎁스를 이용하여 결정되고,
    상기 역변환은 수평방향 역변환 및 수직방향 역변환을 포함하고,
    상기 수직방향 역변환은 변환 행렬과의 곱셉 연산에 의해 수행되는 것을 특징으로 하는 복호화 방법.
  2. 제 1 항에 있어서,
    상기 역변환은 이산 코사인 역변환, 이산 웨이블릿 역변환과 같은 선형 역변환인 것을 특징으로 하는 복호화 방법.
  3. 비디오 신호를 복호화하는 복호화 장치에 있어서,
    비트스트림으로부터 비디오 신호 내 변환 블록의 변환 계수를 획득하는 파싱부;
    상기 변환 블록의 상기 변환 계수에 대해 역양자화를 수행하여 역양자화된 변환 계수를 생성하는 역양자화부; 및
    상기 역양자화된 변환 계수에 역변환 및 디스케일링을 수행하여 레지듀얼 값을 생성하는 역변환부 및 디스케일링부를 포함하고,
    상기 디스케일링은 로컬 시프트 값에 따라 비트 쉬프트를 수행하는 것을 포함하고,
    상기 로컬 시프트 값은 상기 비디오 신호의 비트뎁스를 이용하여 결정되고,
    상기 역변환은 수평방향 역변환 및 수직방향 역변환을 포함하고,
    상기 수직방향 역변환은 변환 행렬과의 곱셈 연산에 의해 수행되는 것을 특징으로 하는 복호화 장치.
KR1020190084680A 2010-05-14 2019-07-12 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 KR102053317B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US33463210P 2010-05-14 2010-05-14
US61/334,632 2010-05-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020180088861A Division KR102003048B1 (ko) 2010-05-14 2018-07-30 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치

Publications (2)

Publication Number Publication Date
KR20190085907A KR20190085907A (ko) 2019-07-19
KR102053317B1 true KR102053317B1 (ko) 2019-12-06

Family

ID=45395318

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020110006485A KR101885258B1 (ko) 2010-05-14 2011-01-21 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR1020180088861A KR102003048B1 (ko) 2010-05-14 2018-07-30 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR1020190084680A KR102053317B1 (ko) 2010-05-14 2019-07-12 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020110006485A KR101885258B1 (ko) 2010-05-14 2011-01-21 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR1020180088861A KR102003048B1 (ko) 2010-05-14 2018-07-30 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치

Country Status (6)

Country Link
US (5) US9525889B2 (ko)
EP (2) EP2569947A4 (ko)
KR (3) KR101885258B1 (ko)
CN (5) CN105939478B (ko)
MY (5) MY173534A (ko)
WO (1) WO2011142645A2 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101885258B1 (ko) 2010-05-14 2018-08-06 삼성전자주식회사 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR101836981B1 (ko) * 2010-07-09 2018-03-09 한국전자통신연구원 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
KR20120140181A (ko) * 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
GB2492333B (en) * 2011-06-27 2018-12-12 British Broadcasting Corp Video encoding and decoding using transforms
JP6480186B2 (ja) * 2012-01-19 2019-03-06 ヴィド スケール インコーポレイテッド ビデオコーディング量子化およびダイナミックレンジ制御のシステムおよび方法
CN104813672A (zh) 2012-11-27 2015-07-29 Lg电子株式会社 信号收发装置和信号收发方法
GB2513111A (en) * 2013-04-08 2014-10-22 Sony Corp Data encoding and decoding
US9877025B2 (en) * 2013-07-12 2018-01-23 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
GB2521349A (en) * 2013-12-05 2015-06-24 Sony Corp Data encoding and decoding
US20150302553A1 (en) * 2014-03-17 2015-10-22 Thomson Licensing Method and apparatus for determining source resolution of scaled images
EP2958329B1 (en) * 2014-06-16 2018-12-05 Thomson Licensing Method for encoding and decoding an image block based on dynamic range extension, encoder and decoder
JP6529374B2 (ja) * 2014-10-07 2019-06-12 キヤノン株式会社 符号化装置及びその制御方法
EP3007448A1 (en) 2014-10-07 2016-04-13 Canon Kabushiki Kaisha Disparity data encoding apparatus and method of controlling the same for
US10735755B2 (en) * 2015-04-21 2020-08-04 Arris Enterprises Llc Adaptive perceptual mapping and signaling for video coding
WO2018174591A1 (ko) 2017-03-22 2018-09-27 김기백 영상을 구성하는 화소값 범위를 이용한 영상 부호화/복호화 방법
US11445218B2 (en) * 2017-11-24 2022-09-13 Sony Corporation Image processing apparatus and method
WO2019159697A1 (ja) * 2018-02-14 2019-08-22 ソニー株式会社 画像処理装置および方法
KR20200043169A (ko) * 2018-10-17 2020-04-27 삼성전자주식회사 뉴럴 네트워크의 파라미터를 양자화하는 방법 및 장치
JP7267785B2 (ja) * 2019-03-11 2023-05-02 キヤノン株式会社 画像復号装置、画像復号方法、及びプログラム
JP2020150338A (ja) 2019-03-11 2020-09-17 キヤノン株式会社 画像復号装置、画像復号方法、及びプログラム
WO2021047540A1 (en) 2019-09-09 2021-03-18 Beijing Bytedance Network Technology Co., Ltd. Coefficient scaling for high precision image and video coding
CN114731392A (zh) * 2019-09-21 2022-07-08 北京字节跳动网络技术有限公司 用于图像和视频编解码的高精度变换和量化
US11838551B2 (en) * 2020-12-30 2023-12-05 Ofinno, Llc Adaptive block level bit-depth prediction

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0182940B1 (en) 1984-11-13 1990-04-11 Mobil Oil Corporation Mannich base oil additives
JP3166291B2 (ja) * 1992-04-03 2001-05-14 ソニー株式会社 量子化コントロール回路
US5793658A (en) * 1996-01-17 1998-08-11 Digital Equipment Coporation Method and apparatus for viedo compression and decompression using high speed discrete cosine transform
EP1862940A1 (en) * 1998-03-20 2007-12-05 Mitsubishi Electric Corporation Image compression
US6801665B1 (en) 1998-09-15 2004-10-05 University Of Maryland Method and apparatus for compressing and decompressing images
CN100481946C (zh) * 1998-03-20 2009-04-22 三菱电机株式会社 编码和解码及压缩图像的方法和装置
US6560285B1 (en) * 1998-03-30 2003-05-06 Sarnoff Corporation Region-based information compaction as for digital images
US6377706B1 (en) * 1998-05-12 2002-04-23 Xerox Corporation Compression framework incorporating decoding commands
US6731686B1 (en) * 2000-05-31 2004-05-04 Sun Microsystems, Inc. Apparatus and method for pipelining variable length decode and inverse quantization operations in a hybrid motion-compensated and transform coded video decoder
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7106909B2 (en) * 2001-12-25 2006-09-12 Canon Kabushiki Kaisha Method and apparatus for encoding image data in accordance with a target data size
JP4015934B2 (ja) * 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
US7277486B2 (en) * 2002-05-03 2007-10-02 Microsoft Corporation Parameterization for fading compensation
US7760950B2 (en) * 2002-09-26 2010-07-20 Ntt Docomo, Inc. Low complexity and unified transforms for video coding
KR20050022160A (ko) * 2003-08-26 2005-03-07 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 및 스케일러블비디오 엔코더 및 디코더
CN1843040A (zh) * 2003-08-26 2006-10-04 三星电子株式会社 可扩缩视频编码和解码方法及可扩缩视频编码器和解码器
US7599438B2 (en) * 2003-09-07 2009-10-06 Microsoft Corporation Motion vector block pattern coding and decoding
US7457362B2 (en) * 2003-10-24 2008-11-25 Texas Instruments Incorporated Loop deblock filtering of block coded video in a very long instruction word processor
US7693339B2 (en) * 2003-12-17 2010-04-06 Andreas Wittenstein Method and apparatus for faster-than-real-time lossless compression and decompression of images
DE602004014901D1 (de) 2004-04-29 2008-08-21 Mitsubishi Electric Corp Adaptive Quantisierung einer Tiefenkarte
JP2005354307A (ja) * 2004-06-09 2005-12-22 Toshiba Corp 逆量子化器及びこれを用いた画像復号化装置
US7474316B2 (en) 2004-08-17 2009-01-06 Sharp Laboratories Of America, Inc. Bit-depth extension of digital displays via the use of models of the impulse response of the visual system
US7778327B2 (en) * 2005-02-08 2010-08-17 Texas Instruments Incorporated H.264 quantization
US7949044B2 (en) * 2005-04-12 2011-05-24 Lsi Corporation Method for coefficient bitdepth limitation, encoder and bitstream generation apparatus
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7916961B2 (en) * 2005-09-06 2011-03-29 Megachips Corporation Compression encoder, compression encoding method and program
US7706288B2 (en) * 2005-09-27 2010-04-27 Qualcomm Incorporated RF channel switching in broadcast OFDM systems
US9554319B2 (en) 2005-09-27 2017-01-24 Qualcomm Incorporated Channel handoff methods in wireless broadcast systems
KR100967731B1 (ko) 2005-09-27 2010-07-05 콸콤 인코포레이티드 채널 스위치 프레임
US8548265B2 (en) * 2006-01-05 2013-10-01 Fastvdo, Llc Fast multiplierless integer invertible transforms
US20080240257A1 (en) * 2007-03-26 2008-10-02 Microsoft Corporation Using quantization bias that accounts for relations between transform bins and quantization bins
BRPI0810213A8 (pt) * 2007-05-16 2018-12-11 Thomson Licensing métodos e aparelho para uso de grupos de fatia na decodificação de informações de codificação de vídeo de múltiplas vistas (mvc).
US8085852B2 (en) * 2007-06-26 2011-12-27 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding
US7983496B2 (en) * 2007-06-26 2011-07-19 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding adapted to variable block sizes
DE102007041143B4 (de) 2007-08-30 2010-04-08 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren zum Analysieren von gleichzeitig übertragenen, verschlüsselten Datenströmen in IP-Netzwerken
US8064517B1 (en) * 2007-09-07 2011-11-22 Zenverge, Inc. Perceptually adaptive quantization parameter selection
US8204333B2 (en) * 2007-10-15 2012-06-19 Intel Corporation Converting video and image signal bit depths
US8213502B2 (en) * 2007-12-31 2012-07-03 Ceva D.S.P. Ltd. Method and system for real-time adaptive quantization control
US9729888B2 (en) * 2009-09-10 2017-08-08 Dolby Laboratories Licensing Corporation Speedup techniques for rate distortion optimized quantization
KR101885258B1 (ko) 2010-05-14 2018-08-06 삼성전자주식회사 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
K. Chono, et al. Description of video coding technology proposal by NEC Corporation. JCT-VC of ITU-T and ISO/IEC. JCTVC-A104. Apr. 2010. pp.1-57

Also Published As

Publication number Publication date
US20170064316A1 (en) 2017-03-02
US10027967B2 (en) 2018-07-17
CN103026705A (zh) 2013-04-03
WO2011142645A2 (en) 2011-11-17
CN106028040A (zh) 2016-10-12
KR20110126032A (ko) 2011-11-22
MY173534A (en) 2020-01-31
US20170064317A1 (en) 2017-03-02
MY173540A (en) 2020-02-03
MY173533A (en) 2020-01-31
EP3133814A1 (en) 2017-02-22
CN105939478B (zh) 2019-03-08
US20110280302A1 (en) 2011-11-17
KR101885258B1 (ko) 2018-08-06
US10116949B2 (en) 2018-10-30
KR102003048B1 (ko) 2019-07-23
MY173539A (en) 2020-02-03
CN105847818A (zh) 2016-08-10
CN105939477B (zh) 2019-04-05
MY171636A (en) 2019-10-22
CN105939477A (zh) 2016-09-14
US10091516B2 (en) 2018-10-02
US9525889B2 (en) 2016-12-20
US10075721B2 (en) 2018-09-11
KR20180089350A (ko) 2018-08-08
US20170064314A1 (en) 2017-03-02
CN103026705B (zh) 2016-06-29
CN106028040B (zh) 2019-05-10
EP2569947A4 (en) 2015-08-19
EP2569947A2 (en) 2013-03-20
WO2011142645A3 (en) 2012-03-08
CN105939478A (zh) 2016-09-14
KR20190085907A (ko) 2019-07-19
CN105847818B (zh) 2019-03-01
US20170064315A1 (en) 2017-03-02

Similar Documents

Publication Publication Date Title
KR102053317B1 (ko) 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
JP3776920B2 (ja) 画像符号化方法
RU2612614C2 (ru) Способ и устройство для выполнения интерполяции на основе преобразования и обратного преобразования
US8194748B2 (en) Apparatus for scalable encoding/decoding of moving image and method thereof
KR20070032111A (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
JP2022531902A (ja) ブロックベース予測
KR20120098500A (ko) 영상의 변환 및 역변환 방법, 및 이를 이용한 영상의 부호화 및 복호화 장치
KR20080018469A (ko) 영상 변환 방법 및 장치, 역변환 방법 및 장치
JP2011233972A (ja) 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
KR101375667B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP2005318297A (ja) 動画像符号化・復号方法及び装置
US6067320A (en) Method and apparatus for encoding and decoding images
JP2022186939A (ja) 符号化装置、復号装置及びプログラム
KR20130049736A (ko) 인터 예측 방법 및 장치
JP5812011B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP2005354307A (ja) 逆量子化器及びこれを用いた画像復号化装置
JP6557589B2 (ja) 符号化装置、復号装置、及びプログラム
JP5175813B2 (ja) 符号化装置、復号装置及び画像処理プログラム
JP5404857B2 (ja) 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
JP2018032900A (ja) 映像符号化装置及び映像復号装置
JP2018026726A (ja) 符号化装置及びプログラム
JP2015061143A (ja) 映像符号化装置、および、映像符号化プログラム

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant