KR20170041778A - 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법 - Google Patents

인코더, 디코더, 인코딩과 디코딩 시스템 및 방법 Download PDF

Info

Publication number
KR20170041778A
KR20170041778A KR1020177005691A KR20177005691A KR20170041778A KR 20170041778 A KR20170041778 A KR 20170041778A KR 1020177005691 A KR1020177005691 A KR 1020177005691A KR 20177005691 A KR20177005691 A KR 20177005691A KR 20170041778 A KR20170041778 A KR 20170041778A
Authority
KR
South Korea
Prior art keywords
quantized
residual
value
quantization
stage
Prior art date
Application number
KR1020177005691A
Other languages
English (en)
Other versions
KR102014295B1 (ko
Inventor
구일라우메 푸흐스
벤야민 슈베르트
글체고르츠 피에트르지크
마르쿠스 물트루스
베른하르트 그릴
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20170041778A publication Critical patent/KR20170041778A/ko
Application granted granted Critical
Publication of KR102014295B1 publication Critical patent/KR102014295B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

본 발명의 실시 예들은 양자화 스테이지, 엔트로피 인코더, 잔여 양자화 스테이지 및 코딩된 신호 형성기를 포함하는 인코더를 제공한다. 양자화 스테이지는 복수의 양자화된 값을 획득하기 위해 데드 존을 사용하여 입력 신호를 양자화하도록 구성된다. 엔트로피 인코더는 복수의 엔트로피 인코딩된 값을 획득하기 위해 엔트로피 부호화 방식을 이용하여 복수의 양자화된 값을 인코딩 하도록 구성된다. 잔여 양자화 스테이지는 양자화 스테이지에 의해 야기되는 잔여 신호를 양자화하도록 구성되고, 상기 잔여 양자화 스테이지는 양자화 스테이지의 데드 존에 따라 적어도 하나의 양자화된 잔여 값을 결정하도록 구성된다. 코딩된 신호 형성기는 복수의 엔트로피 인코딩된 값 및 적어도 하나의 양자화 된 잔여 값으로부터 코딩된 신호를 형성하도록 구성된다.

Description

인코더, 디코더, 인코딩과 디코딩 시스템 및 방법 {Encoder, Decoder, System and Methods for Encoding and Decoding}
실시예는 인코더, 디코더, 인코더 및 디코더를 포함하는 시스템, 인코딩 방법 및 디코딩 방법에 관한 것이다. 일부 실시 예는 소스 코딩에서 최적 잔여 양자화를 위한 장치 및 방법에 관한 것이다. 일부 실시 예들은 엔트로피 코딩을 사용하여 결정된 비트 수에 대한 양자화 된 신호를 코딩하는 소스 코딩 방식에 관한 것이다.
엔트로피 코딩은 전송하는 기호의 중복을 이용하는 효율적인 도구이다. 이는 일반적으로 스펙트럼 라인의 양자화 후 변환-기반 코딩(transform-based coding)에 사용된다. 사전 확률 분포(priori probability distribution)를 이용함으로써, 양자화된 값은 감소된 다수의 비트로 손실 없이 코딩될 수 있다. 이 원리는 길이가 기호 확률 함수(function of the symbol probability)인 코드워드를 생성하는 데 있다.
비트 소비는 일반적으로 엔트로피 코딩된 기호를 비트 스트림에 기록한 후에만 알 수 있다. 일반적으로 양자화 스테이지를 최적화할 때 문제가 발생하고, 이는 레이트 왜곡 함수(rate distortion function)를 최적화하기 위해 비트 소비를 알아야 하는 것을 필요로한다. 비트스트림이 프레임 당 일정 크기를 가져야 할 때, 이를 고정 비트 레이트라고도 하는데, 이 때에 더욱 문제가 되고, 이는 대부분의 통신 네트워크 프로토콜에 대해 요구되는 문제이다.
변환 인코더에서, 스케일 팩터 세트(set of scale factors)는 주파수 도메인에서 양자화 노이즈를 형상화에 의해, 일반적으로 양자화를 정의한다. 노이즈 형상화(noise shaping)는, 보통 심리 음향(psychoacoustic) 모델에 의해 주어지는 감지된 왜곡 및 생성된 비트 소비의 함수이다. 그러나 마지막 팩터는 일반적으로 양자화 노이즈 형상화를 수정한 후에만 알 수 있다. 최적화 루프는 수렴된 최적화를 만드는데 사용될 수 있다. 그럼에도 불구하고 이러한 최적화는 상대적으로 복잡하고, 실제 어플리케이션에서는, 허용될 수 있는 반복시행(iterations) 회수가 크게 제한될 수 밖에 없다. 또한 복잡성을 더욱 줄이기 위해, 비트 소비량은 일반적으로 완전히 계산되지 않고 추측된다. 최종 비트 소비가 과소 평가되는 경우, 비트-스트림은 절단되어야 할 것인데, 이는 대부분의 경우 기피된다. 실제로 과소 추정은 비트 스트림의 하드 절단(hard truncation)을 초래할 것이고, 이는 양자화 포화를 만드는 것과 동등하다. 따라서, 양자화 최적화는 일반적으로 비트 소비를 과대 추정하도록 설계된다. 결과적으로 몇몇 비트는 최종 비트스트림에서 종종 사용되지 않게 된다.
이 문제를 극복하기 위해, 잔여 (또는 두 번째) 양자화 스테이지가 최종 미사용 비트를 이용하기 위한 첫 번째 양자화 스테이지 후에 추가될 수 있다. 이러한 잔여 비트는 양자화 노이즈를 정제하는 데 사용될 수 있다. 이하에서 이 원리가 설명된다.
도 10은 변환 인코더(10)의 블록도이다. 변환 인코더(10)는 첫 번째 양자화 스테이지(12), 잔여 양자화 스테이지(14), 엔트로피 인코더(16), 엔트로피 코딩 비트 추정 유닛(18), 멀티플렉서(20) 및 변환 유닛(22)을 포함한다.
변환 유닛(22)은 입력 신호를 시간 도메인에서 주파수 도메인으로 변환하도록 구성된다. 첫 번째 양자화 스테이지(12)는 주파수 도메인에서 입력 신호를 복수의 양자화 된 스펙트럼 값 q 로 양자화하도록 구성된다. 복수의 양자화된 스펙트럼 값 q, 주파수 도메인에서의 입력 신호 x 와 잔여 비트 수는 잔여(또는 두 번째) 양자화 스테이지(14)로의 입력이고 이는 첫 번째 양자화 스테이지(12)의 출력을 정제하고 복수의 양자화된 잔여 값 qr 을 제공하도록 구성된다. 엔트로피 인코더(16)는 복수의 엔트로피 인코딩된 값 e를 획득하기 위해 복수의 양자화 된 스펙트럼 값 q 를 엔트로피 인코딩 하도록 구성된다. 멀티플렉서 (20)는 비트 스트림을 획득하기 위해 첫 번째 양자화 스테이지(14)에 의해 제공된 정보 및 두 번째 양자화(16)에 의해 전달된 복수의 양자화된 잔여 값에 따른 복수의 엔트로피 인코딩 값 e, 스케일 인자를 멀티 플렉싱 하도록 구성된다.
도 10에 도시된 변환 인코더(10)는 프레임당 특정 타겟 비트 수를 전달하도록 설계된다. 양자화는 이 목표에 도달하도록 조정되지만, 복잡성 때문에 엔트로피 인코더 비트 소비량 추정은 양자화 단계를 조정할 때에만 수행된다. 게다가 비트 추정이 매우 정확하더라도 예상된 타겟 비트로 이어지는 스케일 팩터 세트를 찾는 것이 불가능할 수 있다. 첫 번째 양자화 스테이지(12) 후에, 양자화된 값 q는 엔트로피 코딩된다. 잔여 비이용 비트(remaining unexploited bits)는 잔여 양자화에 할당되고, 이는 첫 번째 양자화 스테이지(12)의 출력을 정제할 것이다. 잔여 양자화 스테이지(14)는 양자화된 스펙트럼 값 q, 원래의 스펙트럼 값 x 및 잔여 비트 수를 입력으로서 취한다. 잔여 비트 수는 추정 또는 실제 잔여 비트 수가 될 수 있다. 이 추정은 AMR-WB+ (Adaptive Multi-Rate Wide Band Extended) 에서 수행되기 때문에 예컨대 폐-루프 결정 방식에서의 스위칭 결정과 같이 인코더 측에서 로컬 합성이 필요할 때 보통 사용된다. 이 경우, 잔여 코딩은 엔트로피 인코더(16)의 최종 호출 전에 호출되어야 한다.
공통 변환 인코더(10)에서, 잔여 양자화 스테이지(14)는 양자화된 스펙트럼 값 및 원래의 입력 신호를 역 양자화함으로써 획득된 역 양자화된 입력 신호 차이의 단순한 균일 스칼라 양자화를 수행한다. 그러나, 레이트 - 왜곡 성능 분석(rate-distortion performance analysis)을 통해, 균일 양자화는 메모리가 없고 균일하게 분산된 소스에 대해서만 최적인 것으로 알려져있다.
따라서, 본 발명의 목적은 비-메모리(non-memoryless) 및 비-균일(non-uniformly)하게 분산된 소스들에 대한 개선된 잔여 양자화를 제공하는 것이다.
이러한 목적은 독립 청구항에 의해 해결된다.
본 발명의 실시 예들은 양자화 스테이지, 엔트로피 인코더, 잔여 양자화 스테이지 및 코딩된 신호 형성기를 포함하는 인코더를 제공한다. 양자화 스테이지는 복수의 양자화된 값을 획득하기 위해 데드 존을 사용하여 입력 신호를 양자화하도록 구성된다. 엔트로피 인코더는 복수의 엔트로피 인코딩된 값을 획득하기 위해 엔트로피 인코딩 방식을 이용하여 복수의 양자화된 값을 인코딩하도록 구성된다. 잔여 양자화 스테이지는 양자화 스테이지에 의해 야기되는 잔여 신호를 양자화하도록 구성되며, 상기 잔여 양자화 스테이지는 양자화 스테이지의 데드 존에 따라 적어도 하나의 양자화된 잔여 값을 결정하도록 구성된다. 코딩된 신호 형성기는 복수의 엔트로피 인코딩된 값 및 적어도 하나의 양자화된 잔여 값으로부터 코딩된 신호를 형성하도록 구성된다.
또한, 본 발명의 실시 예들은 코딩된 신호 분석기, 엔트로피 디코더 및 역 양자화 스테이지를 포함하는 디코더를 제공한다. 코딩된 신호 분석기는 복수의 엔트로피 인코딩된 값 및 적어도 하나의 양자화된 잔여 값을 획득하기 위해 코딩된 신호를 분석하도록 구성된다. 엔트로피 디코더는 복수의 양자화된 값을 획득하기 위해 엔트로피 디코딩 방식을 이용하여 복수의 엔트로피 인코딩된 값을 디코딩 하도록 구성된다. 역 양자화 스테이지는 출력 신호를 획득하기 위해 복수의 양자화된 값을 역 양자화하도록 구성된다. 또한, 역 양자화 스테이지는 양자화된 잔여 값 및 데드 존에 따라 출력 신호를 획득하는데 이용되는 역 양자화 레벨을 정제하도록 구성된다.
본 발명의 개념에 따르면, 복수의 양자화된 값의 역 양자화에 의해 획득된 (원래) 입력 신호와 역 양자화된 신호 사이의 에러는 데드 존을 고려하는 인코더 측에서 잔여 양자화 스테이지에 의해 감소되거나 심지어 최적화될 수 있고, 이는 디코더 측에서 입력 신호 및 역 양자화 스테이지를 위해 사용되고 역 양자화된 신호 (출력 신호라고 함)를 획득하는데 사용된 역 양자화 레벨을 정제할 때 이 데드 존을 고려한다.
또한, 본 발명의 실시예는 인코딩 방법을 제공한다. 인코딩 방법은 데드 존을 이용한 복수의 양자화된 값을 획득하기 위해 입력 신호를 양자화하는 단계; 복수의 엔트로피 인코딩된 값을 획득하기 위해 엔트로피 인코딩 방식을 이용하여 복수의 양자화된 값을 인코딩하는 단계; 양자화 스테이지에 의한 양자화에 의한 잔여 신호를 양자화하는 단계와 양자화 스테이지의 데드 존에 따른 복수의 양자화된 잔여 값을 결정하는 단계; 및 복수의 엔트로피 인코딩된 값과 양자화된 잔여 값으로부터 비트 스트림을 형성하는 단계; 를 포함한다.
또한, 본 발명의 실시예에 따른 디코딩 방법은 복수의 인코딩된 값 및 양자화된 잔여 값을 획득하기 위해 코딩된 신호를 분석하는 단계; 복수의 양자화된 값을 획득하기 위해 엔트로피 디코딩 방식을 이용하여 복수의 엔트로피 인코딩 값을 디코딩하는 단계; 출력 신호를 획득하기 위해 복수의 양자화된 값을 역 양자화하는 단계; 데드 존 및 양자화된 잔여 값에 따라 출력 신호를 획득하는데 사용되는 역 양자화 레벨을 정제하는 단계;를 포함한다.
본 발명의 실시 예들은 첨부된 도면을 참조하여 본 명세서에서 설명된다.
도 1은 본 발명의 실시 예에 따른 인코더의 블록도이다.
도 2는 본 발명의 실시 예에 따른 디코더의 블록도이다.
도 3은 본 발명의 실시 예에 따른 시스템 블록도이다.
도 4는 본 발명의 실시 예에 따른 잔여 양자화 스테이지의 블록도이다.
도 5는 데드 존 균일 임계 스칼라 양자화 방식에서 사용되는 역 양자화 레벨 및 양자화 임계 값을 다이어그램에서 나타낸다.
도 6은 0이 아닌 양자화된 값에 대한 두 정제된 역 양자화 레벨을 다이어그램에서 나타낸다.
도 7은 0으로 양자화된 값에 대한 3개의 정제된 역 양자화 레벨을 다이어그램에서 나타낸다.
도 8은 본 발명의 실시 예에 따른 인코딩 방법의 흐름도이다.
도 9는 본 발명의 실시 예에 따른 디코딩 방법의 흐름도이다.
도 10은 잔여 양자화를 이용하는 종래 변환 인코더의 블록도이다.
동일하거나 등가의 기능을 가진 동일 또는 등가의 구성 요소 또는 구성 요소는 다음 설명에서 동일하거나 등가인 참조 번호로 표시된다.
이하의 설명에서, 본 발명의 실시 예에 대한 보다 완전한 설명을 제공하기 위해 다수의 세부 사항이 설명된다. 그러나, 본 발명의 실시 예가 이들 특정 세부 사항 없이 실시될 수 있음은 당업자에게 명백할 것이다. 다른 예들에서, 잘 알려진 구조들 및 장치들은 본 발명의 모호한 실시 예들을 피하기 위해 상세하지 않고 블록도 형태로 도시된다. 또한, 이하에서 설명하는 상이한 실시 예의 특징은 특별히 언급하지 않는 한, 서로 결합 될 수 있다.
엔트로피 코딩은 가변 길이 코드 워드(variable length code-words)를 제공하기 때문에, 비트 스트림을 기록하기 전에 정확한 비트 소비량을 예측하는 것이 어렵다. 그러나 비트 소비량은 양자화 최적화에 필요하다. 대부분 (most of the time) 그리고 복잡성 때문에, 양자화는 차선이고 일부 비트는 여전히 이용되지 않은 상태이다. 잔여 양자화는 양자화 오차를 정제하기 위해 이러한 미사용 비트를 이용하는 양자화의 두 번째 계층이다.
이하 설명되는 본 발명의 실시 예는 인코더, 디코더 및 이 잔여 양자화를 최적화하는 방법을 제공한다.
도 1은 본 발명의 실시 예에 따른 인코더(100)의 블록도이다. 인코더(100)는 양자화 스테이지(102) (예를 들어, 첫 번째 양자화 스테이지), 엔트로피 인코더(104), 잔여 양자화 스테이지(106) (예를 들어, 두 번째 양자화 스테이지) 및 코딩된 신호 발생기(108)를 포함한다. 양자화 스테이지 (102)는 복수의 양자화된 값(142)(q)을 얻기 위해 데드 존을 이용하여 입력 신호(140)를 양자화하도록 구성된다. 엔트로피 인코더(104)는 복수의 엔트로피 인코딩된 값(144)(e)을 획득하기 위해 엔트로피 인코딩 방식을 이용하여 복수의 양자화된 값(142)(q)을 인코딩하도록 구성된다. 잔여 양자화 스테이지(106)는 양자화 스테이지(102)에서의 양자화에 의해 야기된 잔여 신호를 양자화하도록 구성되고, 상기 잔여 양자화 스테이지(106)는 양자화 스테이지(102)의 데드 존에 따라 적어도 하나의 양자화된 잔여 값(146)(qr)을 결정하도록 구성된다. 코딩된 신호 형성기(108)는 복수의 엔트로피 인코딩 값들(144)(e) 및 적어도 하나의 양자화 된 잔여 값(146)(qr)으로부터 코딩된 신호(148)를 형성하도록 구성된다.
본 발명의 아이디어는 (원래의) 입력 신호와 입력 신호 양자화를 위해 사용되는 데드 존을 고려한 인코더 측의 잔여 양자화 스테이지에 의한 입력 신호의 양자화된 버전의 역 양자화된 버전 사이의 에러를 줄이거나 심지어 최적화 하는 것이고 디코더 측의 역 양자화 스테이지는 역 양자화된 신호를 획득하기 위해 사용되는 역 양자화 레벨이 정제될 때 이 데드 존 또한 고려한다.
실시 예에서, 양자화 스테이지(102)는 데드 존 균일 임계 스칼라 양자화 (DZ-UTSQ, dead zone uniform threshold scalar quantization)를 수행하도록 구성 될 수 있다.
실시예에서, 코딩된 신호 형성기(108)는 코딩된 신호(148)가 디코더로의 전송에 이용 가능한 최대 길이를 포함할 때까지 복수의 엔트로피 인코딩된 값(144)로 적어도 하나의 양자화된 잔여 값(146) 또는 복수의 양자화된 잔여 값(146)을 부가함으로써 코딩된 신호(148)를 형성하도록 구성될 수 있다. 비트스트림이, 첫번째 양자화 스테이지 노이즈 형상화를 정의하는 스케일 팩터 등과 같은 다른 정보를 포함하거나, 양자화 노이즈 형상화에 사용되고 또한 타이 도메인에서 출력신호의 포스트필터링에 사용되는 예측 계수들을 포함하는 것은 제한되지 않는다.
예컨대, 코딩된 신호 형성기(108)는 코딩된 신호(148)로서 비트 스트림을 제공하도록 구성될 수 있다. 따라서, 코딩된 신호 형성기(108), 예컨대, 멀티플렉서는 적어도 하나의 양자화된 잔여 값(146) 또는 복수의 양자화된 잔여 값(146)을 비트 스트림의 끝에 부가하도록 구성될 수 있다. 인코더(100)에 의해 생성된 비트 스트림은 디코더에 의해 전송되거나 (예를 들어, 전달되거나 브로드캐스팅 되는), 또는 예컨대, 비휘발성 저장 매체에 저장되어, 디코더에 의해 나중에 디코딩될 수 있다. 이에 따라, 비트 스트림은 데이터 프레임 또는 데이터 패킷을 사용하여 전달되거나 저장될 수 있고, 비트 스트림은 데이터 프레임 또는 데이터 패킷 당 일정한 크기 (본 명세서에서는 타겟 비트라고도 함)를 가져야 할 수도 있다.
일정한 크기 또는 미리 정의된 수의 타겟 비트를 갖는 비트 스트림을 획득하기 위해, 코딩 신호 형성기(108)는 비트 스트림이 기설정된 수의 목표 비트에 도달 할 때까지 양자화된 잔여 값(146)을 엔트로피 인코딩된 값(144)에 부가하도록 구성될 수 있다. 잔여 양자화 스테이지(106)는 비트 스트림이 기설정된 길이 또는 타겟 비트 수를 포함할 때 양자화된 잔여 값(146)을 결정하는 것을 중단할 수 있다.
실시 예에서, 입력 신호(140)는 주파수 도메인 입력 신호(140)일 수 있다. 인코더(100)는 시간 도메인 입력 신호를 주파수 도메인 입력 신호(140)로 변환하도록 구성된 변환 유닛(transformation unit)을 포함할 수 있다.
도 2는 본 발명의 실시 예에 따른 디코더(120)의 블록도이다. 디코더(120)는 코딩 된 신호 분석기(122), 엔트로피 디코더(124) 및 역 양자화 스테이지(126)를 포함한다. 코딩된 신호 분석기(122)는 복수의 엔트로피 인코딩된 값(144)(e) 및 적어도 하나의 양자화 된 잔여 값(146)(qr)을 획득하기 위해 코딩된 신호(148)를 분석하도록 구성된다. 엔트로피 디코더(124)는 복수의 양자화된 값(142)(q)을 획득하기 위해 엔트로피 디코딩 방식을 이용하여 복수의 엔트로피 인코딩된 값(144)(e)을 디코딩하도록 구성된다. 역 양자화 스테이지(126)는 출력 신호(150)를 획득하기 위해 복수의 양자화된 값(142)(q)을 역 양자화하도록 구성된다. 이에 따라, 역 양자화 스테이지(126)는 복수의 양자화된 값(142)(q)를 획득하기 위해 양자화 스테이지(106)에서의 양자화된 잔여 값(146)(qr) 및 인코더(100)에서 사용되는 데드 존에 따른 출력 신호(150)를 획득하기 위해 사용되는 역 양자화 레벨을 정제하도록 구성된다.
실시 예에서, 역 양자화 스테이지(126)는 데드 존에 따라 정제된 역 양자화 레벨을 결정함으로써 역 양자화 레벨을 정제하도록 구성될 수 있다.
예컨대, 역 양자화 스테이지(126)는 데드 존에 따라, 또는 보다 정확하게, 데드 존의 폭에 따라, 레벨을 결정하도록 구성될 수 있고, 이는 역 양자화 레벨이 정제된 역 양자화 레벨을 획득하기 위해 정제, 예를 들어 증가되거나, 감소되어야 한다. 또한, 역 양자화 스테이지(126)는 데드 존에 따른 적어도 두 개의 새로운 역 양자화 레벨을 결정하도록 구성될 수 있고, 양자화된 잔여 값(146)에 의해 나타내어 지는 두 정제된 역 양자화 레벨 중 하나를 사용함으로써 출력 신호(150)를 획득하도록 구성될 수 있다. 다시 말해, 양자화된 잔여 값(146)은 출력 신호(150)를 획득하기 위해 적어도 두 정제된 역 양자화 레벨 중 어느 것이 사용될지를 나타낸다.
도 3은 본 발명의 일 실시 예에 따른 시스템(130) 블록도이다. 시스템(130)은 도 1에 도시된 인코더(100) 및 도 2에 도시된 디코더(120)를 포함한다.
이하에서, 인코더 (100) 및 디코더(120)의 특징과 인코더(100) 및 디코더 (120)의 특징의 공동작용(coaction) 또는 상호작용(interaction)이 더욱 상세히 설명된다.
도 4는 일 실시 예에 따른 잔여 양자화 스테이지(106)의 블록도이다. 잔여 양자화 단계(106)는 잔여 양자화기(106'), 역 양자화기(160) 및 비교기(162)를 포함할 수 있다. 역 양자화기(160)는 역 양자화된 입력 신호(152)(x_q)를 획득하기 위해 양자화 스테이지(102)에 의해 제공된 복수의 양자화된 값들(142)(q)을 역 양자화하도록 구성될 수 있다. 비교 스테이지(162)는 잔여 신호(154)를 획득하기 위해 입력 신호(140)(x)와 역 양자화된 입력 신호(152)(x_q)를 비교하도록 구성될 수 있다. 잔여 양자화기(106')는 양자화 스테이지(102)에 의해 야기된 잔여 신호를 양자화하도록 구성될 수 있다.
다시 말해, 잔여 양자화 블록도가 도 4에 도시되어 있다. 스펙트럼(142)(q)은 역으로 양자화되고 원래의 스펙트럼(140(x))과 비교된다. 그리고 사용 가능한 잔여 비트들에 따라 양자화의 두 번째 계층이 수행된다. 잔여 양자화 스테이지 (106)에 의해 수행되는 두 번째 양자화 단계는 일반적으로 그리디 양자화(greedy quantization)이고, 즉, 양자화는 라인 당 라인 단위(line per line)로 수행되고, 각각의 재-양자화된 값은 후속하는 전달된 정보와 독립적으로 수행된다. 이러한 방식으로, 잔여 양자화 비트-스트림(146)(qr)은 코딩된 신호 형성기(108)에 의해 제공된 비트-스트림(148)이 바람직한 크기에 도달 할 때마다 절단될 수 있다.
도 4에 도시된 바와 같이, 잔여 양자화 스테이지(106)는 조절기와 같은 제어 유닛(164)을 더 포함할 수 있다. 제어 유닛(164)은 잔여 양자화기(106')를 제어 또는 최적화하도록 구성될 수 있다.
예컨대, 제어 유닛(164)은 잔여 양자화기(106)를 제어할 수 있도록 구성되어잔여 양자화기(106')가 데드 존, 보다 정확하게, 양자화 스테이지(102)에서 사용되는 데드 존의 폭에 따라, 복수의 양자화된 값(142)(q)을 획득하기 위해 잔여 신호 (154)를 양자화한다. 또한, 제어 유닛(164)은 타겟 비트 수 및 소비된 비트 수(예를 들어, 엔트로피 인코딩된 값(144)에 의해 소비되고 엔트로피 인코더 또는 엔트로피 인코딩된 값(144)에 의해 제공되고 잔여 양자화기(106')에 의해 이미 제공된 엔트로피 인코딩된 값(144) 및 양자화된 잔여 값(들)에 따라 잔여 양자화기(106 ')를 제어하도록 구성될 수 있다. 또한, 제어 유닛(164)은 역 양자화기(160)에 의해 제공된 정보에 따라 잔여 양자화기(106')를 제어하도록 구성될 수 있다. 역 양자화기(160)에 의해 제공되는 정보는 적응적으로 고정되고 변경될 수 있는, 데드 존의 폭을 포함할 수 있고, 스펙트럼의 정규화 및 양자화 단계의 정제를 위한 첫 번째 양자화에 적용되는 스케일 팩터 또한 포함할 수 있고 양자화된 값이 0 이거나 0이 아닌 경우의 표시 또한 포함할 수 있다.
종래의 잔여 양자화에서, 잔여 양자화 스테이지에 의해 수행된 Qr은
x [i] - x_q [i] 차이의 심플 균일 스칼라 양자화(simple uniform scalar quantization)이다.
ifx[i]>x_q[i]
Qr[i]=(int)(0.5+(x[i]-x_q[i])/delta_r)
Else
Qr[i]=(int)(-0.5+(x[i]-x_q[i])/delta_r)
상기 x[i]는 입력 신호(140)이고, 상기 x_Q[i]는 역 양자화된 입력 신호 (152)이고, 상기 (int)는 정수 라운딩 함수(integer rounding function)이고 상기 delta_r은 첫 번째 양자화기 Q에서 사용되는 양자화 단계 델타보다 일반적으로 작은 잔여 양자화기 Qr의 양자화 단계이다. 일반적으로:
delta_r=0.5*delta
본 발명의 실시 예는 잔여 양자화와 관련된 두 가지 문제점을 해결한다. 첫 번째 및 주요 문제점은 첫 번째 양자화 단계(102)를 알고 있는 최적의 Qr (잔여 양자화 스테이지(106)의 함수)을 어떻게 얻는가이다. 두 번째 문제는 잔여 비트 수를 추정해야 할 때, 인코더 로컬 합성과 디코더 합성 간 불일치를 어떻게 최소화하는가 이다.
레이트 - 왜곡 성능 분석을 통해, (종래의 잔여 양자화에서 사용된) 균일 양자화는 비메모리(memoryless) 및 균일하게 분포된 소스에 대해서만 최적이라는 것을 알 수 있다. 이후에 엔트로피 코딩이 사용되는 경우, 균일 양자화는 가우시안 소스 및 매우 높은 비트-레이트에서 준 최적(quasi optimal)이다. 더 낮은 레이트에서 근사 최적 솔루션은 균일한 임계 스칼라 양자화 (DZ-UTSQ, dead zone with uniform threshold scalar quantization)를 갖는 데드 존을 가지는 것이다. 이 양자화 패밀리는 다양한 범위의 분포, 예를 들어 가우시안, 라플라시안 및 일반화된 라플라시안에 대해 준 최적이다. 데드 존 팩터는 다른 방법에 의해 최적화될 수 있다. 데드 존 팩터는 분포 추정에 따라 실시간으로 최적화될 수 있다. 보다 심플하게 예상 입력 신호에서 발견되는 기본 최상의 값으로 고정되거나 스펙트럼의 음조(tonality)와 같이 일부 측정에 따라 적응될 수 있고, 이는 또한 분포를 반영한다.
이하에서, 첫 번째 스테이지 DZ-UTSQ (102)에 따른 잔여 양자화 스테이지 (106)에 의해 수행된 잔여 양자화(Qr)를 최적화하기 위한 해결책이 제시된다. 데드 존 파라미터는 dz이고 DZ-UTSQ 102는 다음과 같이 정의된다:
ifx[i]>0
Q[i]=(int)(rounding_dz+(x[i])/delta)
Else
Q[i]=(int)(-rounding_dz+(x[i])/delta)
and
x_q[i]=delta*Q[i]
상기 x[i]는 입력 신호(140)이고, 상기 x_Q[i]는 역 양자화된 입력 신호 (152)이고, 상기 (int)는 정수 라운딩 함수이고, 상기 delta는 DZ-UTSQ (102)에서 사용되는 양자화 단계이고, 상기 rounding_dz 는 1-dz / 2 이다 rounding_dz = 1-dz / 2.
도 5는 DZ-UTSQ (102) 방식을 도시하며, 스케일은 델타에 의해 정규화된다.데드 존은 일반적으로 1 단계의 정규화된 셀 크기보다 크다. 1.25의 데드 존은 대부분의 주파수 변환된 오디오 샘플에 대한 좋은 추정치이다. 신호가 잡음이 더 많은 경우 감소 될 수 있고 조성이 더욱 많을 때는 확대 될 수 있다.
본 발명의 실시 예들은 에러 x[i] - x_q[i]의 최적 양자화 정제를 정의한다.잔여 코딩이 엔트로피 제약을 받지 않기 때문에, 잔여 양자화 Qr에서 어떠한 추가 데드 존도 채택되지 않는다. 또한, 첫 번째 양자화 스테이지(102)의 양자화 에러의 분포는 재구성 레벨(170)에 의해 한정된 양자화 셀의 좌측 및 우측 부분에서 균일하다고 가정된다. 이는 고-비율(high-rate) 가정이다. 즉, 새로운 양자화 셀의 크기는 셀 내의 비-균일 분포된(non-even distributed)에러를 버리기에 충분히 작은 것으로 고려된다. 이 가정은 대부분의 타겟 비트-레이트에 유효하다.
샘플이 0이 아닌 값으로 양자화 되고, 샘플이 0으로 양자화되는 두 가지 주요 케이스가 있다.
0이 아닌 양자화된 값에 대해, 1 비트는 샘플당 잔여 양자화 Qr에 할당될 수 있고, 두 개의 상대적인 재구성 레벨 fac_m 및 fac_p를 정의할 수 있다:
fac_p=0.5-rounding_dz*0.5=0.25*(dz)
fac_m=0.5*rounding_dz=0.5*(1-0.5*dz)
따라서, fac_p는 정규화된 절대 값을 나타낼 수 있고 역 양자화 레벨(또는 재구성 레벨)의 정규화된 절대 값은 두 정제된 역 양자화 레벨(174 및 176)의 첫 번째 재정제된 역 양자화 레벨(174)을 획득하기 위해 증가 될 수 있고, 상기 fac_m는 정규화된 절대 값을 나타내고 역 양자화 레벨(172)의 상기 정규화된 절대값은 두 정제된 역 양자화 레벨(174 및 176)의 두 번째 정제된 역 양자화 레벨(176)을 획득하기 위해 감소 될 수 있고, 상기 dz는 데드 존의 정규화된 폭이고, 도 6으로부터 명백해질 것이다.
도 6은 1의 재구성 레벨(172)에 대한 두 개의 상대적 (또는 정제된) 재구성 레벨 (174 및 176)을 도시한다. 1 비트의 추가 비트로, 재구성 레벨(172)은 1- fac_m (두 번째 정제된 역 양자화 레벨(176)로 이끄는) 또는 1 + fac_p (제 1 정제된 역 양자화 레벨 (174)로 유도)로 정제될 수 있다. 원래 셀은 두 개의 비-균일 셀로 분할된다. Q (첫 번째 양자화 스테이지(102)의 양자화 함수)의 양자화 에러는 새로운 셀들 내에서 균일하게 분포되는 것으로 가정되기 때문에 잔여 양자화 Qr은 R-D 성능면에서 최적이다. 양자화 Q 및 잔여 양자화 Qr은 임베디드된 양자화를 형성하는 것을 알아 두어야 한다. 즉, 잔여 양자화 (Qr)에 할당된 비트는 폐기 될 수 있고 여전히 Q-1가 수행 될 수 있다.
잔여 양자화 스테이지(106)에 의해 수행된 잔여 양자화 (Qr)는 다음과 같이 요약될 수 있다:
Figure pct00001
상기 prm은 양자화된 잔여 값을 이용한 잔여 양자화 스테이지(106)에 의해 생성된 비트 스트림이고, 상기 x[i]는 입력 신호이고, 상기 x_Q[i]는 역 양자화된 입력 신호이고, 상기 n은 Qr에 의해 정제된 각각의 비-제로 양자화된 값에 대해 1 씩 증가되는 인덱스이고, 상기 i는 각각의 획득된 양자화된 값에 대해 1씩 증가하는 인덱스이다.
역 Qr은 다음과 같이 표현될 수 있다.
Figure pct00002
역 Qr은 Nbits 의 첫 번째 비트에 대해서만 수행된다는 것을 알 수 있다. 이는 인코더는 인코더 또는 디코더가 실제로 디코딩하는 것보다 많은 비트를 생성할 수 있음을 의미한다. 이 메커니즘은 잔여 비트 수가 추정되고 인코더 측에서 로컬 합성이 생성될 필요가 있을 때 사용된다. 예측된 재구성 된 신호는 디코더가 비트 스트림의 실제 잔여 가용 비트에 따라 더 많거나 적은 비트를 디코딩할 수 있음에도 불구하고 인코더에서 생성된다.
대안으로, 1 비트 이상은 샘플 당 Qr로 할당할 수 있다. 동일한 원리로, 비트 Qr 재구성 레벨의 2 파워에 대한 최적 재구성 레벨이 정의될 수 있다.
0으로 양자화된 값에 대해, 잔여 양자화(Qr)는 1 비트 이상으로 할당될 수 있다. 이에 대한 이유는 재구성 레벨로서 0을 가지고 있어야 하기 때문이다. 예컨대, 침묵하는 동안 인공적인 잡음 신호를 생성하는 것을 방지한다. 특수 3 레벨 가변 길이 코드가 사용될 수 있다:
0: 0 을 코딩 함(code a zero)
10: 네거티브 재구성 레벨
11: 포지티브 재구성 레벨
새로운 상대적인 재구성 레벨이 연산됨, fac_z:
fac_z= dz/3
따라서 fac_z는 정규화된 절대값을 나타낼 수 있고 역 양자화 레벨(172)의 정규화된 절대값은 두 정제된 역 양자화 레벨(174 및 176)과 정규화된 절대값의 첫 번째 정제된 역 양자화 레벨(174)을 획득하기 위해 증가되고 역 양자화 레벨의 정규화된 절대값은 두 정제된 역 양자화 레벨 및 역 양자화 레벨의 두 번째 정제된 역 양자화 레벨(176)을 획득하기 위해 감소되고, 상기 dz 데드 존의 정규화된 폭이고 이는 도 7로부터 명백해질 것이다.
도 7은 제로 양자화된 값(142)에 대한 잔여 양자화 스테이지(106)에 의해 수행되는 잔여 양자화(Qr)를 도시한다. 0 주위의 셀은 세 개의 균일한 새로운 셀들로 나뉜다.
0으로 양자화된 값에 대해 잔여 양자화 스테이지(106)에 의해 수행되는 잔여 양자화(Qr)는다음과 같이 요약 될 수 있다.
Figure pct00003
Figure pct00004
Figure pct00005
상기 C는 양자화 스테이지의 데드 존(dead zone)에 의존하며, C = delta * (fac_z/2)로 계산될 수 있고, 상기prm은 양자화된 잔여 값을 사용하여 잔여 양자화 스테이지(106)에 의해 생성된 비트 스트림이고, 상기 x[i]는 입력 신호이고, 상기 x_Q[i]는 역 양자화된 입력 신호이다. 인덱스 n은 각각의 제로로 양자화된 값이 0으로 재 양자화될 때마다 1씩 증가되고 0으로 양자화된 값이 0으로 재양자화 될 때마다 1씩 증가되고, 상기 n은 0이 아닌 값으로 재양자화된 각각의 0으로 양자화된 값에 대해 2만큼 증가된다.
역 Qr은 다음과 같이 표현될 수 있다.
Figure pct00006
본 발명의 실시 예들은 원래의 양자화 셀 내의 분포가 균일하지 않다는 가정하에 쉽게 확장될 수 있다. 이 경우, 상대 재구성 레벨은 양자화 오차의 분포에 따라 유도될 수 있다. 이를 달성하는 방법은 원래의 양자화 셀을 비 균일하고 새로운 더 작은 셀들로 분할하는 것이다. 두 번째 데드 존 파라미터 또한 사용될 수 있다.
이하에서, 인코더(100) 및 디코더(120)의 다른 실시 예가 간략하게 설명된다.
먼저 인코더(100)가 설명된다.
잔여 양자화는 첫 번째 SQ 스테이지(또는 양자화 스테이지(102))를 정제하는 정제 양자화 계층이다. 최종 미사용 비트를 이용하면, 즉 unused bits = target_bits-nbbits, 여기에서 nbbits는 엔트로피 코더(104)에 의해 소비되는 비트 수 이다. 잔여 양자화는 비트 스트림이 바람직한 크기에 도달할 때마다 코딩을 중단하기 위해 그리디 전략(greedy strategy) 및 엔트로피 없음(no entropy)을 채택한다.
정제는 라인 당 양자화된 스펙트럼 라인을 재 양자화하는 것으로 구성된다.먼저, 0이 아닌 양자화된 라인은 1 비트 잔여 양자화기로 처리된다.
Figure pct00007
따라서, X[k]는 입력 신호(140)의 스케일된 샘플이고,
Figure pct00008
는 역 양자화된 입력 신호 (152)의 스케일된 대응하는 샘플이다.
마지막으로, 잔여 비트가 허용되는 경우, 0으로 양자화된 라인은 다음과 같이 3 레벨로 고려되고 양자화된다.
Figure pct00009
따라서, X[k]는 입력 신호(140)의 스케일된 샘플이고,
Figure pct00010
는 역 양자화 된 입력 신호(152)의 대응하는 스케일된 샘플이고, fac_z는 정규화된 절대값을 나타낼 수 있고 역 양자화 레벨(172)의 정규화된 절대 값은 두 정제된 역 양자화 레벨(174 및 176)및 정규화된 절대 값의 첫 번째 정제된 역 양자화 레벨(174)를 획득하기 위해 증가되고, 역 양자화 레벨의 정규화된 절대 값은 두 정제된 역 양자화 레벨(174 및 176)의 두 번째 정제된 역 양자화 레벨(176)을 획득하기 위해 감소되고, 상기 rounding_dz 는 1-dz/2 이다 rounding_dz=1-dz/2.
두 번째로, 디코더(120)가 설명된다.
잔여 비트는 0이 아닌 디코딩된 라인을 정제한다. 0이 아닌 스펙트럼 값 당 1 비트가 읽혀진다:
Figure pct00011
따라서, X[k] 는 입력 신호(140)이고,
Figure pct00012
는 역 양자화된 입력 신호(152)이고 fac_p는 정규화된 절대 값을 나타낼 수 있고 역 양자화 레벨(또는 재구성 레벨)(172)의 정규화된 절대 값은 두 정제된 역 양자화 레벨(174 및 176)의 첫 번째 정제된 역 양자화 레벨(174)를 획득하기 위해 증가되고, fac_m은 정규화된 절대 값을 나타낼 수 있고 역 양자화 레벨(172)의 정규화된 절대 값은 두 정제된 역 양자화 레벨(174 및 176)의 두 번째 정제된 역 양자화 레벨을 획득하기 위해 감소된다. 상기 rounding_dz는 1-dz/2이다 rounding_dz=1-dz/2.
적어도 2 비트가 읽혀지는 경우, 0 값은 다음과 같이 정제된다.
Figure pct00013
따라서, X[k]는 입력 신호(140)의 스케일된 샘플이고,
Figure pct00014
는 역 양자화된 입력 신호(152)의 대응하는 스케일된 샘플이고, fac_z는 정규화된 절대값을 나타낼 수 있고 역 양자화 레벨(172)의 정규화된 절대값은 두 정제된 역 양자화 레벨(174, 176) 및 정규화된 절대값의 첫 번째 정제된 역 양자화 레벨(174)을 획득하기 위해 증가되고, 역 양자화 레벨의 정규화된 절대 값은 두 정제된 역 양자화 레벨(174 및 176)의 두 번째 정제된 역 양자화 레벨(176)을 획득하기 위해 감소되고, 상기 rounding_dz는 1-dz/2이다 rounding_dz=1-dz/2.
도 8은 일 실시 예에 따른 인코딩 방법(200)의 흐름도이다. 인코딩 방법(200)은 데드 존을 이용한 복수의 양자화된 값을 획득하기 위해 입력 신호를 양자화 하는 202 단계; 복수의 엔트로피 인코딩된 값을 획득하기 위해 엔트로피 인코딩 방식을 이용하여 복수의 양자화된 값을 인코딩하는 204 단계; 양자화 스테이지에 의한 양자화에 의한 잔여 신호를 양자화하는 206 단계와 양자화 스테이지의 데드 존에 따른 복수의 양자화된 잔여 값을 결정하는 단계; 및 복수의 엔트로피 인코딩된 값과 양자화된 잔여 값으로부터 비트 스트림을 형성하는 208 단계를 포함한다.
도 9는 일 실시 예에 따른 디코딩 방법(220)의 흐름도이다. 디코딩 방법(220)은 복수의 인코딩된 값 및 양자화된 잔여 값을 획득하기 위해 코딩된 신호를 분석하는 222 단계; 복수의 양자화된 값을 획득하기 위해 엔트로피 디코딩 방식을 이용하여 복수의 엔트로피 인코딩 값을 디코딩하는 224 단계; 출력 신호를 획득하기 위해 복수의 양자화된 값을 역 양자화하는 226 단계; 데드 존 및 양자화된 잔여 값에 따라 출력 신호를 획득하는데 사용되는 역 양자화 레벨을 정제하는 228 단계;를 포함한다.
몇몇 실시예들이 장치의 문맥에서 설명되었지만, 이들 실시예들은 블록 또는 장치가 방법 단계(method step) 또는 방법 단계의 특징에 상응하는 방법에 대한 설명 또한 나타내는 것이 명백하다. 유사하게, 방법 단계의 문맥에서 기술된 측면은 대응하는 블록 또는 품목 또는 대응하는 장치의 특징에 대한 설명을 나타낸다. 방법 단계들의 일부 또는 전부는 예를 들어 마이크로프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 이용되어) 실행될 수 있다. 일부 실시 예들에서, 가장 중요한 방법 단계들 중 하나 이상은 장치에 의해 실행될 수 있다.
특정 구현 요건에 따라, 본 발명의 실시 예는 하드웨어 또는 소프트웨어로 구현 될 수 있다. 구현은 전자적으로 판독 가능한 제어 신호가 저장된 디지털 저장 매체, 예를 들어 플로피 디스크, DVD, 블루 레이, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리를 사용하여 수행될 수 있고, 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력한다(또는 협력 가능하다). 따라서, 디지털 저장 매체는 컴퓨터 판독 가능일 수 있다.
본 발명에 따른 일부 실시 예는 본 명세서에 설명된 방법 중 하나가 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전자 판독 가능 제어 신호를 갖는 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시 예들은 컴퓨터 프로그램 제품이 컴퓨터상에서 실행될 때 방법들 중 하나를 수행하도록 동작하는 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 프로그램 코드는 예를 들어 머신 판독 가능 캐리어(machine readable carrier)에 저장될 수 있다.
다른 실시 예는 머신 판독 가능 캐리어 상에 저장되는, 본 명세서에 설명 된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
다시 말해, 본 발명의 방법의 실시 예는 컴퓨터 프로그램이 컴퓨터상에서 실행될 때, 본 명세서에 기술 된 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
따라서, 본 발명의 방법의 또 다른 실시 예는 본 명세서에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함하는 데이터 캐리어 (또는 디지털 저장 매체 또는 컴퓨터 - 판독 가능 매체)이다. 데이터 캐리어는, 디지털 저장 매체 또는 기록 매체는 일반적 유형 및/또는 비 -트렌지셔너리(non-transitionary)이다.
그러므로, 본 발명의 방법에 대한 또 다른 실시 예는 본 명세서에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 일련의 신호이다. 데이터 스트림 또는 신호들의 시퀀스는 예를 들어 인터넷을 통해 데이터 통신 접속을 통해 전송되도록 구성될 수 있다.
다른 실시 예는 여기서 설명된 방법들 중 하나를 수행하도록 구성되거나 적응 된 처리 수단, 예를 들어 컴퓨터 또는 프로그램 가능한 논리 장치를 포함한다.
다른 실시 예는 여기에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
본 발명에 따른 또 다른 실시 예는 본 명세서에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기에 전송 (예컨대, 전자적으로 또는 광학적으로)하도록 구성된 장치 또는 시스템을 포함한다. 수신기는 예를 들어 컴퓨터, 모바일 장치, 메모리 장치 등일 수 있다. 상기 장치 또는 시스템은 예를 들어 컴퓨터 프로그램을 수신기에 전송하기 위한 파일 서버를 포함할 수 있다.
일부 실시 예들에서, 프로그램 가능한 논리 소자 (예컨대, 필드 프로그래머블 게이트 어레이)는 여기에 설명된 방법들의 일부 또는 모든 기능들을 수행하는데 사용될 수 있다. 일부 실시 예들에서, 필드 프로그래머블 게이트 어레이는 여기서 설명 된 방법들 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 상기 방법들은 임의의 하드웨어 장치에 의해 수행되는 것이 바람직하다.
전술한 실시 예는 본 발명의 원리를 설명하기 위한 것일 뿐이다. 본 명세서에 설명된 구성 및 세부 사항의 변경 및 변형은 당업자에게 명백할 것이다. 따라서, 청구한 특허 청구항의 범위에 의해서만 제한되고 본 명세서의 실시 예에 대한 설명 및 설명에 의해 제공된 특정 세부 사항에 의해서만 한정되는 것은 아니다.
102: 양자화 스테이지
104: 엔트로피 인코더
106: 잔여 양자화 스테이지
108: 코딩된 신호 형성기

Claims (23)

  1. 인코더(100)에 있어서,

    복수의 양자화된 값(142)을 획득하기 위해 데드 존을 이용하여 입력 신호 (140)를 양자화하도록 구성된 양자화 스테이지(102);

    복수의 엔트로피 인코딩된 값(144)을 획득하기 위해 엔트로피 인코딩 방식을 이용하여 복수의 양자화된 값(142)을 인코딩하도록 구성된 엔트로피 인코더(104);

    양자화 스테이지(102)에 의한 잔여 신호를 양자화하도록 구성된 잔여 양자화 스테이지(106);를 포함하고 상기 잔여 양자화 스테이지(106)는, 0이 아닌 양자화된 값에 대해, 양자화 스테이지(102)의 데드 존에 따라 적어도 하나의 양자화된 잔여 값(146)을 결정하도록 구성되고;

    복수의 엔트로피 인코딩 값(144) 및 적어도 하나의 양자화된 잔여 값(146)으로부터 코딩된 신호(148)를 형성하도록 구성되는 코딩된 신호 발생기(108)를 포함하는 인코더.
  2. 제 1항에 있어서, 상기 잔여 양자화 스테이지(106)는
    0이 아닌 양자화된 값에 대해, 양자화 스테이지(102) 데드 존의 폭에 따른 적어도 하나의 양자화된 잔여 값(146)을 결정하도록 구성되는 것을 특징으로 하는 인코더.
  3. 제 1항 내지 2항 중 어느 한 항에 있어서, 상기 잔여 양자화 스테이지(106)는

    역 양자화된 입력 신호(152)를 획득하기 위해 양자화 스테이지(102)의 데드 존에 따라 복수의 양자화된 값(112)을 역 양자화하도록 구성된 역 양자화기(160);를 포함하고:

    상기 잔여 양자화 스테이지(106)는 적어도 하나의 양자화된 잔여 값(146)을 결정하도록 구성되어 양자화된 잔여 값(146)이 0이 아닌 양자화된 값(146)에 대해 1 비트를 포함하도록 하고;

    상기 잔여 양자화 스테이지(106)는, 0이 아닌 양자화된 값에 대해, 입력 신호(140)가 0이 아닌 양자화된 값에 대해 역 양자화된 입력 신호(152) 보다 작은 경우, 양자화된 잔여 값(146)이 로직 0을 포함하도록 결정하고, 다른 경우, 0 이 아닌 양자화된 값에 대해, 양자화 잔여 값(146)이 로직 1을 포함하도록 결정하는 것을 특징으로 하는 인코더.
  4. 제 1항 내지 3항 중 어느 한 항에 있어서, 상기 잔여 양자화 스테이지(106)는

    역 양자화된 입력 신호(152)를 획득하기 위해 데드 존에 따라 복수의 양자화 된 값(142)을 역 양자화하도록 구성된 역 양자화기 (160); 및

    입력 신호(140)와 역 양자화된 입력 신호(152)를 비교하도록 구성된 비교기(162);를 포함하는 것을 특징으로 하는 인코더.
  5. 제 4항에 있어서, 상기 비교기(162)는 잔여 신호(154)를 획득하기 위해 입력 신호(140) 및 역 양자화된 입력 신호(152)를 비교하도록 구성되고;

    상기 잔여 양자화 스테이지(106)는 데드 존에 따라 잔여 신호(154)를 양자화 하도록 구성되는 것을 특징으로 하는 인코더.
  6. 제 5항에 있어서, 상기 잔여 양자화 스테이지(106)는 적어도 하나의 양자화된 잔여 값(146)을 결정하도록 구성되어 양자화된 잔여 값(146)이 0이 아닌 양자화된 값이 대해 1 비트를 포함하도록 하고;

    상기 잔여 양자화 스테이지는 잔여 신호(154)가 0이 아닌 양자화된 값에 대해 네거티브인 경우, 0이 아닌 양자화된 값에 대해, 양자화된 잔여 값(146)이 로직 0을 포함하는 것으로 결정하도록 구성되고 다른 경우, 0이 아닌 양자화된 값에 대해, 양자화된 잔여 값(146)이 로직 1을 포함하는 것으로 결정하도록 구성되는 인코더.
  7. 제 1항 내지 제 6항 중 어느 한 항에 있어서, 상기 잔여 양자화 스테이지 (106)는 적어도 하나의 양자화 잔여 값(146)을 결정하도록 구성되어 양자화된 잔여 값(146)이 적어도 하나의 양자화된 잔여 값(146)을 포함하도록 하고 상기 잔여 양자화 스테이지(106)는 구문
    Figure pct00015
    에 기반한 양자화된 잔여 값(146)을 결정하도록 구성되고

    상기 prm은 양자화된 잔여 값(146)을 이용하여 잔여 양자화 스테이지(106)에 의해 생성된 비트 스트림이고, 상기 x[i]는 입력 신호(140), 상기 x_Q[i]는 역 양자화된 입력 신호(152)이고, 상기 n은 0이 아닌 양자화된 값 각각에 대해 1씩 증가 되는 인덱스이고, 상기 i는 획득된 양자화된 값(142) 각각에 대해 1씩 증가하는 인덱스인 것을 특징으로 하는 인코더.
  8. 제 1항 내지 7항 중 어느 한 항에 있어서, 상기 잔여 양자화 스테이지(106)는 양자화된 잔여 값(146)을 결정하도록 구성되어 양자화된 잔여 값(146)이 제로 양자화된 값에 대해 2 비트를 포함하도록 하고, 상기 잔여 양자화 스테이지(106)는 구문
    Figure pct00016


    Figure pct00017


    Figure pct00018

    에 기반한 양자화된 잔여 값(146)을 결정하도록 구성되고,

    상기 C는 양자화 스테이지(102)의 데드 존에 의존하고, 상기 prm은 양자화된 잔여 값(146)을 이용한 잔여 양자화 스테이지(106)에 의해 생성되는 비트 스트림이고, 상기 x[i]는 입력 신호(140)이고, 상기 x_Q[i]는 역 양자화된 입력 신호(152)이고, 상기 n은 0으로 양자화된 값으로 재양자화된 0으로 양자화된 값 각각에 대해 1씩 증가하는 인덱스이고, 0이 아닌 양자화된 값으로 재양자화된 0으로 양자화된 값 각각에 대해 2씩 증가하고, 상기 i는 각각 획득된 양자화된 값(142) 각각에 대해 1씩 증가되는 인덱스인 것을 특징으로 하는 인코더.
  9. 제 1항 내지 8항 중 어느 한 항에 있어서, 상기 코딩된 신호 형성기(108)는 코딩된 신호(148)가 디코더로 전송 가능한 최대 길이를 포함할 때까지 복수의 엔트로피 인코딩된 값(144)으로 적어도 하나의 양자화된 잔여 값(146) 또는 복수의 양자화된 잔여 값(146)을 부가함으로써 코딩된 신호를 형성하도록 구성되는 것을 특징으로 하는 인코더.
  10. 제 1항 내지 9항 중 어느 한 항에 있어서, 상기 코딩된 신호 형성기(108)는 코딩된 신호(148)로서 비트 스트림을 제공하도록 구성되고, 상기 코딩된 신호 형성기(108)는 복수의 엔트로피 인코딩된 값(144) 및 복수의 양자화된 잔여 값(146)으로부터 비트 스트림을 형성하도록 구성되고, 상기 코딩된 신호 형성기(108)는 엔트로피 인코딩된 값(144)으로 양자화된 잔여 값(146)을 부가하도록 구성되고, 상기 잔여 양자화 스테이지(106)는

    잔여 양자화기(106'); 및

    복수의 양자화 된 값(142)을 획득하기 위해 양자화 스테이지(102)에서 사용된 데드 존의 폭에 따라 잔여 신호를 양자화하기 위해 잔여 양자화기(106')를 제어하도록 구성된 조정기(164);를 포함하고,

    상기 조정기(164)는 다수의 타겟 비트 및 다수의 소비된 비트 수를 획득하도록 구성되고;

    상기 조정기(164)는 비트 스트림이 타겟 비트 수를 포함할 때 양자화된 잔여 값을 결정하는 것을 중지하기 위해 잔여 양자화 스테이지를 제어하도록 구성되는 것을 특징으로 하는 인코더.
  11. 디코더(120)에 있어서,

    복수의 엔트로피 인코딩된 값(144) 및 적어도 하나의 양자화된 잔여 값 (146)을 획득하기 위해 코딩된 신호(148)를 분석하도록 구성된 코딩된 신호 분석기(122);

    복수의 양자화된 값(142)을 획득하기 위해 엔트로피 디코딩 방식을 사용하여 복수의 엔트로피 인코딩된 값 (144)을 디코딩하도록 구성된 엔트로피 디코더(124); 및

    출력 신호(150)를 획득하기 위해 복수의 양자화된 값(142)을 역 양자화하도록 구성된 역 양자화 스테이지(126);를 포함하고,

    상기 역 양자화 스테이지(126)는 양자화된 잔여 값(146) 및 데드 존에 따라 출력 신호(150)를 획득하기 위해 사용되는 역 양자화 레벨(172)을 정제하도록 구성되는 디코더.
  12. 제 11항에 있어서, 상기 역 양자화 스테이지(126)는 양자화된 잔여 값(146) 및 데드 존의 폭에 따른 0이 아닌 양자화된 값에 대한 역 양자화 레벨(172)을 정제하도록 구성되는 것을 특징으로 하는 디코더.
  13. 제 11항 또는 12항 중 어느 한 항에 있어서, 상기 역 양자화 스테이지(126)는 데드 존에 따른 정제된 역 양자화 레벨(174,176) 결정에 의해 역 양자화 레벨(172)를 정제하도록 구성되는 것을 특징으로 하는 디코더.
  14. 제 13항에 있어서, 상기 역 양자화 스테이지(126)는 0이 아닌 양자화된 값에 대해 두 정제된 역 양자화 레벨(174,176)을 결정하도록 구성되고, 상기 역 양자화 스테이지(126)는 양자화 잔여 값에 의해 표시된 두 정제된 역 양자화 레벨(174,176) 중 하나를 사용함으로써 출력 신호(150)를 획득하도록 구성되는 것을 특징으로 하는 디코더.
  15. 제 14항에 있어서, 상기 역 양자화 스테이지(126)는 두 정제된 역 양자화 레벨(174)의 첫 번째 정제된 역 양자화 레벨을 획득하기 위해 증가 값만큼 역 양자화 레벨(172)의 정규화된 절대 값을 증가시키고;

    상기 역 양자화 스테이지(126)는 두 정제된 역 양자화 레벨(174)의 두 번째 정제된 역 양자화 레벨을 획득하기 위해 감소 값만큼 역 양자화 레벨(172)의 정규화된 절대 값을 감소 시키고;

    상기 증가 값 및 감소 값은 각각 서로 다른 것을 특징으로 하는 디코더.
  16. 제 14항 또는 15항에 있어서, 상기 역 양자화 스테이지(126)는 두 팩터

    fac_p = 0,25 * dz

    fac_m = 0,5 * (1 - 0,5 * dz)

    에 기반한 0이 아닌 양자화된 값에 대한 두 정제된 역 양자화 레벨(174,176)을 결정하도록 구성되고,

    상기 fac_p는 두 정제된 역 양자화 레벨(174)의 첫 번째 정제된 역 양자화 레벨을 획득하기 위해 역 양자화 레벨(172)의 정규화된 절대 값 증가에 의한 정규화된 절대 값을 나타내고, 상기 fac_m은 두 정제된 역 양자화 레벨(176)의 두 번째 정제된 양자화 레벨을 획득하기 위해 역 양자화 레벨(172)의 정규화된 절대 값 감소에 의한 정규화된 절대 값을 나타내고, 상기 dz는 데드 존의 정규화된 폭인 것을 특징으로 하는 디코더.
  17. 제 13항 내지 16항 중 어느 한 항에 있어서, 상기 역 양자화 스테이지(126)는 0으로 양자화된 값에 대해 두 정제된 역 양자화 레벨(174,176)을 결정하도록 구성되고, 상기 역 양자화 스테이지(126)는 양자화된 잔여 값에 의해 나타나는 역 양자화 레벨(172) 및 두 정제된 역 양자화 레벨(174,176)을 이용함으로써 출력 신호(150)를 획득하도록 구성되는 것을 특징으로 하는 디코더.
  18. 제 17항에 있어서, 상기 역 양자화 스테이지(126)는 두 정제된 역 양자화 레벨(174)의 첫 번째 정제된 역 양자화 레벨을 획득하기 위해 증가 값만큼 역 양자화 레벨(172)의 정규화된 절대 값을 증가시키도록 구성되고,

    상기 역 양자화 스테이지(126)는 두 정제된 역 양자화 레벨(174)의 두 번째 정제된 양자화 레벨을 획득하기 위해 감소 값만큼 역 양자화 레벨(172)의 정규화된 절대 값을 감소시키도록 구성되는 것을 특징으로 하는 디코더.
  19. 제 17항 또는 18항 중 어느 한 항에 있어서, 상기 역 양자화 스테이지(126)는 팩터 fac_z = dz/3 에 기반한 0으로 양자화된 값에 대한 두 정제된 역 양자화 레벨(174,176)을 결정하도록 구성되고;

    상기 fac_z는 두 정제된 역 양자화 레벨(174)의 첫 번째 역 양자화 레벨을 획득하기 위해 역 양자화 레벨(172)의 정규화된 절대 값이 감소되는 것에 의해 정규화된 절대 값을 나타내고 역 양자화 레벨(172)의 정규화된 절대 값에 의해 정규화된 절대 값은 두 정제된 역 양자화 레벨(176)의 두 번째 역 양자화 레벨을 획득하기 위해 감소되고, 상기 dz는 데드 존의 정규화된 폭 인 것을 특징으로 하는 디코더.
  20. 시스템에 있어서

    제 1항 내지 10항 중 어느 한 항에 따른 인코더(100); 및

    제 11항 내지 19항 중 어느 한 항에 따른 디코더(120)를 포함하는 시스템.
  21. 인코딩 방법(200)에 있어서,

    데드 존을 이용한 복수의 양자화된 값을 획득하기 위해 입력 신호를 양자화 하는 단계(202);

    복수의 엔트로피 인코딩된 값을 획득하기 위해 엔트로피 인코딩 방식을 이용하여 복수의 양자화된 값을 인코딩하는 단계(204);

    양자화 스테이지에 의한 양자화에 의한 잔여 신호를 양자화하는 단계(206) 와 양자화 스테이지의 데드 존에 따른 복수의 양자화된 잔여 값을 결정하는 단계; 및

    복수의 엔트로피 인코딩된 값과 양자화된 잔여 값으로부터 비트 스트림을 형성하는 단계(208);를 포함하는 인코딩 방법.
  22. 디코딩 방법(220)에 있어서,

    복수의 인코딩된 값 및 양자화된 잔여 값을 획득하기 위해 코딩된 신호를 분석하는 단계(222);

    복수의 양자화된 값을 획득하기 위해 엔트로피 디코딩 방식을 이용하여 복수의 엔트로피 인코딩 값을 디코딩하는 단계(224);

    출력 신호를 획득하기 위해 복수의 양자화된 값을 역 양자화하는 단계(226);및

    데드 존 및 양자화된 잔여 값에 따라 출력 신호를 획득하는데 사용되는 역 양자화 레벨을 정제하는 단계(228);를 포함하는 디코딩 방법.
  23. 제 21항 또는 제 22항에 따른 방법을 수행하기 위한 컴퓨터 프로그램.
KR1020177005691A 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법 KR102014295B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14178780.4 2014-07-28
EP14178780.4A EP2980793A1 (en) 2014-07-28 2014-07-28 Encoder, decoder, system and methods for encoding and decoding
PCT/EP2015/067001 WO2016016122A1 (en) 2014-07-28 2015-07-24 Encoder, decoder, system and methods for encoding and decoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020197024306A Division KR20190101483A (ko) 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20170041778A true KR20170041778A (ko) 2017-04-17
KR102014295B1 KR102014295B1 (ko) 2019-08-26

Family

ID=51224867

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020177005691A KR102014295B1 (ko) 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법
KR1020197024306A KR20190101483A (ko) 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법
KR1020217038022A KR102512937B1 (ko) 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020197024306A KR20190101483A (ko) 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법
KR1020217038022A KR102512937B1 (ko) 2014-07-28 2015-07-24 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법

Country Status (19)

Country Link
US (3) US10375394B2 (ko)
EP (2) EP2980793A1 (ko)
JP (4) JP6494741B2 (ko)
KR (3) KR102014295B1 (ko)
CN (2) CN112954323A (ko)
AR (1) AR101547A1 (ko)
AU (2) AU2015295604B2 (ko)
CA (1) CA2956011C (ko)
ES (1) ES2688103T3 (ko)
MX (1) MX366803B (ko)
MY (1) MY178527A (ko)
PL (1) PL3175450T3 (ko)
PT (1) PT3175450T (ko)
RU (1) RU2678168C2 (ko)
SG (1) SG11201700695TA (ko)
TR (1) TR201815373T4 (ko)
TW (1) TWI582757B (ko)
WO (1) WO2016016122A1 (ko)
ZA (1) ZA201700513B (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980793A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and methods for encoding and decoding
KR20230085229A (ko) * 2018-03-29 2023-06-13 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 종속 양자화
KR20230058546A (ko) * 2018-04-05 2023-05-03 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 컴포트 노이즈 생성 지원
MX2021003343A (es) 2018-09-24 2021-07-02 Fraunhofer Ges Forschung Codificación eficiente de coeficientes de transformacion usando o adecuada para una combinación con cuantización escalar dependiente.
CN113302688A (zh) * 2019-01-13 2021-08-24 华为技术有限公司 高分辨率音频编解码
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
CN114521327A (zh) * 2019-07-05 2022-05-20 威诺瓦国际有限公司 视频译码中的残差的量化
US10984808B2 (en) * 2019-07-09 2021-04-20 Blackberry Limited Method for multi-stage compression in sub-band processing
US11095311B2 (en) * 2019-11-27 2021-08-17 Qualcomm Incorporated Quantization codeword selection for low cost parity checking

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070147497A1 (en) * 2005-07-21 2007-06-28 Nokia Corporation System and method for progressive quantization for scalable image and video coding
US20110173004A1 (en) * 2007-06-14 2011-07-14 Bruno Bessette Device and Method for Noise Shaping in a Multilayer Embedded Codec Interoperable with the ITU-T G.711 Standard

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501521B2 (ja) * 1994-11-07 2004-03-02 三菱電機株式会社 ディジタル映像信号再生装置および再生方法
JPH09324397A (ja) 1996-06-03 1997-12-16 Mitsubishi Paper Mills Ltd たばこ用巻紙およびその製造方法
US6269192B1 (en) * 1997-07-11 2001-07-31 Sarnoff Corporation Apparatus and method for multiscale zerotree entropy encoding
JP4300800B2 (ja) * 2000-12-22 2009-07-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
WO2003073741A2 (en) * 2002-02-21 2003-09-04 The Regents Of The University Of California Scalable compression of audio and other signals
EP1465349A1 (en) * 2003-03-31 2004-10-06 Interuniversitair Microelektronica Centrum Vzw Embedded multiple description scalar quantizers for progressive image transmission
JP4014098B2 (ja) * 2003-06-26 2007-11-28 株式会社Kddi研究所 画像の階層的符号化装置および復号装置
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US7738554B2 (en) * 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
KR101320260B1 (ko) 2004-06-18 2013-10-23 톰슨 라이센싱 비디오 신호 데이터를 인코딩 및 디코딩하기 위한 방법 및 장치
US7836506B2 (en) 2004-09-22 2010-11-16 Cyberdefender Corporation Threat protection network
WO2006047795A1 (en) * 2004-10-27 2006-05-04 Geoffrey Charles Wolf Sealable container for drinking and temporarily sealing bottles
WO2006108736A1 (fr) * 2005-04-11 2006-10-19 France Telecom Procédé et dispositif de quantification progressive, procédé et dispositif de quantification inverse, programmes informatiques, signal et support de données correspondants
WO2007011160A1 (en) * 2005-07-19 2007-01-25 Electronics And Telecommunications Research Institute Apparatus and method of embedded quantizaton for the improved snr scalbilty
KR100785855B1 (ko) * 2005-07-19 2007-12-14 한국전자통신연구원 향상된 snr 스케일러빌리티 제공을 위한 양자화 장치 및방법
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
JPWO2008047795A1 (ja) * 2006-10-17 2010-02-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
WO2008046492A1 (en) * 2006-10-20 2008-04-24 Dolby Sweden Ab Apparatus and method for encoding an information signal
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8902972B2 (en) * 2008-04-11 2014-12-02 Qualcomm Incorporated Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
ATE539433T1 (de) * 2008-07-11 2012-01-15 Fraunhofer Ges Forschung Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US8326075B2 (en) * 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
EP2396969A4 (en) * 2009-02-13 2012-12-12 Research In Motion Ltd MODIFIED ENTROPIC CODING FOR IMAGES AND VIDEOS
CN101710990A (zh) 2009-11-10 2010-05-19 华为技术有限公司 视频图像编码处理、解码处理方法和装置及编解码系统
FR2960335A1 (fr) * 2010-05-18 2011-11-25 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
US9118918B2 (en) * 2012-03-06 2015-08-25 National Taiwan University Method for rate-distortion optimized transform and quantization through a closed-form operation
EP2867892B1 (en) * 2012-06-28 2017-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based audio coding using improved probability distribution estimation
US20140010277A1 (en) * 2012-07-09 2014-01-09 Qualcomm, Incorporated Supplemental enhancement information (sei) messages having a fixed-length coded video parameter set (vps) id
US9549182B2 (en) * 2012-07-11 2017-01-17 Qualcomm Incorporated Repositioning of prediction residual blocks in video coding
US9264713B2 (en) * 2012-07-11 2016-02-16 Qualcomm Incorporated Rotation of prediction residual blocks in video coding with transform skipping
US9648318B2 (en) * 2012-09-30 2017-05-09 Qualcomm Incorporated Performing residual prediction in video coding
US9661340B2 (en) * 2012-10-22 2017-05-23 Microsoft Technology Licensing, Llc Band separation filtering / inverse filtering for frame packing / unpacking higher resolution chroma sampling formats
US10390034B2 (en) * 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US9877035B2 (en) * 2014-03-17 2018-01-23 Qualcomm Incorporated Quantization processes for residue differential pulse code modulation
EP2980793A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and methods for encoding and decoding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070147497A1 (en) * 2005-07-21 2007-06-28 Nokia Corporation System and method for progressive quantization for scalable image and video coding
US20110173004A1 (en) * 2007-06-14 2011-07-14 Bruno Bessette Device and Method for Noise Shaping in a Multilayer Embedded Codec Interoperable with the ITU-T G.711 Standard

Also Published As

Publication number Publication date
CA2956011C (en) 2019-06-18
AU2015295604A1 (en) 2017-02-16
US20190313100A1 (en) 2019-10-10
RU2017104514A3 (ko) 2018-08-30
JP2023169294A (ja) 2023-11-29
KR102014295B1 (ko) 2019-08-26
US20170142412A1 (en) 2017-05-18
RU2678168C2 (ru) 2019-01-23
JP2017530585A (ja) 2017-10-12
EP3175450A1 (en) 2017-06-07
CN107079152B (zh) 2021-04-02
CA2956011A1 (en) 2016-02-04
TWI582757B (zh) 2017-05-11
US20200344476A1 (en) 2020-10-29
WO2016016122A1 (en) 2016-02-04
EP2980793A1 (en) 2016-02-03
ES2688103T3 (es) 2018-10-30
RU2017104514A (ru) 2018-08-30
JP6892467B2 (ja) 2021-06-23
CN107079152A (zh) 2017-08-18
JP2021153305A (ja) 2021-09-30
JP6494741B2 (ja) 2019-04-03
PL3175450T3 (pl) 2019-01-31
KR102512937B1 (ko) 2023-03-22
AR101547A1 (es) 2016-12-28
AU2015295604B2 (en) 2018-09-20
TR201815373T4 (tr) 2018-11-21
KR20210144939A (ko) 2021-11-30
EP3175450B1 (en) 2018-07-18
TW201618084A (zh) 2016-05-16
KR20190101483A (ko) 2019-08-30
JP2019165439A (ja) 2019-09-26
MX2017001238A (es) 2017-03-14
MX366803B (es) 2019-07-25
PT3175450T (pt) 2018-10-22
US10735734B2 (en) 2020-08-04
AU2018260836B2 (en) 2020-11-05
ZA201700513B (en) 2019-05-29
AU2018260836A1 (en) 2018-11-22
CN112954323A (zh) 2021-06-11
MY178527A (en) 2020-10-15
SG11201700695TA (en) 2017-02-27
BR112017001518A2 (pt) 2018-01-30
US10375394B2 (en) 2019-08-06

Similar Documents

Publication Publication Date Title
US20200344476A1 (en) Encoder, decoder, system and methods for encoding and decoding
US11250866B2 (en) Context-based entropy coding of sample values of a spectral envelope
US7383180B2 (en) Constant bitrate media encoding techniques
KR102151728B1 (ko) 오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법
KR102069493B1 (ko) 고급 양자화기
JP4800379B2 (ja) 最大ビットレートを保証する情報の無損失符号化
US11315583B2 (en) Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US20100191534A1 (en) Method and apparatus for compression or decompression of digital signals
Melkote et al. Trellis-based approaches to rate-distortion optimized audio encoding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant