KR101224352B1 - 양자화 잡음을 감소시키는 방법 - Google Patents

양자화 잡음을 감소시키는 방법 Download PDF

Info

Publication number
KR101224352B1
KR101224352B1 KR1020077011362A KR20077011362A KR101224352B1 KR 101224352 B1 KR101224352 B1 KR 101224352B1 KR 1020077011362 A KR1020077011362 A KR 1020077011362A KR 20077011362 A KR20077011362 A KR 20077011362A KR 101224352 B1 KR101224352 B1 KR 101224352B1
Authority
KR
South Korea
Prior art keywords
quantization
tandem
devices
noise
signals
Prior art date
Application number
KR1020077011362A
Other languages
English (en)
Other versions
KR20070084369A (ko
Inventor
미네 반 데르 빈
아베케 엔. 레마
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070084369A publication Critical patent/KR20070084369A/ko
Application granted granted Critical
Publication of KR101224352B1 publication Critical patent/KR101224352B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Peptides Or Proteins (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

대응하는 인코딩된 출력 신호(380)를 생성하기 위해 입력 신호(340)를 처리하기 위한 시스템(10; 300)이 설명되어 있다. 시스템(10; 300)은 직렬로 연결된 복수의 양자화 장치들(30, 70; 350, 370)을 포함하며, 그 시스템(10; 300)은 (a) 탠덤 잡음 에러들이 발생하는 신호 영역들(290)을 결정하기 위해 시스템(10; 300)을 분석하고, (b) 상기 결정된 신호 영역들(290)로부터 그 안에 발생한 탠덤 잡음을 줄이기 위해 역방향 정정으로 시스템(10; 300)에서의 하나 이상의 이전 양자화 장치들(30; 350)을 변경함으로써 그 안에 발생하는 탠덤 양자화 잡음을 감소시키기 위해 동작시 구성되며, 상기 하나 이상의 이전 양자와 장치들(30; 350)은 시스템(10; 300)에서 직렬인 마지막 양자화 디바이스(70; 370)를 포함하지 않는다.
양자화 잡음, 탠덤, 잡음 감소

Description

양자화 잡음을 감소시키는 방법{Method of reducing quantization noise}
본 발명은 양자화 잡음을 감소시키는 방법들에 관한 것으로, 예를 들면, 본 발명은 보다 상세하게 복수의 신호 양자화 단계들이 직렬 배열로 함께 결합될 때 발생하는 탠덤(tandem) 양자화 잡음을 감소시키는 방법들에 관한 것이다. 게다가, 본 발명은 또한 전술한 방법들을 실행하도록 동작가능한 장치에 관한 것이다. 더욱이, 본 발명은 그 방법들을 실행함으로써 생성된 양자화된 출력 데이터에 관한 것이다.
탠덤 코딩 아티팩트들은 양자화기들이 직렬 배열로 결합될 때 발생한다. 그러한 코딩 아티팩트들은 예를 들면 멀티미디어 신호들을 트랜스코딩할 때 마주할 수 있고, 여기서 이들 아티팩트들의 주요 구성요소는 "탠덤 양자화 잡음"으로서 알려져 있다.
도 1에서, 일반적으로 10으로 나타내어진 현대 음악 전달 시스템이 도시된다. 시스템(10)은 100으로 나타내어진 펄스 코드 변조된(PCM) 프로그램 콘텐트 데이터(x)를 제공하기 위한 데이터 저장소(20)를 포함한다. 게다가, 시스템(10)은 110으로 나타내어진 인코딩된 데이터(xb1)을 제공하도록 동작가능한, 30으로 나타내어진 제 1 양자화 인코더(EN1(Q1))를 더 포함한다. 시스템(10)은 현대 AAC 압축 표준에 따라 압축된 저장된 데이터를 위해 40으로 나타내어진 중간 데이터 저장소(AAC)를 포함한다. 또한, 시스템(10)은 120으로 나타내어진 디코딩된 데이터(x1)를 생성하기 위해 50으로 나타내어진 디코더(DEC1)를 포함한다. 시스템(10)은 또한 60으로 나타내어진 워터마크 임베더(WATMKEMB)를 포함한다. 마지막으로, 시스템(10)은 130으로 나타내어진 인코딩된 출력 비트스트림 xb2를 생성하기 위해 70으로 나타내어진 제 2 양자화 인코더(EN2(Q2))를 포함한다.
동작시, 데이터 저장소(20)는 중간 데이터 저장소(40)에 저장하기 위한 대응하는 인코딩된 데이터 xb1을 생성하기 위해 데이터 x(100)를 양자화 및 인코딩하는 인코더 EN1(Q1)에 콘텐트 데이터 x(100)을 출력한다. 고객으로부터의 음악 요청에 응답하여, 시스템(10)은 중간 저장한 AAC(40)로 하여금 비트스트림으로서 대응하는 저장소에 인코딩 데이터를 디코더 DEC1(50)로 출력하도록 지시하기 위해 동작가능하다. 디코더 DEC1(50)는 제 2 양자화 인코더 EN2(Q2)(70)에 대응하는 워터마킹된 콘텐트 데이터를 출력하는 워터마크 임베더 WATMKEMB(60)로 후속하여 입력되는 데이터 x1(102)를 생성하기 위해 비트스트림을 부분적으로 디코딩한다. 인코더 EN2(Q2)(70)는 고객에게 공급하기 위한 인코딩된 출력 비트스트림 xb2(130)을 생성하기 위해 워터마크 임베더 WATMKEMB(60)로부터 수신된 데이터를 처리한다.
다음의 재 인코딩에 앞서 인코딩된 데이터의 부분적인 디코딩을 수반하는 시스템(10)의 전술된 동작에서의 하나의 단점은 출력 비트스트림 xb2(130)으로의 탠덤 아티팩트들의 도입이다. 이들 아티팩트들은 두 개 이상의 오디오 압축 알고리즘들을 케스케이딩함으로써(cascade), 즉 소프트웨어를 사용하여 실행될 때 인코더들(30, 70)을 케스케이딩함으로써 야기되는 에러들이다. 탠덤 에러로서 또한 알려진 탠덤 아티팩트들은 도 2를 참조하여 보다 용이하게 이해되며, 여기서 200, 210으로 나타내어진 두 개의 그래프들은 각각 인코더들(30, 70)에 대응한다. 그래프들(200, 210)은 각각 가로좌표 축들(250, 270) 및 각각 양자화 세로좌표 축들(260, 280)을 포함한다. 더욱이, 이러한 예에서, 인코더들(30, 70)은 워드 길이들 w1 = 3비트와 w2 = 2비트 각각을 이용하도록 동작가능하다. 이들 예시적인 워드 길이들에 대해서, 시스템(10)은 출력 데이터 xb2(130)를 생성할 때보다 낮은 비트 레이트로 트랜스코딩하도록 동작가능하다.
그러므로, 데이터 x(100)에 의해 나타내어진 입력 신호는 인코딩된 데이터 xb1(110)를 생성하기 위해 제 1 인코더 EN1(Q1)(30)에서의 처리 후에
Figure 112010066415445-pct00001
로서 정의된다. 이러한 인코딩된 데이터 xb1(110)은 예를 들면, 식 1(식.1)에 의해 정의된 출력 비트스트림 y12를 생성하기 위해 제 2 인코더 EN2(Q2)(70)에서 직접 추가 인코딩(워터마킹없이)될 수 있다.
Figure 112010066415445-pct00002
식.1
관련된 평균 양자화 에러(e12)는 식 2(식.2)에 의해 주어진다.
Figure 112010066415445-pct00003
식.2
N개의 샘플에 대해서. 비교시,
Figure 112010066415445-pct00004
인 제 2 인코더 EN2(Q2)(60)를 통해 직접 데이터 x를 처리함으로써 생성된 양자화 에러가 식 3(식.3)에 의해 주어진다.
Figure 112010066415445-pct00005
식.3
일반적으로, y2의 양자화 에러는 y12의 것보다 작다. 즉 e2 < e12이다. 더욱이, y12 및 y2의 양자화 에러들 간의 차이는 식 4(식.4)에 따라 전술된 탠덤 에러(et)에 대응한다.
Figure 112010066415445-pct00006
식.4
도 2를 다시 참조하면, 시스템(10)에서, 탠덤 에러는 그래프(200)의 크로스 해치된(cross-hatched) 영역들, 예로써 크로스 해치된 영역(290)에 발생된다. 즉,
x∈[0.5,1] x∈[2.5,3] x∈[4.5,5] x∈[6.5,7]
예를 들면, 진폭 2.75를 갖는 x는 제 1 인코더 EN1(Q1)에 의해 진폭 3, 즉 3=Q1(2.75)로, 이어서 제 2 인코더 EN2(Q2)에서 진폭 4로, 즉 4=Q2(Q1(2.75))로 제 1 양자화된다. 그 결과적인 양자화 에러는 4-2.75=1.25이다. 비교시, 단지 제 2 인코더 EN2(Q2)만을 사용하여 훨씬 더 작은 에러, 즉 Q2(2.75)-2.75=0.75를 결과로 나타낸다.
탠덤 잡음에 대응하는 양자화 에러의 증가는 일반적으로 트랜스코딩과 연관된 문제로서 인식된다. 신호의 신호 대 잡음 비를 감소시키는 것을 제외하고, 탠덤 잡음은 또한 보다 미세한 신호 특징들, 예를 들면 오디오 신호 내에 포함된 오디오 워터마크 정보를 모호하게 할 수 있다.
탠덤 잡음의 문제에 대한 적어도 부분적인 솔루션들이 종래 기술에서 제안되어 왔다. 제 1 솔루션은 두 개의 양자화 인코더들을 단계적으로 즉, 제 1 인코더에 이어서 순차적으로 제 2 인코더를 행함으로써 탠덤 잡음을 감소시킨다. 제 1 인코더는 제 2 인코더에 관하여 훨씬 더 높은 비트 레이트를 이용하도록 배열된다. 그러한 감소는 도 2로부터 이해될 수 있으며, 여기서 높은 비트레이트들을 갖는 인코더들이 보다 큰 워드 길이들 및 연관된 더 높은 분해능을 갖는, 즉 인코더(30)의 분해능을 증가시키는 양자화기에 대응한다. 비록 이러한 접근 방식이 효과적일지라도, 그것은 xb1(110)에 대한 중간 데이터 저장소 AAC(40)에 요구되는 데이터 저장 공간이 필요한 것보다 높게 증가된다는 단점을 가진다. 다른 접근법들은 모델링 기술들이 탠덤 잡음을 예측하고 그 탠덤 잡음을 감소시키기 위해 적어도 부분적으로 보상하도록 이러한 예측을 이용하는데 사용될 수 있음이 알려져 있다.
공개된 유럽 특허 출원 번호 EP 1 359 762에서, 몇몇 상이한 양자화 레벨들에서 입력 데이터를 인코딩 및 디코딩하는 방법 및 코더/디코더 시스템이 설명되어 있다. 상이한 양자화 레벨들은 신호 대 잡음 비(SNR) 스케일러빌리티를 허용한다. 시스템은 몇 개의 양자화기 유닛들을 포함하며, 여기서 각각의 양자화기 유닛은 대응하는 양자화 레벨로 입력 데이터를 양자화하도록 동작한다. 더욱이, 각각의 양자화기는 양자화 함수를 이용하도록 동작가능하다. 시스템에서, 최적의 SNR 스케일러빌리티를 달성하기 위해, 양자화기 유닛들은 예측 에러의 평균 제곱 에러가 최소화되고 양자화 예측 에러가 완전히 재구성될 수 있도록 특정 처리 순서로 배열된다.
따라서, 발명자들은 케스케이딩된 양자화기들에서의 탠덤 양자화 잡음을 감소시키는 방법을 고안하는 기술적 문제에 관련된다.
본 발명의 목적은 케스케이딩된 양자화기들 또는 케스케이딩된 양자화 인코더들에서 탠덤 양자화 잡음을 감소시키는 방법을 제공하는 것이다.
본 발명의 제 1 양상에 따르면, 직렬로 결합된 복수의 양자화 디바이스들을 포함하는 시스템에서 탠덤 양자화 잡음을 감소시키는 방법이 제공되며, 상기 방법은 다음의 단계들을 포함한다.
(a) 탠덤 잡음 에러들이 발생하는 신호 영역들을 결정하기 위해 시스템의 동작을 분석하는 단계; 및
(b) 상기 결정된 신호 영역들로부터 그 안에 발생하는 탠덤 잡음을 감소시키기 위해 역방향 정정으로 시스템에서 하나 이상의 이전 양자화 디바이스들을 변경하는 단계로서, 상기 하나 이상의 이전 양자화 디바이스들은 시스템에서 직렬인 마지막 양자화 디바이스를 포함하지 않는다.
본 발명은 케스케이딩된 양자화 구성들에서 탠덤 양자화 잡음을 감소시킬 수 있는 방법에 이점이 있다.
선택적으로, 본 방법은 일련의 양자화 디바이스들을 통해 신호들을 처리하도록 시스템을 배열하는 단계를 더 포함하며, 상기 신호들은 오디오 신호들, 비디오 신호들, 이미지 신호들, 텍스트 베어링 신호들 중 하나 이상을 포함한다. 그 방법은 광범위한 상이한 유형들의 신호에 적용될 수 있다는 점에서 이점이 있다.
선택적으로, 본 방법은 상기 양자화 디바이스들에 의해 처리된 데이터를 압축하기 위한 압축 알고리즘들을 실행하도록 상기 복수의 양자화 디바이스들을 배열하는 단계를 포함한다. 보다 바람직하게는, 상기 압축 알고리즘들은 MPEG 압축, AAC 압축 및 MP3 압축의 적어도 하나를 포함한다. 이러한 압축 알고리즘들은 데이터 저장 요건들을 감소시킬 수 있다.
선택적으로, 본 방법은 상기 복수의 양자화 디바이스들을 통해 처리되는 데이터에 워터마크 데이터를 부가하는 단계를 더 포함한다. 본 방법은 워터마킹한 데이터 콘텐트와 함께 사용될 수 있다는 이점이 있으며, 여기서 그 방법에 의해 제공된 감소된 탠덤 양자화 잡음은 미세한 부가된 워터마크 데이터를 모호하게 하는 그러한 탠덤 잡음에 대한 문제점을 적어도 부분적으로 회피한다.
선택적으로, 본 방법은 멀티미디어 신호 분배 시스템을 구현하는 것과 관련하여 이용된다. 그 후, 그 방법은 그러한 분배 시스템을 통해 사용자들에게 전달된 프로그램 콘텐트의 품질을 향상시키는 이점이 있다.
선택적으로, 본 방법에서, 직렬로 결합된 복수의 양자화 디바이스들에서의 마지막 양자화기는 또한 시스템 내에 발생하는 탠덤 잡음을 감소시키기 위해 변경된다.
본 발명의 제 2 양상에 따르면, 본 발명의 제 1 양상에 따른 방법을 사용하여 생성된 양자화된 출력 데이터를 제공하고, 상기 데이터는 통신 네트워크 및/또는 데이터 캐리어(data carrier)에 의해 전달 가능하다.
본 발명의 제 3 양상에 따르면, 대응하는 인코딩된 출력 신호를 생성하도록 입력 신호를 처리하기 위한 장치가 제공되며, 상기 장치는 직렬로 결합된 복수의 양자화 디바이스들을 포함하고, 동작시 상기 장치는 다음에 의해 그 안에 발생하는 탠덤 양자화 잡음을 감소시키도록 구성된다.
(a) 탠덤 잡음 에러들이 발생하는 신호 영역들을 결정하기 위해 장치를 분석하는 단계; 및
(b) 상기 결정된 신호 영역들로부터 그 안에 발생하는 탠덤 잡음을 감소시키기 위해 역방향 정정으로 장치에서의 하나 이상의 이전 양자화 디바이스들을 변경하는 단계로서, 상기 하나 이상의 이전 양자화 디바이스들은 장치에서 직렬인 마지막 양자화 디바이스를 포함하지 않는다.
본 발명의 제 4 양상에 따르면, 대응하는 인코딩된 출력 신호를 생성하도록 입력 신호를 처리하기 위한 시스템이 제공되며, 상기 시스템은 직렬로 결합된 복수의 양자화 디바이스를 포함하고, 상기 시스템은 동작시 다음에 의해 그 안에 발생하는 탠덤 양자화 잡음을 감소시키도록 구성된다.
(a) 탠덤 잡음 에러들이 발생하는 신호 영역들을 결정하기 위해 시스템을 분석하는 단계; 및
(b) 상기 결정된 신호 영역들로부터 그 안에 발생하는 탠덤 잡음을 감소시키기 위해 역방향 정정으로 시스템에서의 하나 이상 이전 양자화 디바이스들을 변경하는 단계로서, 상기 하나 이상 이전 양자화 디바이스들은 시스템에서 직렬인 마지막 양자화 디바이스를 포함하지 않는다.
선택적으로, 시스템은 일련의 양자화 디바이스들을 통해 신호들을 처리하도록 동작가능하며, 상기 신호들은 오디오 신호들, 비디오 신호들, 이미지 신호들, 텍스트 베어링 신호들 중 하나 이상을 포함한다.
선택적으로, 시스템은 상기 복수의 양자화 디바이스들이 상기 양자화 디바이스들에 의해 처리된 데이터를 압축하기 위한 압축 알고리즘을 실행하도록 동작가능하다. 보다 바람직하게는, 상기 압축 알고리즘들은 MPEG 압축, AAC 압축, 및 MP3 압축 중 적어도 하나를 포함한다.
선택적으로, 시스템은 상기 복수의 양자화 디바이스들을 통해 처리되는 데이터에 워터마크 데이터를 부가하도록 동작가능하다.
선택적으로, 시스템은 멀티미디어 신호 분배 시스템을 실행하도록 동작시 배열된다.
본 발명의 특징들은 본 발명의 범위로부터 벗어남이 없이 임의의 조합으로 결합될 수 있음을 이해할 것이다.
다음의 다이어그램을 참조하여 단지 예로서 본 발명의 실시예들이 설명될 것이다.
도 1은 연속된 양자화 인코더들을 이용한 알려진 프로그램 콘텐트 분배 시스 템의 개략적인 다이어그램으로, 상기 인코더들은 동작시 탠덤 양자화 잡음을 나타내는 경향이 있다.
도 2는 탠덤 양자화 잡음이 잠재적으로 발생되는 구역들을 갖는 도 1의 시스템에 이용된 두 개의 예시적인 인코더들의 양자화 단계들을 도시한 도면.
도 3은 본 발명의 실시예, 즉 실질적으로 탠덤 잡음을 없게 할 수 있는 더블 양자화기들의 예시를 설명한 도면.
도 4는 도 3의 실시예를 위한 탠덤 잡음(et)에 대한 제 1 양자화 인코더 워드 길이(w1) 사이의 트레이드 오프를 설명한 그래프.
도 5는 eq2가 제 2 양자화 인코더의 양자화 잡음인 비율 et/eq2에 대한 제 1 양자화 인코더 워드 길이(w1) 간의 트레이드 오프를 설명한 그래프.
오디오 및/또는 비디오 프로그램 주제에 속하는 프로그램 콘텐트 데이터를 분배하기 위한 시스템에서 양자화 인코더들을 케스케이딩할 때 발생되는 탠덤 양자화 잡음의 문제를 감소시키기 위해, 발명자들은 소위 "탠덤 잡음 없는"(TNF) 양자화기를 고안하였다. 이러한 양자화기는 예를 들어 도 1에 도시된 현대의 시스템(10)에 이용되기 쉽다.
본 발명의 실시예는 도 3에 도시되며, 여기서 각각 350, 370으로 나타내어진 두 개의 양자화기들(Q'1, Q'2)이 일반적으로 300으로 나타내어진 구성에 결합된다. 구성(300)에는 바람직하게는 또한 도 1의 워터마크 임베더 WATMKEMB(60)에 유사한 워터마크 임베더(미도시)가 제공된다. 더욱이, 구성(300)은 또한 선택적으로 MPEG 압축, AAC 압축 및 MP3 압축 중 적어도 하나를 포함하는 데이터 압축 알고리즘들을 수행하도록 동작가능하다.
구성(300)에서, 양자화기들(350, 370)은 예를 들면, 예로써 멀티미디어 목적을 위해 적응된 도 1에 도시된 시스템(10)과 유사한, 프로그램 콘텐트 데이터를 분배하기 위한 신호 처리 체인의 일부이다. 선택적으로 부가적인 기능들, 예를 들면 데이터 저장소는 양자화기들(350, 370) 사이에 삽입된다. 이러한 제 1 양자화기(350)의 동작으로 인해 발생하는 탠덤 양자화를 감소시킬 목적으로 본 명세서에 보다 상세하게 설명될 바와 같이, 제 1 양자화기(350)는 340으로 나타내어진 입력 신호 x를 또한 반대 방향으로 양자화하도록 동작가능한 양자화기가 없다면, 구성(300)에서 양자화기들(350, 370)은 도 2에 도시된 것과 유사한 방식으로 탠덤 양자화 잡음이 나타나기 쉬울 것이다.
도 3에서, 전술한 반대 방향의 동작을 갖는 두 개의 양자화기들(350, 370)의 세트에 대해, 380으로 나타내어진 출력 Q2(Q'1(x))은 식 5(식.5)에 의해 설명된 바와 같이 제 2 양자화기(370)에 의해 처리된 입력 신호 x(340)와 동일하다.
Figure 112010066415445-pct00019
식.5
즉, 출력(380)을 생성하기 위해 신호 x(340)를 처리할 때 구성(300)에 의해 생성된 전체 탠덤 잡음 왜곡은 제 2 양자화기(370)에 의해 도입된 왜곡들에 대응한 다.
또한 그러한 원리를 설명하기 위해, 도 2가 다시 참조된다. 입력 신호 x(340)는 예를 들면 x=2.75를 만족한다. 예시적인 현대 시스템(10)에서, x(340)에 대한 값은 1.25의 에러를 야기하는 값 4에 양자화될 것이다. 시스템(10)과 대비하여, 구성(300)은 제 2 양자화기(370)에 앞선 값 Q'1(2.75)=2가 출력(380)에 대한 Q2(2)=2를 산출한다고 가정하면 출력(380)을 결과로서 나타낸다. 제 2 양자화기(370)가 출력(380)을 생성하기 위해 신호 x(340)를 처리하도록 직접 이용된다면 유사한 결과가 발생하며, 즉 Q2(2.75)=Q2(2)=2이다. 도 3에서, 양자화기(350)는 제 1 양자화기(350)와 연관된 전술된 반대 방향 함수를 지지하기 위해 330으로 나타내어진 제어 유닛 DTRD Q'1을 가지고 있다. "DTRD"는 제 1 양자화기(350)의 변환 특성들이 구성(300) 내에 예측된 탠덤 잡음 생성을 예상하고 변경된다는 것을 나타내는 "탠덤 영역들을 도출하고 Q'1을 설계(Derive Tandem Regions and Design Q'1)"의 약어이다.
보다 일반적인 용어들로, 관련된 출력 워드 길이들(w1, w2) 각각을 갖는 두 개의 선형 양자화기들(Q1, Q2)의 세트의 동작이 분석될 수 있다. 신호 x(340)가 최소 0에서 최대 xmax의 범위에 있다면, 즉 x∈[0, xmax]라고 가정하면, 두 양자화기들(350, 370) 모두에 대한 양자화 단계 △Q는 식 6(식.6)에 의해 주어진다.
Figure 112007036695268-pct00008
식.6
그 탠덤 왜곡이 잠재적으로 발생할 수 있는 영역들의 수, 예를 들면 도 2에서 Nt로 나타내어진 영역(290)은 식 7(식.7)로부터 계산될 수 있다.
Figure 112007036695268-pct00009
식.7
발명자들은 영역마다 평균 탠덤 에러, 즉 eR이 식 8(식.8)에 제공된 바와 같이 제 1 양자화기(350)에 의해 단지 영향을 받는다는 것을 이해한다.
Figure 112007036695268-pct00010
식.8
따라서, x∈[0, xmax]를 만족하는 균일하게 분배된 신호 x(340)에 대해서, 구성(300)에서 처리된 신호 샘플당 평균 탠덤 에러는 식 9(식.9)에 의해 주어진다.
Figure 112007036695268-pct00011
식.9
여기서, w2 < w1이다.
예를 들면, w1 = 3, w2 = 2 및 xmax = 7인 상황에서, et = 1/7의 평균 탠덤 잡음 에러는 신호 x(340)에 대한 입력 샘플마다 발생한다. 평균 탠덤 에러(et)는 도 4에서 400으로 나타내어진 그래프에 존재한다. 그래프(400)은 워드 길이 w1을 나타내는 가로좌표 축(410) 및 전술한 평균 에러 et를 나타내는 세로좌표 축(420)을 포함한다. 화살표(430)는 워드 길이(w2)가 1에서 8로 증가됨에 따른 평균 에러(et)에 대한 경향을 나타낸다.
발명자들은 탠덤 잡음 에러가 유익하게는 구성(300)에서 총 양자화 에러에 관한 탠덤 잡음 에러를 조사함으로써 추정된다는 것을 이해한다. 제 1 양자화기(350)가 최소 탠덤 잡음을 나타내도록 전술한 바와 같이 제어될 때, 구성(300)에서 발생하는 총 양자화 잡음은 제 2 양자화기(370)로부터 발생하도록 추정될 수 있다. 그러한 상황에서, 신호 x(340)에서 입력 값 당 평균 에러 eq2는 식 10(식.10)에 의해 주어진다.
Figure 112007036695268-pct00012
식.10
도 5에서, 총 에러 et 및 에러 eq2의 플롯(plot)은 일반적으로 500으로 나타내어진 그래프상에 존재한다. 그래프(500)는 제 1 양자화기(350)의 워드 길이를 나타내는 가로좌표 축(510)과 전술한 에러들(et, eq2)의 비를 나타내는 세로좌표 축(520)을 포함한다. 도 2로부터, 발명자들은 양자화 잡음의 상대적인 에너지가 화살표(530)에 의해 설명된 바와 같이 각각 제 1 및 제 2 양자화기들(350, 370)의 워드 길이들(w1, w2)에서의 차이의 함수임을 확인한다. 특히, 주어진 상수 β에 대해서, 양자화 잡음(eq2)에 관한 탠덤 에너지(et)는 식 11(식.11)에 의해 주어진다.
Figure 112007036695268-pct00013
식.11
식 9 및 10으로부터, 상수 β는 β=2의 숫자값을 갖는다는 것이 발견된다. 세로좌표 축(520)으로부터 인식할 수 있는 상대적인 에너지는 워드 길이 w2가 w1에 도달할 때까지 증가한다. 예를 들면, w2 = w1 - 1일 때, 탠덤 잡음(et)은 양자화 잡음(eq2)의 약 50%이다. 다른 예로서, w2 = w1 -2인 경우, 탠덤 잡음(et)은 양자화 잡음(eq2)의 약 12.5%이다.
도 3에 도시된 구성(300)은 도 1에 도시된 시스템(10)에 사용되기 쉽다. 본 발명에 따라 변경된 시스템(10)에서, 오디오 신호는 초당 128 킬로바이트에서 초당 64 킬로바이트로 시스템 내에서 트랜스코딩된다. 예를 들면, 44.1 kHz 신호의 경우에, 그러한 트랜스코딩은 샘플당 3비트에서 샘플당 1.5비트로의 트랜스코딩에 대응한다. 선형 양자화기들이 양자화 인코더들(30, 70)을 위해 이용된다면, 상대적인 탠덤 잡음 에너지는 총 양자화 잡음(et)의 25%가 된다. 그러므로, 시스템(10)에 발생하는 총 코딩 잡음은 25%까지 감소될 수 있다.
전술한 바로부터, 시스템(10)은 탠덤 잡음이 두 개의 연속된 양자화 인코더들(30, 70)이 있음에도 불구하고 실질적으로 도입되지 않도록 하여 출력 xb2(130)의 품질을 향상시키도록 본 발명에 따라 적응되도록 한다. 대안적으로, 주어진 오디오 품질에 대해서, 발명은 인코딩된 비트스트림 xb1(110)을 저장하기 위한 데이터 저장소 AAC(40)에 요구된 저장 공간을 감소시킬 수 있다.
이전에서 설명된 본 발명의 실시예들은 첨부된 청구항들에 의해 정의된 바와 같이 본 발명의 범위로부터 벗어남이 없이 변경될 수 있음을 이해할 것이다.
첨부한 청구항들에서, 괄호 내에 포함된 숫자들 및 다른 기호들은 청구항들의 이해를 돕기 위해 포함되며, 어쨌든 청구항들의 범위를 제한하려고 의도되지 않는다.
"포함하다(comprise, include, incorporate, contain)", "이다", 및 "가지다"와 같은 표현들은 설명 및 그와 연관된 청구항들을 해석할 때 비 배타적인 방식으로 해석되는 것이며, 즉 또한 명백하게 정의되지 않은 다른 아이템들 또는 구성요소들이 제공되도록 허용한다고 해석된다.
단수에 대한 참조는 또한 복수 및 그 역에 대한 참조인 것으로 해석될 것이다.

Claims (15)

  1. 직렬로 결합된 복수의 양자화 디바이스들(30, 70; 350, 370)을 포함하는 시스템(10; 300)에서 탠덤(tandem) 양자화 잡음을 감소시키는 방법에 있어서,
    (a) 탠덤 잡음 에러들이 발생하는 신호 영역들(290)을 결정하기 위해 상기 시스템(10; 300)의 동작을 분석하는 단계;
    (b) 상기 결정된 신호 영역들로부터 그 안에 발생하는 탠덤 잡음을 감소시키기 위해 역방향 정정으로 상기 시스템(10; 300)에서 하나 이상의 이전 양자화 디바이스들(30; 350)을 변경하는 단계로서, 상기 하나 이상의 이전 양자화 디바이스들(30; 350)은 상기 시스템(10; 300)에서 직렬인 마지막 양자화 디바이스(70; 370)를 포함하지 않는, 탠덤 양자화 잡음 감소 방법.
  2. 제 1 항에 있어서,
    상기 방법은 상기 직렬의 양자화 디바이스들(30, 70; 350, 370)을 통해 신호들을 처리하도록 상기 시스템(10; 300)을 배열하는 단계를 더 포함하며, 상기 신호들은 오디오 신호들, 비디오 신호들, 이미지 신호들, 텍스트 베어링 신호들 중 하나 이상을 포함하는, 탠덤 양자화 잡음 감소 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 양자화 디바이스들(30, 70; 350, 370)에 의해 처리된 데이터를 압축하기 위한 압축 알고리즘들을 실행하기 위해 상기 복수의 양자화 디바이스들(30, 70; 350, 370)을 배열하는 단계를 포함하는, 탠덤 양자화 잡음 감소 방법.
  4. 제 3 항에 있어서,
    상기 압축 알고리즘들은 MPEG 압축, AAC 압축 및 MP3 압축 중 적어도 하나를 포함하는, 탠덤 양자화 잡음 감소 방법.
  5. 제 1 항에 있어서,
    상기 복수의 양자화 디바이스들을 통해 처리되는 데이터에 워터마크 데이터를 부가하는 단계를 더 포함하는, 탠덤 양자화 잡음 감소 방법.
  6. 제 1 항에 있어서,
    상기 방법은 멀티미디어 신호 분배 시스템(10; 300)을 실행하는 것과 함께 이용되는, 탠덤 양자화 잡음 감소 방법.
  7. 제 1 항에 있어서,
    직렬로 결합된 상기 복수의 양자화 디바이스들에서 마지막 양자화기는 또한 상기 시스템 내에 발생하는 탠덤 잡음을 감소시키기 위해 변경되는, 탠덤 양자화 잡음 감소 방법.
  8. 삭제
  9. 대응하는 인코딩된 출력 신호(380)를 생성하기 위해 입력 신호(340)를 처리하기 위한 장치(300)에 있어서, 상기 장치는 직렬로 결합된 복수의 양자화 디바이스들(350, 370)을 포함하고, 상기 장치(300)는 동작시 그 안에 발생하는 탠덤 양자화 잡음을 감소시키기 위해,
    (a) 탠덤 잡음 에러들이 발생하는 신호 영역들(290)을 결정하기 위해 상기 장치를 분석하고,
    (b) 상기 결정된 신호 영역들로부터 그 안에 발생하는 탠덤 잡음을 감소시키기 위해 역방향 정정으로 상기 장치에서 하나 이상의 이전 양자화 디바이스들(350)을 변경하도록 구성되고, 상기 하나 이상의 이전 양자화 디바이스들(350)은 상기 장치(300)에서 직렬인 마지막 양자화 디바이스(370)를 포함하지 않는, 입력 신호 처리 장치.
  10. 대응하는 인코딩된 출력 신호(380)를 생성하기 위해 입력 신호(340)를 처리하는 시스템에 있어서, 상기 시스템은 직렬로 연결된 복수의 양자화 디바이스들(350, 370)을 포함하고, 상기 시스템은 동작시 그 안에 발생하는 탠덤 양자화 잡음을 감소시키기 위해,
    (a) 탠덤 잡음 에러들이 발생하는 신호 영역들(290)을 결정하기 위해 상기 시스템을 분석하고,
    (b) 상기 결정된 신호 영역들로부터 그 안에 발생하는 탠덤 잡음을 감소시키기 위해 역방향 정정으로 상기 시스템에서 하나 이상의 이전 양자화 디바이스들(350)을 변경하도록 구성되고, 상기 하나 이상의 이전 양자화 디바이스들(350)은 상기 시스템에서 직렬인 마지막 양자화 디바이스(370)를 포함하지 않는, 입력 신호 처리 시스템.
  11. 제 10 항에 있어서,
    상기 시스템은 상기 직렬의 양자화 디바이스들(350, 370)을 통해 신호들을 처리하도록 동작가능하고, 상기 신호들은 오디오 신호들, 비디오 신호들, 이미지 신호들, 텍스트 베어링 신호들 중 하나 이상을 포함하는, 입력 신호 처리 시스템.
  12. 제 10 항에 있어서,
    상기 시스템은 상기 복수의 양자화 디바이스들(350, 370)이 상기 양자화 디바이스들(350, 370)에 의해 처리된 데이터를 압축하기 위한 압축 알고리즘들을 실행하도록 동작할 수 있게 배열되는, 입력 신호 처리 시스템.
  13. 제 12 항에 있어서,
    상기 압축 알고리즘들은 MPEG 압축, AAC 압축, 및 MP3 압축 중 적어도 하나를 포함하는, 입력 신호 처리 시스템.
  14. 제 10 항에 있어서,
    상기 시스템은 상기 복수의 양자화 디바이스들을 통해 처리되는 데이터에 워터마크 데이터를 부가하도록 동작가능한, 입력 신호 처리 시스템
  15. 제 10 항에 있어서,
    상기 시스템은 동작시 멀티미디어 신호 분배 시스템을 실행하도록 배열되는, 입력 신호 처리 시스템.
KR1020077011362A 2004-10-20 2005-10-14 양자화 잡음을 감소시키는 방법 KR101224352B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04105181 2004-10-20
EP04105181.4 2004-10-20
PCT/IB2005/053378 WO2006043218A1 (en) 2004-10-20 2005-10-14 Method of reducing quantization noise

Publications (2)

Publication Number Publication Date
KR20070084369A KR20070084369A (ko) 2007-08-24
KR101224352B1 true KR101224352B1 (ko) 2013-01-21

Family

ID=35478198

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077011362A KR101224352B1 (ko) 2004-10-20 2005-10-14 양자화 잡음을 감소시키는 방법

Country Status (9)

Country Link
US (1) US7663527B2 (ko)
EP (1) EP1805996B1 (ko)
JP (1) JP4796583B2 (ko)
KR (1) KR101224352B1 (ko)
CN (1) CN101073272B (ko)
AT (1) ATE429783T1 (ko)
DE (1) DE602005014130D1 (ko)
ES (1) ES2324726T3 (ko)
WO (1) WO2006043218A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150225608A1 (en) 2013-08-02 2015-08-13 Lg Chem, Ltd. Water repellent and oil repellent film, and electrical and electronic apparatus
JP6166472B2 (ja) 2013-08-02 2017-07-19 エルジー・ケム・リミテッド 耐指紋性フィルムおよび電気電子装置
GB2546963B (en) * 2015-12-23 2020-10-21 Law Malcolm Transparent lossless audio watermarking enhancement

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005071974A2 (en) * 2004-01-16 2005-08-04 Koninklijke Philips Electronics N.V. Method of bit stream processing
US20060080581A1 (en) 2003-08-05 2006-04-13 Takeshi Ono Regenerative relay system and regenerative relay apparatus

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3150475B2 (ja) 1993-02-19 2001-03-26 松下電器産業株式会社 量子化方法
FI111764B (fi) * 1999-06-10 2003-09-15 Nokia Corp Menetelmä ja järjestely kuvatiedon käsittelemiseksi
DE19946267C2 (de) * 1999-09-27 2002-09-26 Harman Becker Automotive Sys Digitales Transcodiersystem
DE19947877C2 (de) 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
KR100744442B1 (ko) * 1999-11-03 2007-08-01 코닌클리케 필립스 일렉트로닉스 엔.브이. 디지털 비디오 및 이미지들에 대한 개선된 캐스케이드 압축 방법 및 시스템
JP4125885B2 (ja) * 2001-11-09 2008-07-30 日本電信電話株式会社 画像符号化方法及びその装置と、画像符号化プログラム及びそのプログラムを記録した記録媒体
EP1359762A1 (en) 2002-05-02 2003-11-05 Siemens Aktiengesellschaft Quantizer for scalable video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060080581A1 (en) 2003-08-05 2006-04-13 Takeshi Ono Regenerative relay system and regenerative relay apparatus
WO2005071974A2 (en) * 2004-01-16 2005-08-04 Koninklijke Philips Electronics N.V. Method of bit stream processing

Also Published As

Publication number Publication date
JP4796583B2 (ja) 2011-10-19
ATE429783T1 (de) 2009-05-15
US20090046819A1 (en) 2009-02-19
ES2324726T3 (es) 2009-08-13
KR20070084369A (ko) 2007-08-24
CN101073272A (zh) 2007-11-14
EP1805996B1 (en) 2009-04-22
DE602005014130D1 (de) 2009-06-04
CN101073272B (zh) 2015-04-29
WO2006043218A1 (en) 2006-04-27
JP2008517548A (ja) 2008-05-22
US7663527B2 (en) 2010-02-16
EP1805996A1 (en) 2007-07-11

Similar Documents

Publication Publication Date Title
US7539612B2 (en) Coding and decoding scale factor information
KR101278805B1 (ko) 엔트로피 코딩 방법 및 엔트로피 디코딩 방법
EP2335242B1 (en) Audio decoder, method for decoding an audio signal and computer program
JP6892467B2 (ja) 符号化及び復号化のための符号化装置、復号化装置、システム及び方法
WO2003101113A2 (en) Entropy constrained scalar quantizer for a laplace-markov data source
CN1195930A (zh) 音频信号编码方法及其有关设备
CN1918632A (zh) 音频编码
Wen et al. Trellis-based RD optimal quantization in H. 263+
CN101026758B (zh) 视频代码转换方法和设备
CN103250206A (zh) 用于比特流域中的编码音频帧的强度估计的装置及方法
US8380495B2 (en) Transcoding method, transcoding device and communication apparatus used between discontinuous transmission
KR20070029647A (ko) 비트 스트림 프로세싱 방법
KR101224352B1 (ko) 양자화 잡음을 감소시키는 방법
CN1918631A (zh) 音频编码
KR100668319B1 (ko) 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
CN101547010B (zh) 编码解码系统、方法及装置
Brites et al. Probability updating for decoder and encoder rate control turbo based Wyner-Ziv video coding
US11234023B2 (en) Features of range asymmetric number system encoding and decoding
US20160360236A1 (en) Method and Apparatus for Entropy Transcoding
AL-Rawi ADPCM: US Patents from 2010 to 2016
Imm et al. Lossless coding of audio spectral coefficients using selective bitplane coding
JPH01152826A (ja) 可変ビットレート式適応予測符号化方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160107

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170110

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee