KR20020026243A - 동작 보정 블록에 기반한 압축 디지털 비디오의 다변 복합디코딩에 관한 방법 및 장치 - Google Patents

동작 보정 블록에 기반한 압축 디지털 비디오의 다변 복합디코딩에 관한 방법 및 장치 Download PDF

Info

Publication number
KR20020026243A
KR20020026243A KR1020027001049A KR20027001049A KR20020026243A KR 20020026243 A KR20020026243 A KR 20020026243A KR 1020027001049 A KR1020027001049 A KR 1020027001049A KR 20027001049 A KR20027001049 A KR 20027001049A KR 20020026243 A KR20020026243 A KR 20020026243A
Authority
KR
South Korea
Prior art keywords
zero
idct
block
coefficients
transform
Prior art date
Application number
KR1020027001049A
Other languages
English (en)
Inventor
크리스다 렝웨하사티트
Original Assignee
제임스 씨. 브레일리언
패킷비디오 코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제임스 씨. 브레일리언, 패킷비디오 코퍼레이션 filed Critical 제임스 씨. 브레일리언
Publication of KR20020026243A publication Critical patent/KR20020026243A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Discrete Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

블록에 기인된 동작 보정된 디지털 비디오 디코더에서 역 이산 여현 변환 (IDCT)을 수행하는 방법 및 장치로서, 이는 연산 복잡도는 입력 블록으로부터의 신택스 동작에 종속되며, 결과적인 전체적인 복잡도가 평균적으로 상당히 감소된다. 방법 및 장치는 포괄적인 코딩된 비디오 데이터의 통계에 기인된 간결화된 IDCT 알고리즘(501)의 세트를 선택하기 위한 수단을 제공한다. 입력 IDCT 블록의 분류(507)는 복원 및 역양자화의 부산물로서 얻어지는 마지막의 0이 아닌 계수를 사용한다. 마지막의 0이 아닌 계수를 분리가능한 1 차원 IDCT 알고리즘의 해당되는 세트로 사상하는 것은 메모리 요구, 사상 복잡도 및 간결화딘 IDCT 복잡도의 트레이드오프를 주의깊게 고려하면서 효율적으로 수행되는 것이다.

Description

동작 보정 블록에 기반한 압축 디지털 비디오의 다변 복합 디코딩에 관한 방법 및 장치{METHOD AND DEVICE FOR VARIABLE COMPLEXITY DECODING OF MOTION-COMPENSATED BLOCK-BASED COMPRESSED DIGITAL VIDEO}
금세기의 후반부에 정보 이론의 발전에 따라서, 영상 및 비디오 데이터의 전송이 저 대역 채널을 통한 디지털 형태가 가능하다. 정보 이론은 디지털 비디오를 체계적으로 압축하는 것이 가능하도록 허용되며, 압축된 비트 스트림의 크기가 초기 데이터보다 작으며, 이는 초기 데이터로부터 데이터의 손실을 가져오기도 한다. 압축된 비트 스트림으로부터 비디오 프레임을 복원할 수 있는 임의의 디코더에 대해서 비트 스트림의 형태는 알려져 있어야 한다. 표준화는 비트 스트림을 서로 상이한 디코더에 의해서 정확하게 디코딩할 수 있는 하나의 방법이다. MPEG-1, MPEG-2, MPEG-4, H.261 및 H.263 등과 같은 잘 알려진 디지털 비디오 압축 표준에 있어서, 하이브리드 동작 보정 블록에 기반한 비디오 코딩으로 알려진 압축 기법이 적용되고 있다.
상기의 표준화에 대해서 수행되는 디코더 방법이 다음과 같이 요약할 수 있다. 비디오의 프레임을 일반적으로 8 x 8 픽셀 크기를 갖는 블록으로 명칭된 더욱 작은 단위로 분할한다. 특정 시간에 엔코딩된 각각의 비디오 프레임에 대해서, 각각의 데이터 블록은 비트 스트림으로부터 디코딩된 동작 벡터 및 이전에 디코딩된 비디오 프레임을 사용한 동작 보정을 통하여 현재 블록의 예측점을 검출함으로써 디코딩된다. 따라서, 변환 계수가 현재 블록에 대응되는 압축된 데이터의 부분을 해제하고 역양자화함으로서 얻어진다. 다음에 수행되는 일은 블록 내의 픽셀의 강도 레벨을 표현하는 계수를 얻기 위하여 역 변환을 연산하는 것이다. 결과적인 블록이 첫 단계에서 예측된 블록의 뒤에 첨가되어 새로 재 구성된 블록이 된다. 상기에서 언급한 모든 표준에서, 이산 여현 변환(DCT) 및 역 이산 여현 변환(IDCT)이 변환 계수를 획득하고 역 연산하는 데에 사용된다. 이러한 변환은 효율적인 하드웨어의 구현이 가능하고 압축 효율이 좋기 때문에 사용된다. 더욱이, 2 차 IDCT는 분리 가능한 변환이며, 이는 모든 열 (열에 관련된 IDCT)에 적용된 후 모든 행 (행에 관련된 IDCT)에 적용되어지거나 또는 이와 반대로 적용되는 1 차 IDCT 연산을 반복적으로 수행되는 것이다. 이러한 것은 변환을 구현하는 데에 사용되는 프로그램의 복잡성 및 크기를 감소할 수 있다.
디코더에 대해서, IDCT는 엔코더와 디코더 사이에서의 드리프트를 피하기 위한 정확한 성능을 요구하는 기본적인 부분이다. 이것은 비디오 코딩의 예측 본질의 결과물이다. 변환은 모든 코딩된 블록에서 수행되어야 하며 또한 상당한 양의 수학 연산을 포함하고 있기 때문에 비디오 디코딩 시스템에서 연산적으로 중요한 일 중의 하나로서 고려되어야 한다. 효율적인 방법으로서 DCT 및 IDCT를 연산하는 여러가지 방법이 있다. 이러한 기법들은 과잉된 불필요한 연산을 줄이기 위하여 변환의 삼각함수 특징을 포함한다. 이러한 목적은 입력량, 즉 모든 DCT 계수는 0이 아니다라고 가정함에도 불구하고 복잡성을 최소화할 수 있다. 입력 종속적인 복잡성을 갖는 알고리즘이 또한 알려져 있다. 입력 종속성은 DCT 계수의 입력 블록의 분류를 수행하고 블록의 클래스에 기반된 IDCT에 대해서 요구되는 서로 다른 연산을 적용함으로서 얻을 수 있다. 예를 들면, 블록은 블록 내의 DCT 계수의 모두가 0인 "모두 0" 블록과, (0,0) 번째 DCT 계수가 0이 아닌 DC 블록과, 낮은 4 x 4 DCT 주파수 요소에서 16 개의 계수가 0이 아닌 "4 x 4 DCT"와, 다른 모든 경우에 대한 "8 x 8 DCT"로 분류될 수 있다. 이러한 방법들은 IDCT를 수행하기 전에 DCT 계수의 블록을 분류하기 위한 디코딩된 비트 스트림으로부터의 임의의 정보를 사용하지 않고, 단지 모든 계수들의 값을 직접 검사한다. 이러한 것은 어떠한 경우에에서는 비효율적이다.
낮은 복잡성을 갖는 빠른 비디오 디코딩을 수행하기 위한 효율적인 방법의 결여로 인하여, 역 DCT의 수행의 복잡성을 줄이기 위한 디코딩된 비트 스트림의 특징을 이용할 수 있는 블록에 기반된 비디오 디코더의 성능을 향상시키기 위한 방법 및 장치의 필요성이 존재한다. 이러한 변환은 디코더에서 매우 일반적으로 수행하는 연산이다.
본 발명은 일반적으로 블록에 기반한 압축 디지털 비디오 비트 스트림의 디코딩에 사용되는 역 변환의 입력 종속적인 연산에 관한 것이다.
도 1은 입력 크기 8의 DCT 계수의 벡터와 8개의 공간 도메인 픽셀 값의 출력벡터를 취하여 역 DCT의 고속 구현의 일 예의 블록도를 설명한 것이다.
도 2는 2 차원의 블록 데이터부터 1 차원의 지그재그 스캔 데이터까지의 전형적인 지그재그 스캔 순서를 설명한 것이다.
도 3은 지그재그 순서에서 마지막의 0이 아닌 계수로부터 정확한 2 차원의 역 DCT의 연산을 위하여 요구되어지는 1 차원의 역 DCT 알고리즘의 세트에 사상되는 일 예의 블록도를 설명한 것이다.
도 4는 열과 관련된 IDCT의 입력으로부터 행에 관련된 IDCT의 입력에 대한 0 및 0이 아닌 계수 정보를 추론하는 과정의 다이아그램을 설명한 것이다.
도 5는 블록에 기반된 동작 보정된 디지털 비디오 데이터의 가변 복합적인 역 변환에 기반된 신택스 동작에 대한 방법의 바람직한 실시 예의 플로우 다이아그램을 설명한 것이다.
도 6은 블록에 기반된 동작 보정된 디지털 비디오 데이터의 가변 복합적인 역 변환에 기반된 신택스 동작에 대한 장치의 바람직한 실시 예의 블록도를 설명한 것이다.
본 발명은 가변 복잡성 방법에서 블록에 기반된 동작 보정된 디지털 비디오 디코더에 대한 IDCT를 연산하기 위한 방법 및 장치를 제공한다. 이러한 목적을 위하여, 실시 예에 있어서, 본 발명은 다음의 단계를 포함하는 방법을 제공한다 : 감소된 복잡성 IDCT 알고리즘의 세트(여기에서는 간결화된 IDCT 알고리즘으로 표현한다)를 정의하는 단계와; 간결화된 IDCT 알고리즘의 채택을 결정하기 위한 신택스 동작을 사용하는 단계를 포함한다. 신택스 동작은 복구 과정 중에 압축된 비트 스트림으로부터 지그재그 스캔 방식에 의해서 추출된 마지막 0이 아닌 계수를 정의하기 위한 비트 스트림 요소를 포함한다. 1 차원의 간결화된 IDCT의 세트는 지그재그 순서에 의해서 마지막 (61 - M) 번째 계수 (M의 범위는 1부터 N)는 모두 0이다라는 가정을 기반으로 하여 정의되어 진다. 파라미터 P는 시간의 P%, 마지막 0이 아닌 계수의 위치는 N보다 작거나 같다라는 관계를 통하여 N 을 결정한다. 마지막의 0이 아닌 계수로부터 분리가능한 1 차원의 간결화된 IDCT의 세트에 사상하는 것은 방법의 실시 예에서 룩업 테이블의 함수에 의해서 효율적으로 수행된다. 선택적으로, 사상은 장치 실시 예에서 인터럽트 기반 서브루틴으로 구현된다.
이러한 목적을 위하여, 본 발명의 실시 예에 있어서, 0이 아닌 계수의 수를 사용하여 역 이산 여현 변환을 수행하고 비디오 압축 표준 신택스 동작에 기반된 연관되어진 함수 사상 방법을 제공한다. 방법은 다음의 단계를 포함한다. : 역 이산 여현 변환에 대한 감소된 복잡성의 구현 후보의 세트를 생성하는 단계와; 역 이산 여현 변환에 대해서 0이 아닌 계수의 수를 얻기 위하여 비디오 압축 표준 신택스 동작을 사용하는 단계와; 0이 아닌 계수의 수를 관련된 감소된 복잡성의 구현 후보 역 변환에 사상하는 단계를 포함한다.
실시 예에 있어서, 마지막의 0이 아닌 계수의 인덱스의 통계가 모아지고, 기설정된 값 N이 퍼센트 값의 기 결정된 세트에서 선택된다. 각각의 기 결정된 값 N에 대해서 필요한 1 차원의 간결화된 IDCT의 세트는 기 결정된 순서에서 (64 - M) 번째의 계수가 M에 대해서 0 이라는 기 결정된 가정을 기반으로 하여 생성된다. 여기서, M의 범위는 1부터 N까지이다.
실시 예에 있어서, 압축된 비트 스트림으로부터의 블록의 변환 계수는 디코딩되고, 마지막의 0이 아닌 변환 계수의 위치가 기 결정된 스캔 순서를 고려하지 않고 블록 내에서 결정된다.
실시 예에 있어서, 효율적인 룩업 테이블은 마지막의 0이 아닌 변환 계수의 인덱스를 간결화된 IDCT의 관련된 세트에 사상됨으로서 생성된다. 사상은 마지막의 0이 아닌 DCT 인덱스부터 효율적인 룩업 테이블을 사용한 간결화된 IDCT의 관련된 세트까지 제공된다.
본 발명의 또 다른 실시 예에 있어서, 0이 아닌 계수의 수를 사용하여 역 이산 여현 변환을 수행하고 비디오 압축 표준 신택스 동작에 기반된 연관되어진 함수 사상 장치를 제공한다. 장치는 역 이산 여현 변환에 대한 복잡성의 구현 후보의 세트를 생성하는 수단이다. 수단은 역 이산 여현 변환에 대한 0이 아닌 계수의 수를 얻기 위한 신택스 동작의 사용을 제공한다. 0이 아닌 계수의 수를 역 변환의 관련된 감소된 복잡성의 구현 후보에 사상하기 위한 수단이 또한 제공된다.
실시 예에 있어서, 수단은 마지막의 0이 아닌 계수의 인덱스의 통계의 수집 및 기 결정된 퍼센트 값의 세트로부터 기 결정된 값 N의 선택을 제공한다. 각각의 기 결정된 값 N에 대해서 필요한 1 차원의 간결화된 IDCT의 세트는 기 결정된 순서에서 (64 - M) 번째의 계수가 M에 대해서 0 이라는 기 결정된 가정을 기반으로 하여 생성되는 수단이 또한 제공된다, 여기서, M의 범위는 1부터 N까지이다.
실시 예에 있어서, 압축된 비트 스트림으로부터 특정 블록의 변환 계수를 디코딩하기 위한 수단이 제공된다. 또한, 기 결정된 스캔 순서를 고려하지 않고 블록 내에서 마지막의 0이 아닌 변환 계수의 위치를 결정하기 위한 수단이 제공된다.
실시 예에 있어서, 마지막의 0이 아닌 변환 계수의 인덱스를 간결화된 IDCT의 관련된 세트에 사상하는 것을 사용한 효율적인 룩업 테이블을 생성하는 수단을 제공한다. 마지막의 0이 아닌 DCT 인덱스로부터 간결화된 IDCT의 관련된 세트에 사상하는 수단이 또한 제공된다.
따라서, 고속의 비디오 디코딩을 수행하는 장치 및 방법을 제공하는 것이 본 발명의 장점이다.
또 다른 장점은 낮은 복잡성으로 고속의 비디오 디코딩을 수행하는 장치 및 방법을 제공한다는 것이다.
본 발명의 또 다른 장점은 블록에 기반된 동작 보정된 디지털 비디오 디코더에 대한 IDCT의 가변적인 복합적인 방법으로 연산을 수행하는 장치 및 방법을 제공하는 것이다.
본 발명의 부가적인 특징 및 장점은 바람직한 실시 예 및 도면으로부터 설명되어지고 명백하게 될 것이다.
본 발명은 도 1 내지 도 6을 참조하여 더욱 상세하게 설명된다. 본 발명은 아래에 상세하게 설명되는 것에 부가하여 임의의 고속의 구현에 기반된 임의의 선형 변환에 적용될 수 있다.
도 1에 따라서, 고속 IDCT 플로우 다이아그램의 일 예(100)가 입력(101)으로서 DCT 벡터의 계수 및 역 변환의 출력 벡터(102)를 취하는 것을 보여준다. 이러한특별한 예제에서, 유리수의 곱셈이 연산(103, 104, 105 및 106)으로 요구되며, 여기서 "C4"는 상수 1/√2와의 곱을 표현하고, "Rot Q" 는 입력 X 및 Y를 새로운 표현식 x 및 y, 즉, x = Xcos(Q) + Ysin(Q), y = -Xsin(Q) + Ycos(Q)를 생성하기 위하여 각 Q에 의해서 회전하는 것을 표현한다.
입력 벡터의 임의의 점들이 0이면, 이러한 0의 입력에 대해서 배타적으로 적용되어지는 연산은 제거될 수 있다. 즉, X1 및 X7 둘 다가 0이면, 연산 104의 결과가 0이 되기 때문에 연산 104는 필요가 없다. 따라서, 0의 입력 점의 정보를 알고 있으면, IDCT 알고리즘은 간소화된 알고리즘으로 간결화될 수 있다. 크기 8의 입력 벡터에서 0 및 0이 아닌 입력 점의 조합의 모두에 대해서 256 개의 간결화된 IDCT 알고리즘을 유도하는 것이 가능하다. 이론적으로, 입력 벡터는 간결화된 IDCT가 적용할 수 있도록 테스팅된다. IDCT 복잡성이 최소화가 되었다고 단언할지라도, 메모리 요구에 있어서, 모든 256개의 간결화된 IDCT 알고리즘은 메모리 내에 저장하여야 한다. 이러한 것은 메모리 액세스 시간을 증가시키고, 결론적으로 전체적인 연산 시간을 증가시키게 된다.
본 발명은 상기에서 설명된 메모리 요구를 나타낸 것이다. 메모리의 제한을 갖고서, IDCT 복잡성의 감소는 2 차원 블록의 DCT 계수의 통계를 취함으로서 최대화할 수 있다. 이러한 통계가 빈번하게 사용되는 간결화된 IDCT 알고리즘의 서브세트를 선택하기 위하여 1 차원 벡터의 열 또는 행의 통계대신에 사용되어 진다. 이러한 것은 메모리 할당 가격 및 메모리 액세스 시간를 감소한다. 즉, 고속의 테스팅 방법이 간결화된 IDCT 알고리즘이 특정 블록을 위하여 사용될 수 있도록 결정하기 위하여 분류화되는 데에 사용된다. 또한 본 발명은 지그재그 스캐닝에 기반을 둔 엔코딩된 비트 스트림으로부터 신택스 동작을 사용한다.
도 2에서, 8 x 8 블록(200)이 표현되어 있으며, 8 x 8블록의 각각의 위치에서 수는 블록이 스캔되어진 순서를 나타낸다. 지그재그 스캐닝은 더욱 효율적인 압축 처리를 위하여 2 차원의 DCT 블록을 1 차원의 DCT 벡터로 변환한다. 지그재그 스캔 후, 0이 아닌 DCT 계수는 초기에는 촘촘하게 발생되고, 스캔의 마지막에서는 희박하게 발생되며, 이는 더욱 효율성이 좋은 압축이 된다. 본 발명은 지그재그 스캔에서의 마지막 0이 아닌 DCT 계수에 관한 정보의 장점을 취하며, 이러한 파라미터는 항상 복원 과정으로부터 획득하게 된다.
특히, 본 발명은 적절한 N을 찾는 것이며, 이는 마지막의 0이 아닌 계수의 위치를 나타내며, 또한 마지막의 0이 아닌 계수의 시간의 P%는 0과 N 사이의 위치에서 발생된다. 따라서, 간결한 IDCT 알고리즘의 세트는 지그재그 순서에서 최초의 M 계수가 0이 아닌 경우를 위하여 설계된다. 여기서, M = 1, 2, ..., N이다. 지그재그 순서에서 0이 아닌 범위를 2 차원 블록에서의 적절한 위치로 변환함으로써, 분리 가능한 간결한 IDCT 알고리즘의 세트는 M의 각각의 값에 대해서 결정된다. 마지막의 0이 아닌 위치가 N보다 크다면, 모든 64 개의 DCT 계수는 0이 아닌 것으로 가정되며, 이에 따라서 IDCT의 완전한 버전이 적용될 것이다. 마지막의 0이 아닌 위치가 M이라고 할지라도, 이전의 DCT 계수의 모든 것이 도한 0이 아닌 경우는 항상 아니다. 그러나, 메모리 요구 및 테스팅 복잡도의 낮게하는 것의 이유로 인하여, 본 발명은 이전의 모든 계수는 또한 0이 아니다라고 가정한다.
도 3은 본 발명의 방법의 일 례(300)를 설명한 것이다.이러한 일 례(300)에서, 블록(301)에서의 마지막의 0이 아닌 계수의 인덱스는 10으로 결정된다. 10번째 계수 이전의 모든 계수가 또한 0이 아닌 것으로 가정됨으로써, 1 차원의 열에 관련된 및 행에 관련된 간결화된 IDCT는 DCT 블록의 각각의 열 및 행에 관련된 IDCT의 입력이 되는 열에 관련된 IDCT 후의 중간 결과의 각각의 행에 대해서 결정될 수 있다. 최초의 4 개의 열에 대해서, 간결한 IDCT의 idctrow0xF0(302), idctrow0xE0(303), idctrow0xC0(304) 및 idctrow0x80(305)는 각각 1 번째, 2 번째, 3 번째, 4 번째에 적용된다. 여기서, idctrow0xST에서의 수 S 및 T는 16진수를 나타낸다. 이러한 숫자들이 2 진수를 형성하기 위하여 결합되어 질 경우에 i 번째 디지트 ('1' 또는 '0')의 내용은 '0이 아닌 값' 또는 '0'으로서의 입력 벡터에서 i 번째 DCT 계수를 나타낸다. 5 번째부터 8 번째 열에 대해서, 간결한 IDCT의 idctrow0x0(306)이 적용되며, 이는 모든 입력은 0이다라는 것을 가정한다. 모든 행에 대해서, 간결한 IDCT의 idctcol0xF0(307)이 적용된다.
idctcol0xF0(302)가 이 예제에서 선택된 이유는 열에 관련된 IDCT 후에, 최소한 한 개의 입력 점이 0이 아니면 모든 출력 점은 거의 0이 아니다라는 사실에 기인한다. 이것은 행에 관련된 IDCT에 대한 입력 형태의 예측을 유도한다. 도 4는 열에 관련된 IDCT의 입력의 정보에 기인되어 행에 관련된 IDCT에 대한 입력의 예측을 설명한 것이다. 도 4에서, 입력 블록(401)의 0이 아닌 계수의 다이아그램(400)은 'x'로써 표기되어 있다. 각각의 열(402)에 1 차원의 열에 관련된 ICT를 적용한 후에, 출력 블록(403)의 0이 아닌 계수가 생성된다. 이렇게 생성된 정보는 행에 관련된 IDCT의 입력 블록(401)에서 사용된다.
이러한 점에서, 최초의 M 계수는 모두 0이 아니다라는 가정은 약간의 간결화된 1 차원의 IDCT를 위한 더욱 작은 메모리를 허용하는 사실에 의해서 정당화될 수 있다. M의 각각의 값에 대한 간결화된 IDCT의 조합이 많이 존재할 수 있다. M으로부터 간결화된 IDCT의 적절한 세트로의 사상은 각각의 열 및 행에 대한 간결화된 IDCT의 세트의 포인터를 포함하는 룩업 테이블에 의해서 효율적으로 수행될 수 있다.
본 발명의 방법의 바람직한 일 실시 예는 도 5에 의해서 상세하게 설명된다. 도 5는 8 x 8 블록을 형성한 압축된 비트 스트림의 디코딩에 대한 역 이산 여현 변환을 연산하는 방법의 플로우차트(500)를 설명한 것이다. 먼저, 501 단계에서, 마지막의 0이 아닌 인덱스의 통계가 훈련된 데이터로부터 수집된다. 다음으로, 값 N이 선택되며, 이 값은 블록의 P%는 N 보다 작거나 같은 마지막의 0이 아닌 위치를 갖는다. P는 메모리 요구에 기인해서 기 결정된 파라미터이다. 더욱 작은 P는 더욱 큰 메모리 제한을 의미한다. 502에서 수 N으로부터 1 차원의 간결화된 IDCT의 세트가 유도되고 503 단계에서 메모리에 저장된다. 이러한 간결화된 IDCT 알고리즘은 N 보다 크지 않은 마지막의 0이 아닌 계수를 갖는 어떠한 경우에 대해서도 필요하다. 또한, 알고리즘은 지그재그 순서에서 마지막의 0이 아닌 계수의 이전의 계수들도 모두 0이 아니다라고 가정한다.
값 N 및 해당되는 간결화된 IDCT 알고리즘의 세트를 획득한 후에, 블록에 기반된 압축된 비디오 데이터의 디코딩은 다음과 같이 수행된다. 504 단계에서 디코딩된 블록에 해당되는 입력 비트 스트림은 DCT 계수를 획득하기 위하여 단계 505에서 지그재그 스캔 순서에서 복원된다. 부차적인 결과로서, 마지막의 0이 아닌 위치(506)가 또한 얻어진다. 마지막의 0이 아닌 위치는 N 보다 작거나 같으면, 분류 작업이 마지막의 0이 아닌 위치를 1 차원의 간결화된 IDCT 알고리즘의 부분 세트에 사상함으로서 단계 507에 보인 것처럼 수행되며, 이는 단계 508에서 보인 바와 같이, 단계 503에서 선택되고 이러한 특별한 블록의 각각의 열 및 행을 위해서 요구된다. 반면에, 마지막의 0이 아닌 위치가 N보다 크면, 단계 509에서, 도 1에서 상세하게 설명된 바와 같은 고속의 임의의 알고리즘과 같은 기본적인 IDCT 알고리즘이 적용된다. 단계 508 또는 단계 509을 수행한 후에, 단계 510에 보인 바와 같이 역 변환인 출력 블록이 최종적으로 얻어진다.
본 발명의 또 다른 바람직한 실시 예가 도 6에 도시된 장치이다. 여기서, 간결화된 IDCT는 인터럽트 기반인 방법에서 수행된다. 도 6은 8 x 8 블록을 형성하는 압축된 비트 스트림의 디코딩을 위한 역 이산 여현 변환을 연산하기 위한 수단을 포함하는 장치(600)를 설명한 것이다. 장치(600)는 메모리 모듈(611)과 고속의 역 변환 모듈(610)을 구비한다. 모듈 610 및 611의 외부에는, 마지막의 0이 아닌 계수의 인덱스의 통계가 훈련된 데이터로부터 수집되고, 값 N이 블록의 P%가 N보다 작거나 같은 마지막 0이 아닌 위치를 갖기 위하여 계산된다. P는 사용 가능한 메모리의 함수로서 선택된 메모리 내에 저장된 기 결정된 값이다. 더욱 작은 P는 더욱 큰 메모리 제한을 의미한다. 602에서 식별된 수 N으로부터, 1 차원의 간결화된 IDCT 모듈의 세트가 유도되며, 모듈 603 내의 메모리에 저장된다. 이러한 간결화된 IDCT모듈(603)은 N 보다 크지 않은 마지막의 0이 아닌 계수를 갖는 경우에도 필요하다.
값 N 및 해당되는 간결한 IDCT 모듈(603)이 구현된 후, 블록에 기반된 압축된 비디어 데이터의 디코딩이 구현된다. 디코딩되어진 블록에 해당되는 입력 비트스트림(604)이 DCT 계수의 세트를 얻기위하여 모듈(605)에서 복원된다. 부산물로서, 지그재그 순서에서 마지막의 0이 아닌 위치, 이는 606으로 명기되어 있다, 또한 획득되어지고 다음 모듈로 넘겨진다. 분류 모듈(607)에서, 마지막 0이 아닌 위치가 N 보다 작거나 같으면 인터럽트 시퀀스가 이러한 특별한 블록에 대하여 필요한 1 차원의 간결한 IDCT 모듈의 시퀀스를 호출하기 위하여 마지막의 0이 아닌 위치에 기인되어 생성된다. 마지막의 0이 아닌 위치가 N보다 크면, 기본적인 IDCT 모듈(608)이 적용된다. 마지막으로, 역 변환인 출력 블록(609)이 얻어진다. IDCT의 특별한 경우인 변환 계수의 블록에서 수행하기 위하여 역 선형 변환을 요구하는 임의의 디코더에서, 본 발명이 사용될 수 있다. 또한, 본 발명은 지그재그 스캔의 특별한 경우인 임의의 2-1 차원 스캔 순서에서 마지막의 0이 아닌 계수 위치에 관련된 정보의 액세스를 요구한다.
비록 상기에서 실시예를 나열하여 설명하였다고 하더라도, 본 발명에서 벗어나지 않으면서 신택스 동작을 기초로 한 역 이산 여현 변환(IDCT) 연산을 수행하는 방법과 장치를 변형하거나 치환하는 것은 본 발명이 속하는 기술분야에서는 자명한 것이다. 따라서, 다음의 청구항에 기술된 본 발명의 개념과 범위에 속하는 변형이나 치환은 모두 본 발명에 포함된다.

Claims (8)

  1. 역 이산 여현 변환에 대한 감소된 복잡성의 구현 후보의 세트를 생성하는 단계와;
    역 이산 여현 변환에 대해서 0이 아닌 계수의 수를 얻기 위하여 비디오 압축 표준 신택스 동작을 사용하는 단계와;
    0이 아닌 계수의 수를 해당되는 감소된 복잡성의 구현 후보 역 변환에 사상하는 단계를 포함하는 것을 특징으로 하는 0이 아닌 계수의 수를 사용함으로서 역 이산 여현 변환 연산의 수행 및 비디오 압축 표준 신택스 동작에 기인된 적절한 함수 사상 방법.
  2. 제 1 항에 있어서, 부가적으로,
    마지막의 0이 아닌 계수의 인덱스의 통계를 수집하고 기 결정된 퍼센트 값의 시트로부터 기 결정된 값 N을 선택하는 단계와;
    각각의 기 결정된 값 N에 대해서 필요로하는 1 차원의 간결화된 IDCT의 세트를 생성하며, 이는 기 결정된 순서에서의 (64 - M) 계수는 M에 대해서 0이고, M의 범위는 1부터 N까지인 것을 미리 가정하는 단계를 포함하는 것을 특징으로 하는 방법.
  3. 제 1 항에 있어서, 부가적으로,
    압축된 비트 스트림으로부터 블록의 변환 계수를 디코딩하는 단계와;
    기 결정된 스캔 순서에 관련되어 블록내에서 마지막의 0이 아닌 변환 계수의 위치를 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
  4. 제 1 항에 있어서, 부가적으로,
    마지막의 0이 아닌 변환 계수의 인덱스를 간결화된 IDCT의 적절한 세트에 사상하기 위하여 효율적인 룩업 테이블을 생성하는 단계와;
    마지막의 0이 아닌 DCT 인덱스를 효율적인 룩업 테이블을 사용하여 간결화된 IDCT의 적절한 세트에 사상하는 단계를 포함하는 것을 특징으로 하는 방법.
  5. 역 이산 여현 변환에 대한 감소된 복잡성의 구현 후보의 세트를 생성하는 수단과;
    역 이산 여현 변환에 대해서 0이 아닌 계수의 수를 얻기 위하여 비디오 압축 표준 신택스 동작을 사용하는 수단과;
    0이 아닌 계수의 수를 해당되는 감소된 복잡성의 구현 후보 역 변환에 사상하는 수단을 포함하는 것을 특징으로 하는 0이 아닌 계수의 수를 사용함으로서 역 이산 여현 변환 연산의 수행 및 비디오 압축 표준 신택스 동작에 기인된 적절한 함수 사상 장치.
  6. 제 5 항에 있어서, 부가적으로,
    마지막의 0이 아닌 계수의 인덱스의 통계를 수집하고 기 결정된 퍼센트 값의 시트로부터 기 결정된 값 N을 선택하는 수단과;
    각각의 기 결정된 값 N에 대해서 필요로하는 1 차원의 간결화된 IDCT의 세트를 생성하며, 이는 기 결정된 순서에서의 (64 - M) 계수는 M에 대해서 0이고, M의 범위는 1부터 N까지인 것을 미리 가정하는 수단을 포함하는 것을 특징으로 하는 장치.
  7. 제 5 항에 있어서, 부가적으로,
    압축된 비트 스트림으로부터 블록의 변환 계수를 디코딩하는 수단과;
    기 결정된 스캔 순서에 관련되어 블록내에서 마지막의 0이 아닌 변환 계수의 위치를 결정하는 수단을 포함하는 것을 특징으로 하는 장치.
  8. 제 5 항에 있어서, 부가적으로,
    마지막의 0이 아닌 변환 계수의 인덱스를 간결화된 IDCT의 적절한 세트에 사상하기 위하여 효율적인 룩업 테이블을 생성하는 수단과;
    마지막의 0이 아닌 DCT 인덱스를 효율적인 룩업 테이블을 사용하여 간결화된 IDCT의 적절한 세트에 사상하는 수단을 포함하는 것을 특징으로 하는 장치.
KR1020027001049A 1999-08-12 2000-08-04 동작 보정 블록에 기반한 압축 디지털 비디오의 다변 복합디코딩에 관한 방법 및 장치 KR20020026243A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/373,150 1999-08-12
US09/373,150 US6167092A (en) 1999-08-12 1999-08-12 Method and device for variable complexity decoding of motion-compensated block-based compressed digital video
PCT/US2000/021364 WO2001013648A1 (en) 1999-08-12 2000-08-04 Method and device for variable complexity decoding of motion-compensated block-based compressed digital video

Publications (1)

Publication Number Publication Date
KR20020026243A true KR20020026243A (ko) 2002-04-06

Family

ID=23471194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027001049A KR20020026243A (ko) 1999-08-12 2000-08-04 동작 보정 블록에 기반한 압축 디지털 비디오의 다변 복합디코딩에 관한 방법 및 장치

Country Status (5)

Country Link
US (1) US6167092A (ko)
EP (1) EP1203494A1 (ko)
JP (1) JP2003507804A (ko)
KR (1) KR20020026243A (ko)
WO (1) WO2001013648A1 (ko)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421695B1 (en) * 1995-10-28 2002-07-16 Lg Electronics Inc. Apparatus for implementing inverse discrete cosine transform in digital image processing system
KR100275933B1 (ko) * 1998-07-14 2000-12-15 구자홍 엠펙디코더의 역이산여현변환장치
US6675185B1 (en) * 2000-06-07 2004-01-06 International Business Machines Corporation Hybrid domain processing of multi-dimensional transformed data
US8583027B2 (en) 2000-10-26 2013-11-12 Front Row Technologies, Llc Methods and systems for authorizing computing devices for receipt of venue-based data based on the location of a user
US7149549B1 (en) 2000-10-26 2006-12-12 Ortiz Luis M Providing multiple perspectives for a venue activity through an electronic hand held device
US7782363B2 (en) 2000-06-27 2010-08-24 Front Row Technologies, Llc Providing multiple video perspectives of activities through a data network to a remote multimedia server for selective display by remote viewing audiences
US7796162B2 (en) 2000-10-26 2010-09-14 Front Row Technologies, Llc Providing multiple synchronized camera views for broadcast from a live venue activity to remote viewers
US7812856B2 (en) 2000-10-26 2010-10-12 Front Row Technologies, Llc Providing multiple perspectives of a venue activity to electronic wireless hand held devices
US7630721B2 (en) 2000-06-27 2009-12-08 Ortiz & Associates Consulting, Llc Systems, methods and apparatuses for brokering data between wireless devices and data rendering devices
US6799192B1 (en) * 2001-01-09 2004-09-28 Apple Computer, Inc. Method and apparatus for inverse discrete cosine transform
CN1237465C (zh) * 2001-01-10 2006-01-18 皇家菲利浦电子有限公司 编码
US7020672B2 (en) * 2001-03-30 2006-03-28 Koninklijke Philips Electronics, N.V. Reduced complexity IDCT decoding with graceful degradation
US7096245B2 (en) * 2002-04-01 2006-08-22 Broadcom Corporation Inverse discrete cosine transform supporting multiple decoding processes
EP1376379A3 (en) * 2002-04-01 2004-08-11 Broadcom Corporation Apparatus and method to perform an inverse discrete cosine transform for multiple decoding processes
US20030202603A1 (en) * 2002-04-12 2003-10-30 William Chen Method and apparatus for fast inverse motion compensation using factorization and integer approximation
US7190724B2 (en) * 2002-04-12 2007-03-13 Seiko Epson Corporation Method and apparatus for transform domain video processing
DE10218812A1 (de) * 2002-04-26 2003-11-20 Siemens Ag Generische Datenstrombeschreibung
US7233703B2 (en) * 2003-03-25 2007-06-19 Sharp Laboratories Of America, Inc. Computation-reduced IDCT method for video coding
US8423597B1 (en) * 2003-08-29 2013-04-16 Nvidia Corporation Method and system for adaptive matrix trimming in an inverse discrete cosine transform (IDCT) operation
GB0324369D0 (en) * 2003-10-18 2003-11-19 Koninkl Philips Electronics Nv Method and apparatus for calculating an inverse DCT
US7587093B2 (en) * 2004-07-07 2009-09-08 Mediatek Inc. Method and apparatus for implementing DCT/IDCT based video/image processing
US20060080375A1 (en) * 2004-10-12 2006-04-13 Lee Kun-Bin Method and apparatus for inverse discrete cosine transform implementation
CN101218579B (zh) * 2005-07-11 2012-12-19 派克维迪奥公司 转移数据的系统和方法
US7676591B2 (en) * 2005-09-22 2010-03-09 Packet Video Corporation System and method for transferring multiple data channels
WO2007047560A2 (en) * 2005-10-18 2007-04-26 Packetvideo Corp. System and method for controlling and/or managing metadata of multimedia
EP1952268A4 (en) * 2005-11-04 2012-01-04 Univ Singapore METHOD AND SYSTEM FOR DETERMINING PRE-ARRANGED NUMBERS OF PROCESSOR CYCLES REQUIRED FOR ANY SEGMENTS OF A MEDIA FILE FOR PLAYING THE MEDIA FILE
US7900818B2 (en) * 2005-11-14 2011-03-08 Packetvideo Corp. System and method for accessing electronic program guide information and media content from multiple locations using mobile devices
EP1982485B1 (en) * 2006-02-10 2019-07-24 III Holdings 2, LLC System and method for connecting mobile devices
US7493106B2 (en) * 2006-03-17 2009-02-17 Packet Video Corp. System and method for delivering media content based on a subscription
US8161111B2 (en) * 2006-03-27 2012-04-17 Packet Video, Corp System and method for identifying common media content
US20070245399A1 (en) * 2006-03-27 2007-10-18 Joel Espelien System and method for assessing electronic program guide information
US8874645B2 (en) * 2006-03-28 2014-10-28 Packetvideo Corp. System and method for sharing an experience with media content between multiple devices
WO2007112111A2 (en) * 2006-03-29 2007-10-04 Packetvideo Corp. System and method for securing content ratings
US7966509B2 (en) * 2006-05-30 2011-06-21 Nvidia Corporation System and method for performing low power dynamic trimming
US8385424B2 (en) * 2006-06-26 2013-02-26 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform
US8571340B2 (en) * 2006-06-26 2013-10-29 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US20080037489A1 (en) * 2006-08-10 2008-02-14 Ahmed Adil Yitiz System and method for intelligent media recording and playback on a mobile device
WO2008021091A2 (en) * 2006-08-11 2008-02-21 Packetvideo Corp. 'system and method for delivering interactive audiovisual experiences to portable devices'
US20080090590A1 (en) * 2006-10-12 2008-04-17 Joel Espelien System and method for creating multimedia rendezvous points for mobile devices
US8300698B2 (en) * 2006-10-23 2012-10-30 Qualcomm Incorporated Signalling of maximum dynamic range of inverse discrete cosine transform
US20090052380A1 (en) * 2007-08-21 2009-02-26 Joel Espelien Mobile media router and method for using same
US20090070344A1 (en) * 2007-09-11 2009-03-12 Joel Espelien System and method for virtual storage for media service on a portable device
US8095153B2 (en) * 2007-12-12 2012-01-10 Packet Video Corporation System and method for generating a recommendation on a mobile device
US9497583B2 (en) 2007-12-12 2016-11-15 Iii Holdings 2, Llc System and method for generating a recommendation on a mobile device
EP2235620A4 (en) * 2007-12-12 2012-06-27 Packetvideo Corp SYSTEM AND METHOD FOR PRODUCING METADATA
WO2009114111A2 (en) 2008-03-12 2009-09-17 Packetvideo Corp. System and method for reformatting digital broadcast multimedia for a mobile device
WO2009123694A2 (en) * 2008-03-31 2009-10-08 Packetvideo Corp. System and method for managing, controlling and/or rendering media in a network
US8544046B2 (en) * 2008-10-09 2013-09-24 Packetvideo Corporation System and method for controlling media rendering in a network using a mobile device
US11647243B2 (en) 2009-06-26 2023-05-09 Seagate Technology Llc System and method for using an application on a mobile device to transfer internet media content
US9195775B2 (en) 2009-06-26 2015-11-24 Iii Holdings 2, Llc System and method for managing and/or rendering internet multimedia content in a network
EP2473927A4 (en) * 2009-09-04 2016-05-11 Iii Holdings 2 Llc SYSTEM AND METHOD FOR MANAGING INTERNET MULTIMEDIA CONTENT
JP2012039590A (ja) * 2010-07-16 2012-02-23 Sony Corp 画像処理装置、画像処理方法、及びプログラム
WO2012109568A1 (en) 2011-02-11 2012-08-16 Packetvideo Corporation System and method for using an application on a mobile device to transfer internet media content
US8798777B2 (en) 2011-03-08 2014-08-05 Packetvideo Corporation System and method for using a list of audio media to create a list of audiovisual media
US9747255B2 (en) * 2011-05-13 2017-08-29 Texas Instruments Incorporated Inverse transformation using pruning for video coding
TWI580264B (zh) * 2011-11-10 2017-04-21 Sony Corp Image processing apparatus and method
US9798698B2 (en) 2012-08-13 2017-10-24 Nvidia Corporation System and method for multi-color dilu preconditioner
KR102250088B1 (ko) * 2013-10-24 2021-05-10 삼성전자주식회사 비디오 스트림을 복호화하는 방법 및 장치
CN106550267B (zh) * 2016-11-25 2019-03-29 广州酷狗计算机科技有限公司 多媒体信息解码方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5394349A (en) * 1992-07-10 1995-02-28 Xing Technology Corporation Fast inverse discrete transform using subwords for decompression of information
US5614952A (en) * 1994-10-11 1997-03-25 Hitachi America, Ltd. Digital video decoder for decoding digital high definition and/or digital standard definition television signals
US5452466A (en) * 1993-05-11 1995-09-19 Teknekron Communications Systems, Inc. Method and apparatus for preforming DCT and IDCT transforms on data signals with a preprocessor, a post-processor, and a controllable shuffle-exchange unit connected between the pre-processor and post-processor
US5990958A (en) * 1997-06-17 1999-11-23 National Semiconductor Corporation Apparatus and method for MPEG video decompression

Also Published As

Publication number Publication date
WO2001013648A1 (en) 2001-02-22
JP2003507804A (ja) 2003-02-25
US6167092A (en) 2000-12-26
EP1203494A1 (en) 2002-05-08

Similar Documents

Publication Publication Date Title
KR20020026243A (ko) 동작 보정 블록에 기반한 압축 디지털 비디오의 다변 복합디코딩에 관한 방법 및 장치
JP4425561B2 (ja) イメージおよびビデオ符号化のための2−d変換
US20130195177A1 (en) Method and device for the transformation and method and device for the reverse transformation of images
US20140010284A1 (en) Image transform and inverse transform method, and image encoding and decoding device using same
CN1697328B (zh) 快速视频编解码变换实现
US7519117B2 (en) Inter-frame predicted image synthesizing method
CA2633897C (en) Transforms with common factors
US10382789B2 (en) Systems and methods for digital media compression and recompression
CN1596422A (zh) 用于估算压缩视频数据客观质量的方法和系统
CN1922890B (zh) 分段可逆视频编码、译码方法及装置
KR20120098499A (ko) 영상의 변환 방법 및 장치, 및 영상의 역변환 방법 및 장치
KR101480412B1 (ko) 영상의 변환 방법 및 장치, 역변환 방법 및 장치
KR20010083718A (ko) 영상 압축 부호화를 위한 변환 및 역변환 방법 및 장치
CN1315023A (zh) 在图像处理期间执行二维变换的电路和方法
US20040057518A1 (en) Compression of motion vectors
CN1848960B (zh) 使用非标准化矢量量化编码器的符合视频标准的残差编码
JPH09261660A (ja) 輪郭線符号化方法及び輪郭線符号化装置
AU2001293994A1 (en) Compression of motion vectors
CN1625266A (zh) 计算绝对差值的设备、运动估计设备和运动图像编码设备
US20050196055A1 (en) Method and system for codifying signals that ensure high fidelity reconstruction
JP4730144B2 (ja) 復号化装置、逆量子化方法及びこれらのプログラム
US7706440B2 (en) Method for reducing bit rate requirements for encoding multimedia data
JPH0918350A (ja) 符号化復号化装置及び符号化復号化方法
Tiwari et al. A comparative study on image and video compression techniques
JPH0946709A (ja) 画像符号化装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid