KR20110093811A - 동화상 복호 방법, 동화상 부호화 방법, 동화상 복호 장치, 동화상 부호화 장치, 프로그램, 및 집적 회로 - Google Patents

동화상 복호 방법, 동화상 부호화 방법, 동화상 복호 장치, 동화상 부호화 장치, 프로그램, 및 집적 회로 Download PDF

Info

Publication number
KR20110093811A
KR20110093811A KR1020117011901A KR20117011901A KR20110093811A KR 20110093811 A KR20110093811 A KR 20110093811A KR 1020117011901 A KR1020117011901 A KR 1020117011901A KR 20117011901 A KR20117011901 A KR 20117011901A KR 20110093811 A KR20110093811 A KR 20110093811A
Authority
KR
South Korea
Prior art keywords
signal
filter
frequency domain
video
prediction
Prior art date
Application number
KR1020117011901A
Other languages
English (en)
Inventor
마티아스 나로쉬케
파울린 메리
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20110093811A publication Critical patent/KR20110093811A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

동화상 복호 방법은, 부호화 신호 및 필터 정보를 취득하는 단계와, 부호화 신호를 복호하여 복호 신호를 생성하는 단계(S21)와, 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 필터 처리를, 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 단계(S22)를 포함한다. 그리고, 필터 정보는, 주파수 영역의 상기 동화상 신호와, 필터 처리가 적용된 후의 주파수 영역의 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함한다.

Description

동화상 복호 방법, 동화상 부호화 방법, 동화상 복호 장치, 동화상 부호화 방법, 프로그램, 및 집적 회로{METHOD FOR DECODING MOVING IMAGES, METHOD FOR ENCODING MOVING IMAGES, MOVING IMAGE DECODER, MOVING IMAGE ENCODER, PROGRAM AND INTEGRATED CIRCUIT}
본 발명은, 동화상 신호를 필터링하기 위한 필터를 이용하여 동화상을 부호화 및 복호하는 방법 및 장치에 관한 것이다.
현재, 표준적인 동화상 부호화 알고리즘의 대다수는 하이브리드 동화상 부호화에 의거하는 것이다. 전형적으로는, 하이브리드 동화상 부호화 방법은, 원하는 압축 성과를 달성하기 위해서, 각각 다른 로스가 생기지 않는 압축 방식과 로스가 생기는 압축 방식을 조합시킨 것이다. 하이브리드 동화상 부호화는, ISO/IEC 표준 규격(MPEG-1, MPEG-2, MPEG-4와 같은 MPEG-X 표준 규격)과 마찬가지로, ITU-T 표준 규격(H.261이나 H.263과 같은 H.26×표준 규격)의 기초이기도 하다. 최신 동화상 부호화 표준 규격은, H.264/MPEG-4 Advanced Video Coding(AVC)으로 칭해지는 것이다. 이는, 죠인트 비디오 팀(JVT) 및 ITU-T와 ISO/IEC MPEG 그룹의 죠인트 팀에 의한 표준화 활동의 성과이다.
인코더에 입력되는 동화상 신호는, 프레임(또는 픽처)으로 불리는 화상의 시퀀스이며, 각 프레임은 2차원 매트릭스의 화소로 이루어진다. 하이브리드 동화상 부호화에 의거하는 상술의 표준 규격의 전체에 있어서, 각각의 동화상 프레임은 복수의 화소로 이루어지는 소블록으로 세분화된다. 전형적으로는, 매크로 블록(통상은 16×16화소 블록을 의미한다)이 기본적인 화상 엘리먼트이며, 이에 대하여 부호화가 행해진다. 그러나, 보다 작은 화상 엘리먼트에 대하여 다양한 특정의 부호화 단계가 행해지는 경우가 있다. 예를 들면, 8×8, 4×4, 16×8 등의 사이즈의 서브 매크로 블록이나 간단한 블록을 들 수 있다.
전형적으로는, 하이브리드 동화상 부호화에 있어서의 부호화 단계에는, 공간적 및/또는 시간적 예측이 포함된다. 따라서, 각 부호화 대상 블록은, 우선, 이미 부호화된 동화상 프레임으로부터 공간적으로 인접한 블록인지 시간적으로 인접한 블록인지를 이용하여 예측된다. 부호화 대상 블록과 예측 잔차로도 불리는 예측 결과의 차분 블록이, 다음에 구해진다. 다음의 부호화 단계에서는, 잔차 블록이 공간(화소) 영역으로부터 주파수 영역으로 변환된다. 변환의 목적은, 입력 블록의 장황성을 삭감하는 것이다. 다음의 부호화 단계에 있어서, 변환 계수가 양자화된다. 이 단계에 있어서, 실질적으로 로스가 생기는 (불가역적인) 압축이 행해진다. 통상, 압축 변환계 수치는, 엔트로피 부호화에 의해(로스를 발생시키지 않고) 더욱 압축된다. 또한, 부호화 동화상 신호를 재구축하기 위해서 필요한 보조 정보가 부호화되어, 부호화 동화상 신호와 함께 제공된다. 이 정보는, 예를 들면, 공간적 및/또는 시간적 예측이나 양자화량에 관한 것이다.
도 1은, H.264/MPEG AVC 표준 규격에 준거한, 전형적인 동화상 부호화 장치(「인코더」라고도 한다. 이하 동일)(100)의 일예를 나타낸다. H.264/MPEG AVC 표준 규격은, 상술의 부호화 단계의 전체를 조합시킨 것이다. 감산기(105)는, 우선, 동화상(입력 신호)의 대상 블록(부호화 대상 블록)과, 대응하는 예측 블록(예측 신호)의 차분을 특정한다.
시간적 예측 블록은, 메모리(140)에 격납되어 있는 부호화 화상으로부터 얻어지는 블록이다. 공간적 예측 블록은, 부호화되어 메모리(140)에 격납된 인접 블록 내의 경계 화소의 화소값으로부터 보간된다. 따라서, 메모리(140)는, 대상 신호값과 과거의 신호값으로부터 생성된 예측 신호를 비교하는 지연 수단으로서 동작한다. 메모리(140)는, 복수의 부호화 동화상 프레임을 격납 가능하다.
입력 신호와 예측 신호의 차분은 예측 오차 또는 잔차로 불리고, 변환/양자화부(110)에 의해 변환되어 양자화된다. 로스가 생기지 않는 방법으로 데이터량을 더욱 삭감하기 위해서, 엔트로피 부호화부(190)에 의해 양자화 계수가 엔트로피 부호화 (「가변 길이 부호화」라고도 한다. 이하 동일)된다. 구체적으로는, 값의 발생 확률에 의거하여 길이가 정해지는 복수의 부호어를 이용하는 가변 길이 부호화에 의해 데이터량이 삭감된다.
H.264/MPEG AVC 표준 규격에는, 동화상 부호화층(VCL)과 네트워크 추상 레이어(NAL)라고 하는 2개의 기능층이 구비되어 있다. VCL은, 이미 간단히 언급한 부호화 기능을 제공한다. NAL은, 채널상 전송이나 격납 수단으로의 격납과 같은, 어플리케이션에 따라서, 동화상의 복호시에 필요한 보조 정보와 함께 부호화 예측 오차 신호를, NAL 유닛으로 불리는 표준 단위로 캡슐화한다. 압축 동화상 데이터 및 그 관련 정보를 포함하는 VCL NAL 유닛으로 불리는 것이 있다.
한편, 부가 데이터를 캡슐화하는 비(非) VCL 유닛으로 불리는 것도 있다. 부가 데이터는, 예를 들면, 동화상 시퀀스 전체에 관한 파라미터 세트나, 포스트 필터 힌트와 같은 복호 성능을 개선하기 위해서 이용할 수 있는 부가 정보를 제공하는, 최근 추가된 보조적 확장 정보(SEI) 등이다.
동화상 부호화 장치(100) 내에, 복호 동화상 신호를 취득하는 복호 수단이 구비된다. 부호화 단계에 준거하여, 복호 단계에는 역양자화/역변환부(120)에서의 처리가 포함된다. 복호 예측 오차 신호는, 양자화 노이즈로도 불리는 양자화 오차가 원인으로 원예측 오차 신호와는 다르다. 가산기(125)에 의해 복호 예측 오차 신호를 예측 신호에 가산함으로써, 재구축 신호가 취득된다. 인코더측과 디코더측의 호환성을 유지하기 위해서, 부호화된 후에 복호된 동화상 신호에 의거하여, 쌍방에 알려지는 예측 신호를 구한다. 양자화에 의해, 양자화 노이즈가 재구축 동화상 신호에 중첩된다.
블록 단위에서의 부호화에 의해, 중첩된 노이즈는 자주, 블로킹 특성을 가지고, 특히 강한 양자화가 행해진 경우는, 복호 화상의 블록 경계가 눈에 띄는 결과로 된다. 블로킹 아티팩트는, 인간의 시각적 인식상 마이너스 효과가 있다. 아티팩트를 삭감하기 위해서, 재구축 화상 블록마다 디블로킹 필터(130)가 적용된다. 디블로킹 필터(130)는, 예측 신호와 복호 예측 오차 신호의 가산 결과인 재구축 신호에 적용된다. 디블로킹 후의 동화상 신호는, 통상은 (포스트 필터링이 적용되지 않으면) 디코더측에서 표시되는 복호 신호이다.
H.264/AVC에 있어서의 디블로킹 필터(130)는, 국소적으로 적용 가능한 것이다. 블로킹 노이즈의 정도가 높은 경우는, 강한 (대역폭이 좁다) 로우 패스 필터가 적용되고, 블로킹 노이즈의 정도가 낮은 경우는, 약한 (대역폭이 넓다) 로우 패스 필터가 적용된다. 디블로킹 필터(130)는, 통상, 블록의 에지를 평활화하여 복호 화상의 주관적 화질을 개선한다. 또한, 화상 내의 필터링이 끝난 부분이 다음 화상의 움직임 보상 예측에 이용되므로, 필터링에 의해 예측 오차가 삭감되어, 부호화 효율을 개선할 수 있다. 복호 동화상 신호는, 다음에 메모리(140)에 격납된다.
H.264/AVC에 있어서의 예측 신호는, 시간적 예측이나 공간적 예측에 의해 취득된다. 예측 타입은, 매크로 블록 단위로 다르게 할 수 있다. 시간적 예측으로 예측된 매크로 블록은, 인터 부호화 매크로 블록으로 불리고, 공간적 예측으로 예측된 매크로 블록은, 인트라 부호화 매크로 블록으로 불린다.
여기서, 「인터」라고 하는 용어는, 인터 픽처 예측, 즉 선행 프레임이나 후속 프레임으로부터 얻어진 정보를 이용하는 예측에 관한 것이다. 「인트라」라고 하는 용어는, 공간적 예측, 즉 대상 동화상 프레임 내에서 이미 부호화된 정보만을 이용하는 예측에 관한 것이다. 가능한한 높은 압축 성과를 달성하기 위해서, 동화상 프레임의 예측 타입은, 사용자가 설정할 수도 있고, 동화상 부호화 장치(100)에 선택시킬 수도 있다. 선택된 예측 타입에 따라서 스위치(175)는, 대응하는 예측 신호를 감산기(105)에 제공한다.
인트라 부호화 화상(I타입 화상 또는 I프레임으로도 불린다)은, 인트라 부호화된 매크로 블록만으로 이루어진다. 즉, 인트라 부호화된 화상은, 다른 복호 화상를 참조하지 않고 복호 가능하다. 인트라 부호화 화상는, 부호화 동화상 시퀀스에 대하여 에러 내성을 부여한다. 왜냐하면, 시간적 예측에 의해 동화상 시퀀스 내에서 프레임으로부터 프레임에 전파할 가능성이 있는 에러를 없애기(리프레쉬한다) 때문이다. 또한, I프레임은, 부호화 동화상 시퀀스 내에서 랜덤 액세스를 가능하게 한다.
인트라 프레임 예측에서는, 기본적으로는, 이미 부호화된 인접 매크로 블록의 경계에 위치하는 화소를 이용하여 대상 매크로 블록을 예측하는, 미리 정해진 인트라 예측 모드의 세트가 이용된다. 공간적 예측 타입이 다르다고 하는 것은, 에지의 방향, 즉 적용된 2차원 보간의 방향이 다르다는 것이다. 보간에 의해 얻어진 예측 신호는, 다음에, 상술의 감산기(105)에 의해, 입력 신호로부터 감산된다. 또한, 공간적 예측 타입 정보는, 엔트로피 부호화되어, 부호화 동화상 신호와 함께 제공된다.
인터 부호화 화상를 복호하기 위해서는, 부호화된 후에 복호된 화상이 필요하다. 시간적 예측은, 단일 방향 즉 부호화 대상 프레임보다 빠른 순서의 동화상 프레임만을 이용하여 행해도 되고, 후속 동화상 프레임도 이용하여 행해도 된다. 단일 방향의 시간적 예측을 행하면, P프레임으로 불리는 인터 부호화 화상이 얻어지고, 쌍방향의 시간적 예측을 행하면, B프레임으로 불리는 인터 부호화 화상이 얻어진다. 일반적으로, 인터 부호화 화상은, P 타입 매크로 블록과 B타입 매크로 블록과 I타입 매크로 블록 중 어느 하나로 구성된다.
인터 부호화 매크로 블록(P 또는 B 매크로 블록)은, 움직임 보상 예측부(160)를 채용하여 예측된다. 우선, 움직임 예측부(165)에 의해, 부호화된 후에 복호된 동화상 프레임 내에서, 대상 블록에 최적의 블록이 검출된다. 이 최적 블록은 예측 신호로 되고, 대상 블록과 최적 블록간의 상대적인 어긋남(움직임)이, 부호화 동화상 데이터와 함께 제공되는 보조 정보 내에 포함되는 2차원의 움직임 벡터의 형으로 움직임 데이터로서 신호 송신된다.
예측 정밀도를 최적화하기 위해서, 1/2 화소 해상도나 1/4 화소 해상도 등의 소수 화소 해상도로 움직임 벡터를 특정해도 된다. 소수 화소 해상도의 움직임 벡터는, 복호 프레임 내의, 소수 화소 위치와 같이 실존하는 화소값이 없는 위치를 가리켜도 된다. 따라서, 움직임 보상을 행하기 위해서는, 그러한 화소값의 공간적 보간이 필요하다. 보간은, 보간 필터(150)에 의해 행해진다. H.264/MPEG AVC 표준 규격에 따라서, 소수 화소 위치의 화소값을 얻기 위해서, 고정 필터 계수를 이용한 6탭·위너 보간 필터와 바이너리 필터가 적용된다.
인트라 부호화 모드 및 인터 부호화 모드에 있어서, 변환/양자화부(110)에 의해, 대상 입력 신호와 예측 신호간의 차분이 변환되어 양자화되어, 양자화 변환 계수가 얻어진다. 일반적으로, 2차원 이산 코사인 변환(DCT) 또는 그 정수판과 같은 직교 변환이 채용된다. 왜냐하면, 이에 따라 자연 동화상의 장황성을 효율적으로 삭감할 수 있기 때문이다. 통상, 저주파수 성분은 고주파 성분보다도 화질에 있어서 중요하기 때문에, 고주파수보다도 저주파수에 많은 비트가 소비되도록 변환된다.
양자화 후, 2차원 매트릭스의 양자화 변환 계수가 1차원 배열로 변환되어 엔트로피 부호화부(190)에 송신된다. 전형적으로는, 소위 지그재그 주사에 의해 변환된다. 지그재그 주사에 있어서는, 2차원 매트릭스의 좌측 상부 모퉁이로부터 우측 하부 모퉁이까지 소정의 순서로 주사된다. 전형적으로는, 에너지는 저주파에 상당하는 화상의 좌측 상부 부분에 집중하기 때문에, 지그재그 주사를 행하면, 최후의 쪽에서 제로값이 이어지는 배열로 된다. 이에 따라, 실제의 엔트로피 부호화의 일부로서, 또는 그 이전의 단계에서, 런 랭스(run length) 부호를 이용한 효율적인 부호화를 행하는 것이 가능해진다.
H.264/MPEG-4AVC는, 양자화 파라미터(QP) 및 개개인의 요구에 맞춤(customized) 가능한 양자화 매트릭스(QM)에 의해 제어 가능한 스칼라 양자화를 채용하고 있다. 양자화 파라미터에 의해, 52의 양자화기 중의 1개가 매크로 블록마다 선택된다. 추가하여, 양자화 매트릭스는, 화질의 손실을 피하기 위해서, 특히, 소스 내에서 특정의 주파수를 유지하도록 설계된다. H.264/MPEG-4AVC에 있어서의 양자화 매트릭스는, 동화상 시퀀스에 적응 가능하고, 동화상 데이터와 함께 신호 송신된다.
화질을 개선하기 위해서, 포스트 필터(280)로 불리는 것을, 동화상 복호 장치(「디코더」라고도 한다. 이하 동일)(200)에 적용해도 된다. H.264/MPEG AVC 표준 규격에 있어서는, 보조적 확장 정보(SEI) 메시지를 통하여, 포스트 필터(280)를 위한 포스트 필터 정보를 송신하는 것이 가능하다. 포스트 필터 정보는, 로컬 복호 신호와 원화상 입력 신호를 비교하는 포스트 필터 설계부(180)에 의해 동화상 부호화 장치(100)측에서 특정된다. 포스트 필터 설계부(180)의 출력은, 엔트로피 부호화부(190)로 보내져, 부호화되어 부호화 신호에 삽입된다. 엔트로피 부호화부(190)는, 통계를 적용한, 부호화 대상 정보의 타입이 다르면 길이가 다른 가변 길이 코드를 채용한다.
도 2는, H.264/AVC 동화상 부호화 표준 규격에 준거한 예시적인 동화상 복호 장치(200)를 설명하는 도면이다. 부호화 동화상 신호(동화상 복호장치(200)로의 입력 신호)는, 우선 엔트로피 복호부(290)에 송신된다. 엔트로피 복호부(290)는, 양자화 변환 계수나 움직임 데이터 및 예측 타입 등의 복호에 필요한 정보 엘리먼트나, 포스트 필터 정보를 복호한다. 양자화 변환 계수는, 역주사되어 2차원 매트릭스로 되고, 역양자화/역변환부(220)에 송신된다. 역양자화/역변환부(220)에 의한 역양자화 및 역변환 후, 복호(양자화) 예측 오차 신호가 얻어진다. 이는, 동화상 부호화 장치(100)에 입력된 신호로부터 예측 신호를 감산하여 얻어진 차분에 상당한다.
예측 신호는, 움직임 보상 예측부(시간적 예측 수단)(260) 또는 인트라 프레임 예측부(공간적 예측 수단)(270)로부터 각각 얻어진다. 어느쪽의 예측 신호를 채용할지는, 동화상 부호화 장치(100)에 적용된 예측을 신호 송신하는 정보 엘리먼트에 따라서 스위치(275)에 의해 전환된다.
복호 정보 엘리먼트는, 인트라 예측의 경우에는, 예측 타입 등의 예측에 필요한 정보를 포함하고, 움직임 보상 예측의 경우에는, 움직임 데이터 등의 예측에 필요한 정보를 더 포함한다. 움직임 벡터의 값에 따라서는, 움직임 보상 예측을 행하기 위해서는 화소값을 보간할 필요가 있다. 보간은, 보간 필터(250)에 의해 행해진다.
공간 영역의 양자화 예측 오차 신호는, 다음에, 가산기(225)에 의해, 움직임 보상 예측부(260)나 인트라 프레임 예측부(270)로부터 얻어지는 예측 신호로 가산된다. 재구축 화상을, 디블로킹 필터(230)에 송신해도 된다. 복호 신호는, 메모리(240)에 격납되고, 후속 블록의 시간적 예측 또는 공간적 예측에 이용된다.
포스트 필터 정보는, 포스트 필터(280)에 송신되고, 포스트 필터(280)가 그에 따라서 설정된다. 화질을 더욱 개선하기 위해서, 포스트 필터(280)는, 다음에 복호 신호에 적용된다. 따라서, 포스트 필터(280)는, 프레임마다 동화상 부호화 장치(100)에 입력되는 동화상 신호의 특성에 적응하는 능력을 구비한다.
요약하면, 최신의 H.264/MPEG AVC 표준 규격에 이용되는 필터는 이하의 3종류이다. 즉, 보간 필터와 디블로킹 필터와 포스트 필터이다. 일반적으로, 어떤 필터가 적절한지 여부는, 필터링 대상의 화상 내용대로 정해진다. 이 때문에, 화상의 특성에 적응 가능한 필터 설계가 유리하다. 필터 계수를, 위너 필터 계수로서 설계해도 된다.
최신의 H.264/MPEG AVC 표준 규격에 있어서는, 또한 적응적 포스트 필터를 이용 가능하다. 이 목적으로, 상술한 바와 같이, 포스트 필터 설계부(180)에 의해 화상마다 동화상 부호화 장치(100)에서 포스트 필터가 평가된다. 포스트 필터 설계부(180)는, 필터 정보(포스트 필터 힌트로 불리는 것)를 생성하고, 이를 SEI 메시지의 형으로 동화상 복호 장치(200)에 송신한다. 동화상 복호 장치(200)에서의 표시에 앞서 복호 신호에 적용되는 포스트 필터(280)에 의해, 이 필터 정보를 이용해도 된다. 동화상 부호화 장치(100)로부터 동화상 복호 장치(200)로 송신되는 필터 정보는, 필터 계수나 상호 상관 벡터이다. 보조 정보를 송신하면, 필터링의 질을 개선할 수 있는 경우가 있는데, 대역을 넓힐 필요가 생긴다. 송신 또는 계산된 필터 계수를 이용하여, 화상 전체에 포스트 필터링이 실시된다. H.264/MPEG AVC에 있어서의 디블로킹 필터는, 블록의 에지에 발생하는 블로킹 아티팩트를 삭감하는 루프 필터로서 이용된다. 3타입의 필터는, 위너 필터로서 평가된다.
도 3은, 노이즈를 삭감하기 위한 위너 필터(300)를 이용한 신호의 흐름을 설명하는 도면이다. 노이즈(n)가 입력 신호(s)에 가산되면, 필터링 대상의 노이즈를 포함하는 신호(s’)로 된다. 노이즈(n)를 삭감한다고 하는 목적은, 신호(s’)에 위너 필터(300)를 적용하여 필터링이 끝난 신호(s”)를 얻는 것이다. 위너 필터(300)는, 원하는 신호인 입력 신호(s)와 필터링이 끝난 신호(s)간의 평균 제곱 오차를 최소한으로 하도록 설계된다. 위너 계수는 위너 Hopf 방정식으로 불리는 시스템으로서 표현되는 최적화 문제 argW min E [(s-s”)2]의 해답에 상당한다. 연산자 E [x]는, 기대되는 x의 값이다. 해답은 이하의 식 1로 구해진다.
[수학식 1]
Figure pct00001
여기에서, w는, 양의 정수인 M자리수의 최적 위너 필터 계수를 포함하는 M×1의 벡터이다. R-1은, 필터링 대상의 노이즈를 포함하는 신호(s’)의 M×M의 자기 상관 매트릭스(R)의 역수를 나타낸다. p는, 필터링 대상의 노이즈를 포함하는 신호(s’)와 원화상 신호(s)의 사이의 M×1의 상호 상관 벡터를 나타낸다. 적응적 필터 설계에 관한 상세에 대해서는, S. Haykin의, 「Adaptive Filter Theory(특허문헌 1)」 (제4판, Prentice Hall Information and System Sciences 시리즈, Prentice Hall, 2002년)을 참조할 것. 이를 여기에 인용하여 원용한다.
따라서, 위너 필터(300)의 메리트의 하나는, 파손된 (노이즈를 포함한다) 신호의 자기 상관과, 파손 신호와 원하는 신호간의 상호 상관에 의거하여, 필터 계수를 구할 수 있다고 하는 점이다. 동화상 부호화 시에, 양자화 단계에 있어서, 양자화 노이즈가 원화상(입력) 동화상 신호에 중첩된다. 동화상 부호화(의 컨텍스트(context))에 있어서의 위너 필터링은, 평균 제곱 재구축 오차를 최소화하기 위해서, 중첩된 양자화 노이즈를 삭감하는 것을 목적으로 하고 있다.
도 4는, H.264/MPEG-4 AVC의 디블로킹 필터(130)의 대신에 위너 필터 및 설계부(440)가 이용되는, H.264/MPEG-4 AVC의 동화상 부호화 장치(400)를 나타내는 블록도이다. 이는, 특허문헌 1에 기재되어 있고, 이를 여기에 인용하여 원용한다. 위너 필터 및 설계부(440)는, 움직임 보상 예측 전에, 예측 루프 내에서 실행된다. 필터링된 화상은, 메모리(140)에 격납되고, 예측을 위해서 제공된다.
인루프 필터링에 의한 이점은, 예측 및 표시에 이용되는 신호의 질이 향상되는 것이다. 디블로킹 필터(130)가 위너 필터 및 설계부(440)로서 실장되면, 입력 신호와 재구축 신호를 이용하여 계수가 예측된다. 산출된 필터 계수(441)는, 동일한 복호 결과, 즉 동일한 화질을 보증하는 목적으로, 디코더에 제공되지 않으면 안된다. 송신 또는 격납하기 전에, 필터 계수(441)는 엔트로피 부호화부(490)에 의해 엔트로피 부호화되어, 보조 정보로서 부호화 동화상 데이터에 넣어진다. 그러한 동화상 부호화 장치(400)와 호환성을 가지는 디코더는, 필터 계수 등의 부호화되었을 필터 정보(441)를 취득하고, 그에 따라 디코더 자체의 필터를 설정한다.
도 5는, 특허문헌 1에 기재되어 있는, H.264/MPEG―4 AVC의 디블로킹 필터(130)의 후에 위너 필터 및 설계부(540)가 다시 적용된 동화상 부호화 장치(500)의 다른 예를 나타낸다. 위너 필터 및 설계부(540)는, 입력 신호와 디블로킹 필터(130)에 의해 필터링된 재구축 신호에 의거하여 필터 계수(541)를 산출한다. 필터 계수(541)는, 엔트로피 부호화부(590)에 의해 부호화되는데, 이 부호화는, 필터 계수의 통계에 적응하고 있어도 된다.
유럽 출원 제08012036.3호에 있어서, 이를 여기에 인용하여 원용하는데, 예측 신호, 양자화 예측 오차 신호, 및 복호 신호를 필터 설계에 있어서 따로따로 고려하는 것이 제안되어 있다. 이에 따라, 이들 3개의 신호의 각각의 노이즈를 개별로 고려할 수 있다.
도 6은, H.264/MPEG―4 AVC에 의거하는 그러한 예시적인 동화상 부호화 장치(600)를 나타낸다. 도 7은, 그에 대응하는 동화상 복호 장치(700)를 나타낸다. 따라서, 포스트 필터 계수는, 입력 신호, 디블로킹 필터(130) 적용후의 복호 신호, 예측 신호 및 양자화 예측 오차 신호에 의거하여, 동화상 부호화 장치(600)에 있어서 포스트 필터 설계부(640)로 산출된다. 포스트 필터 설계부(640)는, 그 후, 직접적으로 필터 계수를 제공하거나, 또는 디코더에 있어서 대응하는 포스트 필터(740)의 설정에 사용할 수 있는, 다른 종류의 새로운 포스트 필터 정보(641)를 제공한다. 그러한 새로운 포스트 필터 정보(641)는, 예를 들면, 상호 상관 벡터, 또는 다른 임의의 정보이다. 역시, 포스트 필터 정보(641)는 엔트로피 부호화부(690)에서 엔트로피 부호화되고, 그에 대응하여 동화상 복호 장치(700)에 있어서 엔트로피 복호되어도 된다.
다음에, 도 8은, 비선형 노이즈 제거 필터를 구비하는 동화상 복호 장치를 나타내는 블록도이다. 이 비선형 노이즈 제거 필터는, 움직임 보상 예측부로부터 출력되는 예측 신호와, 복호부로부터 출력되는 복호 오차(양자화 예측 오차 신호)의 합인 재구축 화상 신호에 대해 적용된다.
도 9a 및 도 9b는, 비선형 노이즈 제거 필터의 알고리즘의 플로우를 나타낸다. 우선, 도 9a에 나타내는 변환부는, 평행 이동 불변 변환(translation invariant transform) 블록 개시 위치를 수평·수직 방향으로 1화소씩 평행 이동시킨 변환의 셋트이며, 변환의 화소수에 비례한 개수가 정의된다)에 의해, 재구축 화상 신호(y)의 복수의 표현을 생성한다. 구체적으로는, 도 10에 나타내는 바와같이, 2차원 4×4변환의 경우, 16개의 표현이 생성된다. 이들은 d1, …, d16으로 표시된다. d1, …, d16은, 재구축 신호(y)의 상호 다른 샘플의 세트로부터 생성된 것이다.
동화상 부호화 장치측에 있어서, 동일한 변환이 원화상 신호(x)에도 적용가능하다. 이는, 하이브리드 부호화되기 전의 신호이다. 이는 물론 동화상 복호 장치측에서는 입수할 수 없다. 이 결과, 도 11b에 나타내는 바와같이, 원화상 신호의 16개의 표현(c1, …, c16)이 얻어진다. 도 11a 및 도 11b에 나타내는 처리에 의해 얻어지는 각 ci 및 각 di는, 16개의 계수 ci(j), di(j)의 벡터이며, 여기에서 j=1, …, 16이다. 전형적으로 동화상 부호화 장치에서 실행되는 양자화에 의해, 양자화 노이즈는, 재구축 신호의 계수에 중첩되는 qi(j)이다. 이 양자화 노이즈에 의해, 재구축 신호의 계수 di(j)와 원화상 신호의 계수 ci(j)의 사이의 의존성은, ci(j)=di(j)+qi(j)로 표시할 수 있다. 노이즈 제거 필터의 핵이 되는 부분은, 노이즈 제거 룰이다. 이 노이즈 제거 룰을, 식 2에 표시한다.
[수학식 2]
Figure pct00002
식 2의 조건 1은, 원화상 신호의 계수 ci(j)와, 예측된 계수 ci^ (j)의 사이의 평균 제곱 오차를 최소화하는 목적으로 선택된다. 즉, 식 2를 보다 구체적으로 기술하면, 식 3과 같이 된다. 여기서, 기호 「^ (모자)」는, 각각 직전의 문자 위에 붙여지는 기호를 나타내고, 본 명세서에서는, 이하, 기호 「^ (모자)」를 동일한 의미로 사용한다.
[수학식 3]
Figure pct00003
상기 식 3에 의하면, 재구축 화상 신호의 계수 di(j) 또는 제로가 예측값으로서 이용되는데, 그 예측값으로는, 제곱 재구축 오차가 보다 낮아지는 것이 선택된다. 그 선택은, 계수 di(j)와 역치 τi를 비교함으로써 실현할 수 있다. 즉, τi를 이용하여 식 3을 다시쓰면, 식 4와 같이 된다.
[수학식 4]
Figure pct00004
따라서, 16개의 표현 di(j)로부터, 원화상 신호의 계수에 대한 16개의 예측값 ci^ (j)이, 역치 연산에 의해 도출된다. 이들 16개의 예측값 ci^ (j)은, 도 12에 나타내는 바와같이, 가중 역변환부에서 역변환되어 값 u^로 된다. 가중 역변환이란, 16개의 예측값 ci^ (j)을 주파수 성분마다 가중 가산하고, 얻어진 결과를 공간 영역으로 변환하는 처리이다. 즉, 이 값 u^은, 공간 영역의 값이다. 또한, u^을 마스킹부에서 마스킹해도 된다. u^을 마스킹하면, 화상 신호 x^로 된다. 마스킹 처리에 의해, 원화 신호(x)에 대한 화상 신호 x^의 급격한 변화를 억제할 수 있다.
여기까지, 노이즈 제거의 1개의 루프만을 설명했다. 도 9b로부터 알 수 있듯이, k=0, …, 2에 의해 나타내는 3개의 루프가 실행된다. 이는, 제1 루프의 결과인 x^=xk =0^=x0^에 대하여, 평행 이동 불변 변환이 적용되고, k를 1증가시킨 후(k+=1), 계수 f1 , k-1, …, f16 , k-1로 된다. 이들 계수에 대한 노이즈 제거 룰은, 이하의 식 5에 따라서 적용된다. 각 루프에 있어서, 각각의 역치 τi, k가 적용된다.
[수학식 5]
Figure pct00005
유럽 특허 출원 공개 제 1841230호 명세서
Adaptive Filter Theory(S. Haykin, Prentice Hall Information and System Sciences 시리즈, Prentice Hall, 2002년)
본 발명의 근저에 있는 과제는, 주파수 영역에 있어서 실행되는 양자화가, 대략 각각의 양자화 노이즈를 가지는 각 주파수 성분을 중첩한 것으로 간주될 가능성이 있는 것에 의거한다. 이는, 노이즈의 통계가, 각 주파수 성분마다 다른 가능성이 있는 것을 의미한다. 현재의 시점에서 동화상 부호화에 적용되어 있는 수법은, 공간 영역에 있어서 필터링(루프 및/또는 포스트 필터링)을 적용하는 것이다. 그러나, 공간 영역에 적용된 필터링에서는, 각 주파수 성분에 있어서의 양자화 노이즈의 각각의 통계는 고려되지 않는다.
본 발명의 목적은, 효율적인 필터링 수법에 의해 부호화 및/또는 복호 동화상 신호의 질을 향상시키는, 부호화 및 복호 메커니즘을 제공하는 것이다.
본 발명의 일형태에 관련된 동화상 부호화 방법은, 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호하는 방법이다. 구체적으로는, 상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 단계와, 상기 부호화 신호를 복호하여 복호 신호를 생성하는 단계와, 상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 단계를 포함한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함한다.
상기 구성에 의하면, 양자화의 과정에서 중첩된 노이즈를 적절하게 제거하는 것이 가능해진다. 또한, 「양자화의 과정에서 중첩되는 노이즈」란, 전형적으로는, 양자화 노이즈이며, 주파수 변환된 신호에 중첩된다. 여기서, 공간 영역의 신호에 대해서가 아니라, 주파수 영역의 신호에 대하여 필터 처리를 적용함으로써, 보다 효과적으로 노이즈를 제거할 수 있다. 또한, 양자화 노이즈는, 전 주파수 성분에 똑같이 중첩되는 것이 아니라, 주파수 성분마다 다르다. 여기서, 주파수 성분마다 독립하여 필터 처리를 적용함으로써, 보다 적응적으로 양자화 노이즈를 제거할 수 있다. 또한, 필터 정보를 부호화측에서 취득함으로써, 원 동화상 신호를 고려한 필터 처리가 가능해진다.
또한, 본 명세서 중에 있어서의 「부호화」란, 동화상 신호를 주파수 변환하고, 양자화하여, 엔트로피 부호화하는 처리의 일부 또는 전부를 포함하는 개념이다. 또한, 「복호」란, 부호화 신호를 역양자화하여, 공간 영역으로 변환하고, 예측 신호를 가산하여 재구축 신호를 생성하고, 재구축 신호에 디블로킹 필터 처리를 적용하여 복호 신호를 생성하는 처리, 또는 재구축 신호로부터 예측 신호를 생성하는 처리의 일부 또는 전부를 포함하는 개념이다.
또한, 상기 필터 처리는, 상기 복호 신호를 구성하는 복수의 블록 각각에 대해서, 처리 대상 블록의 각 주파수 성분의 값과, 상기 처리 대상 블록에 시간적 또는 공간적으로 인접하는 블록의 대응하는 주파수 성분의 값을, 상기 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함한다. 그리고, 상기 가중 계수는, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 처리 대상 블록과, 주파수 영역의 상기 동화상 신호에 포함되는 상기 처리 대상 블록에 대응하는 블록의 평균 제곱 오차가 최소가 되도록 결정되어도 된다.
또한, 상기 필터 처리는, 상기 가중 가산을 실행하기 전의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값으로부터 제1의 오프셋값을 감산하는 단계와, 상기 가중 가산한 후의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값에 상기 필터 정보에 포함되는 제2의 오프셋값을 가산하는 단계를 포함한다. 그리고, 상기 제1의 오프셋값은, 주파수 영역의 상기 복호 신호에 포함되는 블록 중, 상기 처리 대상 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 산출되고, 상기 제2의 오프셋값은, 주파수 영역의 상기 동화상 신호에 포함되는 블록 중, 상기 처리 대상 블록에 대응하는 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 산출되어도 된다.
일양태로서, 상기 부호화 신호는, 상기 동화상 신호가 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이다. 상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여 상기 복호 신호로서의 양자화 계수를 생성하는 처리가 포함된다. 그리고, 상기 필터 처리를 적용하는 단계에는, 상기 양자화 계수에 상기 필터 처리를 적용함과 더불어, 당해 양자화 계수를 역양자화하는 처리가 포함되어도 된다. 이에 따라, 양자화 계수에 중첩된 노이즈를 적응적으로 제거할 수 있다.
다른 형태로서, 상기 부호화 신호는, 상기 동화상 신호로부터 예측 신호가 감산되고, 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이다. 상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하고, 역양자화하여, 주파수 영역으로부터 공간 영역으로 역변환하고, 상기 예측 신호를 가산하여 상기 복호 신호로서의 재구축 신호를 생성하는 처리가 포함된다. 그리고, 상기 필터 처리를 적용하는 단계에는, 상기 재구축 신호를 공간 영역으로부터 주파수 영역으로 변환하는 처리와, 주파수 영역의 상기 재구축 신호에 상기 필터 처리를 적용하는 처리와, 상기 필터 처리를 적용한 후의 상기 재구축 신호를 주파수 영역으로부터 공간 영역으로 역변환하는 처리가 포함되어도 된다. 이에 따라, 재구축 신호에 중첩된 노이즈를 적응적으로 제거할 수 있다.
별도의 형태로서, 상기 부호화 신호는, 상기 동화상 신호로부터 예측 신호가 감산되어 예측 오차 신호가 생성되고, 당해 예측 오차 신호가 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이다. 상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호와 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 상기 필터 처리는, 상기 복호 신호로서의 상기 양자화 예측 오차 신호, 상기 예측 신호 및 상기 재구축 신호의 서로 대응하는 블록에 포함되는 동일 주파수 성분의 값을 상기 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함한다. 그리고, 상기 가중 계수는, 주파수 영역의 상기 예측 오차 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 결정되어도 된다. 이에 따라, 양자화 예측 오차 신호에 중첩된 노이즈를 적응적으로 제거할 수 있다.
다른 형태로서, 상기 부호화 신호는, 상기 동화상 신호로부터 예측 신호가 감산되고, 공간 영역으로부터 주파수 영역으로 변환되고, 양자화되어, 엔트로피 부호화되어 얻어지는 것이다. 상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호와 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 그리고, 상기 필터 처리를 적용하는 단계에는, 상기 예측 신호를 공간 영역으로부터 주파수 영역으로 변환하는 처리와, 주파수 영역의 상기 예측 신호에 상기 필터 처리를 적용하는 처리와, 상기 필터 처리가 적용된 후의 상기 예측 신호를 주파수 영역으로부터 공간 영역으로 역변환하는 처리가 포함되어도 된다. 이에 따라, 예측 신호에 중첩된 노이즈를 적응적으로 제거할 수 있다.
본 발명의 일형태에 관련된 동화상 부호화 방법은, 동화상 신호를 부호화하여 부호화 신호를 생성하는 방법이다. 구체적으로는, 적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 단계와, 양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 단계와, 상기 부호화 신호 및 상기 필터 정보를 출력하는 단계를 포함한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정된다. 이에 따라, 양자화 과정에서 중첩된 노이즈를 적응적으로 제거할 수 있다.
또한, 상기 동화상 부호화 방법은, 양자화 후의 주파수 영역의 신호에, 상기 필터 정보를 이용하여 상기 필터 처리를 적용하는 단계를 포함한다. 상기 필터 처리는, 상기 양자화 후의 신호를 구성하는 복수의 블록 각각에 대해서, 처리 대상 블록의 각 주파수 성분의 값과, 상기 처리 대상 블록에 시간적 또는 공간적으로 인접하는 블록의 대응하는 주파수 성분의 값을, 상기 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함한다. 그리고, 상기 필터 정보를 생성하는 단계는, 상기 필터 처리가 적용된 상기 처리 대상 블록과, 주파수 영역의 상기 동화상 신호에 포함되는 상기 처리 대상 블록에 대응하는 블록의 평균 제곱 오차가 최소가 되도록 상기 가중 계수를 결정해도 된다.
또한, 상기 필터 처리는, 상기 가중 가산을 실행하기 전의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값으로부터 제1의 오프셋값을 감산하는 단계와, 상기 가중 가산한 후의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값에 제2의 오프셋값을 가산하는 단계를 포함한다. 그리고, 상기 필터 정보를 생성하는 단계에서는, 양자화 후의 주파수 영역의 신호에 포함되는 블록 중, 상기 처리 대상 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수성분마다 상기 제1의 오프셋값이 산출되고, 주파수 영역의 상기 동화상 신호에 포함되는 블록 중, 상기 처리 대상 블록에 대응하는 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 상기 제2의 오프셋값이 산출되고, 적어도 상기 제2의 오프셋값이 상기 필터 정보에 포함되어도 된다.
일형태로서, 상기 부호화 신호를 생성하는 단계에는, 상기 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 상기 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여 양자화 계수를 생성하는 처리가 포함된다. 그리고, 상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 예측 오차 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되어도 된다.
다른 형태로서, 상기 부호화 신호를 생성하는 단계에는, 주파수 영역의 상기 동화상 신호를 양자화하고, 역양자화하여 재구축 신호를 생성하는 처리가 포함된다. 그리고, 상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 재구축 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되어도 된다.
다른 형태로서, 상기 부호화 신호를 생성하는 단계에는, 상기 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 상기 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 역양자화하며, 주파수 영역으로부터 공간 영역으로 변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호에 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 그리고, 상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 예측 신호, 주파수 영역의 상기 양자화 예측 오차 신호, 및 주파수 영역의 상기 재구축 신호에 의거하여, 주파수 영역의 상기 예측 오차 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되어도 된다.
다른 형태로서, 상기 부호화 신호를 생성하는 단계에는, 상기 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 상기 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 역양자화하며, 주파수 영역으로부터 공간 영역으로 변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호에 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 그리고, 상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 예측 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되어도 된다.
본 발명의 일형태에 관련된 동화상 복호 장치는, 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호한다. 구체적으로는, 상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 취득부와, 상기 부호화 신호를 복호하여 복호 신호를 생성하는 복호부와, 상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 필터부를 구비한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함한다.
본 발명의 일형태에 관련된 동화상 부호화 장치는, 동화상 신호를 부호화하여 부호화 신호를 생성한다. 구체적으로는, 적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 부호화부와, 양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 필터 설계부와, 상기 부호화 신호 및 상기 필터 정보를 출력하는 출력부를 구비한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
본 발명의 일형태에 관련된 프로그램은, 컴퓨터에, 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호시킨다. 구체적으로는, 상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 단계와, 상기 부호화 신호를 복호하여 복호 신호를 생성하는 단계와, 상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 단계를 포함한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함한다.
본 발명의 다른 형태에 관련된 프로그램은, 컴퓨터에, 동화상 신호를 부호화하여 부호화 신호를 생성시킨다. 구체적으로는, 적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 단계와, 양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 단계와, 상기 부호화 신호 및 상기 필터 정보를 출력하는 단계를 포함한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
본 발명의 일형태에 관련된 집적 회로는, 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호한다. 구체적으로는, 상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 취득부와, 상기 부호화 신호를 복호하여 복호 신호를 생성하는 복호부와, 상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 필터부를 구비한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함한다.
본 발명의 다른 형태에 관련된 집적 회로는, 동화상 신호를 부호화하여 부호화 신호를 생성한다. 구체적으로는, 적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 부호화부와, 양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 필터 설계부와, 상기 부호화 신호 및 상기 필터 정보를 출력하는 출력부를 구비한다. 그리고, 상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
또한, 본 발명은, 화상 복호 방법(장치) 및 화상 부호화 방법(장치)으로서 실현할 수 있을 뿐만 아니라, 이들 기능을 실현하는 집적 회로로서 실현하거나, 그러한 기능을 컴퓨터에 실행시키는 프로그램으로서 실현할 수도 있다. 그리고, 그러한 프로그램은, CD-ROM 등의 기록 매체 및 인터넷 등의 전송 매체를 통해서 유통시킬 수 있는 것은 말할 것도 없다.
이는, 독립 클레임에 정의된 특징에 의해 달성된다.
적합한 실시 형태는, 종속 클레임의 주제이다.
주파수 영역의 동화상 신호에 의거하여 필터 파라미터를 결정하고, 그에 따라 필터를 설정하여, 주파수 영역에 당해 필터를 적용하는 것은, 본 발명에 특유의 수법이다.
그러한 수법에 의해, 신호 내의 다양한 주파수 성분에 대하여 노이즈가 다른 경우의 필터링 후의 화질이 향상한다. 그러한 노이즈 특성은, 전형적으로, 주파수 영역에 있어서 양자화가 실행되는 경우, 특히 양자화 가중 행렬이 이용되거나, 조(粗)양자화가 적용된 경우에, 양자화 노이즈에 있어서 보여지는 것이다. 그러나, 어떤 특정한 송신 방법에 의해, 오차의 결과로서 주파수 선택 노이즈가 생기는 경우도 있다.
본 발명의 제1의 양태에 의하면, 적어도 1개의 동화상 프레임을 포함하는 동화상 신호를 부호화하는 방법이 제공된다. 우선, 동화상 신호가 주파수 영역으로 변환된다. 그 후, 주파수 영역의 동화상 신호의 필터링에 이용되는 필터 데이터가, 주파수 영역으로 변환된 동화상 신호에 의거하여 결정된다. 필터 데이터는, 디코더측에 제공된다.
본 발명의 다른 양태에 의하면, 적어도 1개의 동화상 프레임을 포함하는 부호화 동화상 신호를 복호하는 방법이 제공된다. 주파수 영역의 동화상 신호를 필터링하는 필터가, 주파수 영역의 동화상 신호 블록에 대하여 각각에 설정된다. 그 후, 동화상 신호 블록은, 주파수 영역에 있어서 당해 필터를 이용하여 각각에 필터링된다.
본 발명의 또 다른 양태에 의하면, 적어도 1개의 동화상 프레임을 포함하는 동화상 신호를 부호화하는 인코더가 제공된다. 당해 인코더는, 동화상 신호를 주파수 영역으로 변환하는 변환 수단과, 필터 데이터를 결정하는 필터 설계 수단을 구비한다. 필터 데이터는, 주파수 영역의 동화상 신호의 필터링에 이용되고, 주파수 영역으로 변환된 동화상 신호에 의거하여 결정된다. 또한, 인코더는, 디코더측에 필터 데이터를 제공할 수 있다.
본 발명의 또 다른 양태에 의하면, 적어도 1개의 동화상 프레임을 포함하는 부호화 동화상 신호를 복호하는 장치가 제공된다. 당해 디코더는, 동화상 신호 블록에 대하여, 주파수 영역에 있어서 각각에 필터를 설정하는 설정 수단을 구비한다. 당해 디코더는 주파수 영역에 있어서, 또한 블록 단위로, 당해 필터에 의해 동화상 신호를 필터링하는 필터 수단을 더 구비한다.
바람직하게는, 필터를 설정하는 블록, 필터 설계, 및/또는 필터링은, 변환되는 블록에 대응한다. 여기에서, 당해 변환은 동화상 신호를 부호화하기 위해서 실행되는 변환, 또는 동화상 신호를 복호하기 위해서 실행되는 역변환에 대응해도 된다. 그러한 경우, 인코더에 있어서 동화상 신호가 프레임 및 블록에 세그먼트화되어, 디코더에 신호 송신되거나, 일반적인 방법으로 디코더에 통지된다. 그러나, 부호화/복호에 이용된 래스터와 다른 래스터(사이즈 및 동화상 신호 프레임 내의 위치)를 가지는 블록에는 또한, 추가의 변환이 적용되어도 된다. 이 경우, 인코더와 디코더의 양쪽에 있어서 동화상 신호를 블록에 세그먼트화할 필요가 있어도 되고, 또는 인코더에서 세그먼트화하여, 디코더에 신호 송신/알려도 된다. 래스터의 필터링은, 변환에 이용되는 블록 래스터, 또는 시간적 및/또는 예측에 이용되는 블록 래스터 등의, 부호화/복호에 있어서 사용되는 블록 래스터에 의존해도 된다. 특히, 필터링에 이용되는 블록 래스터는, 기초적인 부호화/복호 블록 래스터의 블록군에서 설정되어도 된다. 그러나, 필터링에 이용되는 블록 래스터는, (만약 있으면) 부호화/복호에 이용되는 기초적인 블록 래스터로부터 독립되어 있어도 된다. 그러한 필터링 래스터의 블록 사이즈 및 형상은, 반드시 동일하다고는 한정되지 않고, 다른 형상이나 사이즈의 블록이 사용되어도 된다. 바람직하게는, 효율적으로 소프트웨어/하드웨어에 실장할 수 있는 사이즈의 4각형이 이용된다. 그러나, 래스터 블록의 사이즈 및 형상은, 예를 들면 동화상 신호의 내용에 따라서 임의로 선택되어도 된다.
바람직하게는, 디코더측에서, 인코더측으로부터, 주파수 영역의 동화상 신호의 필터링에 이용되는 필터 데이터를 취득한다. 그 후, 취득된 필터 데이터에 의거하여 필터를 설정한다. 인코더측으로부터 필터 데이터를 취득함으로써, 디코더는, (부호화 전의) 원 동화상 신호에 관한 정보 등의, 인코더만이 입수 가능한 정보를 취득할 수 있고, 따라서, 그러한 정보에 따라서 필터를 설정할 수 있다.
바람직하게는, 본 발명의 부호화는 또한, 공간 영역에 있어서 입력 동화상 신호를 공간적 또는 시간적으로 예측하고, 예측 신호를 얻는 것을 포함한다. 예측 오차 신호는, 입력 동화상 신호와 예측 신호의 차분으로서 취득된다. 본 발명의 실시 형태에 의하면, 변환된 동화상 신호는 변환된 예측 오차 신호에 대응하고, 필터 데이터는 주파수 영역으로 변환된 예측 오차 신호에 의거하여 결정되고, 변환된 예측 오차 신호에 필터링이 적용된다. 또는, 예측 신호와 (양자화) 예측 오차 신호의 합이며, 주파수 영역으로 변환된 재구축 동화상 신호에 의거하여, 필터 데이터가 결정된다.
바람직하게는, 부호화는, 변환된 동화상 신호를 양자화하는 것을 더 포함하고, 필터 데이터는, 양자화 전과 후에, 주파수 영역으로 변환된 동화상 신호에 의거하여 산출된 상관 정보 또는 필터 계수를 포함한다. 특히, 상관 정보는, 양자화 전과 후의 주파수 영역의 동화상 신호의 상호 상관 벡터여도 되고, 또는 양자화 전과 후의 주파수 영역의 동화상 신호간의 차분에 의해 생기는 양자화 노이즈의 자기 상관이어도 된다. 그러한 정보는, 인코더 및/또는 디코더에 있어서, 예를 들면 위너 필터 계수와 같은, 필터 계수의 산출에 유리하게 이용해도 된다. 그러나, 계수는 또한, 직접적으로 디코더에 제공되어도 된다. 필터 계수는, 위너 필터링의 경우와 같이 평균 제곱 오차를 최소화하는 것보다도, 다른 최적화의 과제를 해결하는 것에 의거하여 예측되어도 된다. 필터는, 입력 신호만에 가중되는 유한 임펄스 응답 필터나, 또는 출력 신호에도 가중되는 무한 임펄스 응답 필터여도 된다.
본 발명의 다른 실시 형태에 의하면, 당해 부호화는 또한, 필터 데이터에 의거하여 동화상 신호를 필터링하는 필터를 설정하는 것과, 주파수 영역에 있어서 필터에 의해 동화상 신호를 필터링하는 것을 포함한다. 특히, 인코더로 실행되는 필터링은, 예측 루프 내에서 적용된 루프 필터링이어도 된다. 그러나, 필터링은 반드시 인코더로 실행된다고는 할 수 없다. 부호화는, 디코더에 제공되는 필터 데이터를 결정하는 필터 설계만을 포함해도 된다. 그 후, 디코더는 그에 따라 자기의 필터를 설정하고, 포스트 필터링 등의 필터링을 실행한다. 바람직하게는, 인코더에 있어서의 필터링도, 블록 단위로 적용된다. 특히, 루프 필터의 경우, 인코더에 있어서 적용된 필터링과, 디코더에 있어서 적용된 필터링은, 동일한 필터 데이터에 의거하고 있어, 유사하다.
그러나, 본 발명의 복호 메커니즘은, 루프 필터링과 포스트 필터링의 양쪽을 포함해도 된다. 그에 대응하여, 필터 데이터는, 인코더에 있어서 루프 필터와 포스트 필터의 양쪽에 이용하기 위해서 결정되어, 공급되어도 되고, 루프 필터링은 또한, 인코더와 디코더에서 동일하게 실행되어도 된다. 특히, 루프 필터는 디블로킹 필터링도 실행해도 된다. 그러나, 루프 필터는 또한, 기존의 디블로킹 필터에 추가하여 동작해도 되고, 디블로킹 필터를 사용할 필요가 전혀 없어도 된다.
본 발명의 다른 실시 형태에 의하면, 디코더는, 주파수 영역으로 변환된 예측 오차 신호를 인코더측에서 취득하고, 이를 공간 영역으로 역변환한다. 또한, 공간 영역의 동화상 신호는, 인코더측에서 받은 부호화 데이터에 의거하여, 예측 신호에 의해 공간적 또는 시간적으로 예측된다. 그 후, 재구축 동화상 신호는, 공간 영역의 예측 오차 신호와 예측 신호의 합으로서 산출된다. 바람직하게는, 주파수 영역으로 변환된 재구축 신호나, 주파수 영역에 있어서의 취득된 예측 오차 신호 중 어느 하나인 동화상 신호에 필터링을 적용한다.
필터 데이터는, 필터 계수, 및/또는 주파수 영역의 동화상 신호의 오프셋을 직접적으로 포함해도 된다. 바람직하게는, 필터 데이터는 각 슬라이스, 특히 슬라이스 헤더 내에 제공된다. 그러나, 필터 데이터는, 다른 정기적 또는 부정기적인 시간 간격이나, 예를 들면, 픽처 단위, 매크로 블록 단위, 블록 단위, 또는, 그러한 픽처 요소의 몇개 단위로 제공되어도 된다. 필터 데이터는, 스토리지에 격납되거나, 부호화 동화상 신호와 함께 전송 채널을 통해서 송신됨으로써 제공된다.
설계 및 필터링은, 선택된 주파수만에 대하여 실행되어도 된다. 특히, 필터링은 DC 주파수 성분에만 적용되어도 된다.
본 발명의 다른 실시 형태에 의하면, 주파수 영역의 필터링은, 필터링에 이용된 동일 주파수의 변환 계수의 평가에 의거하여 무효로 된다. 특히, 계수의 분산이, 역치와 비교된다. 역치는 고정되어 있어도 되고, 또는, 예를 들면 양자화 설정에 의거하여 동적으로 결정되어도 된다. 계수간의 차분과 같은, 다른 평가 기준이 이용되어도 된다.
본 발명의 필터링은, 바람직하게는, 필터링되는 대상 블록에 인접하는 다른 블록에 있어서의 동일 주파수의 변환 계수에 가중된다. 구체적으로는, 인접 블록은, 공간적으로 인접하는 블록이며, 대상 블록을 둘러싸는 복호가 끝난 블록이다. 또는, 혹은 그에 추가하여, 인접 블록은, 시간적으로 인접하는 블록이며, 대상 블록에 대응하는 다른 프레임(타임 인스턴트) 내의 블록이다. 바람직하게는, 그 대응은 움직임 예측을 이용하여 결정된다. 그러나, 프레임 내에서 대상 블록과 동일한 위치에 있는 블록이 이용되어도 되고, 선행 및/또는 후속 프레임의 다른 블록이 이용되어도 된다.
바람직하게는, 동화상 신호는 H.264/MPEG-4 AVC 표준 규격에 의거하여 부호화 및/또는 복호되고, 필터 데이터는 보조적 확장 정보 메시지 내에 제공된다. 그러나, 본 발명은 H.264/MPEG-4 AVC나, 그 확장판이나 후속 규격에 한정되는 것은 아니고, 표준화 또는 특허화된 모든 동화상 부호화 메커니즘에 이용되어도 된다.
본 발명의 또 다른 실시 형태에 의하면, 예측 신호와, 양자화 예측 오차 신호와, 재구축 신호가, 필터링의 프로세스에 있어서, 즉, 인코더에서 필터 데이터를 결정할 때, 및/또는 디코더에서 필터를 설정할 때에 따로따로 고려된다. 또는, 예측 신호 또는 예측 오차 신호만이 필터링된다. 2차 이상의 필터를 이용하는 필터링을 실행하는 목적으로, 예측 신호 및/또는 이미 필터링된 블록의 예측 오차 신호가, 메모리에 격납된다.
본 발명의 다른 양태에 의하면, 본 발명을 실행하도록 적응한, 컴퓨터 판독 가능한 프로그램 코드를 실장한 컴퓨터 판독 가능 매체를 구비하는 컴퓨터 프로그램 제품이 제공된다.
본 발명의 다른 양태에 의하면, 인코더측에서 디코더측으로 동화상 신호를 송신하기 위한 시스템이 제공된다. 이 시스템은, 상술의 인코더와, 부호화 동화상 신호를 격납 또는 송신하기 위한 채널과, 상술의 디코더를 구비한다. 본 발명의 실시 형태에 의하면, 이 채널은 기억 수단에 상당하고, 예를 들면, 휘발성 또는 비휘발성의 메모리나, CD, DVD 또는 BD와 같은 광학 또는 자기 기억 수단, 하드 디스크, 플래시 메모리, 또는 그 외의 기억 수단이다. 본 발명의 다른 실시 형태에 있어서, 채널은 전송 수단이다. 이는, 인터넷, WLAN, UMTS, ISDN, xDSL 등의 표준화 또는 특허화된 전송 기술/시스템에 준거한, 무선 시스템, 유선 시스템, 또는 그 양쪽의 조합인 리소스에 의해 형성 가능하다.
본 발명의 목적 및 특징은, 상기 이외의 것도 포함하고, 부수되는 도면을 참조하면서 이하에 설명되는 기술 및 바람직한 실시 형태에 의해 더욱 명확해진다.
본 발명에 의하면, 부호화의 과정에서 중첩된 노이즈를, 적절하게 제거하는 것이 가능해진다.
도 1은 종래의 H.264/MPEG-4 AVC 비디오 인코더를 나타내는 블록도이다.
도 2는 종래의 H.264/MPEG-4 AVC 비디오 디코더를 나타내는 블록도이다.
도 3은 위너 필터 설계를 나타내는 개략도이다.
도 4는 디블로킹 필터의 대신에, 위너 필터를 구비하는 비디오 인코더를 나타내는 블록도이다.
도 5는 디블로킹 필터의 보충으로서 위너 필터를 구비하는 비디오 인코더를 나타내는 블록도이다.
도 6은 예측 신호, 양자화 예측 오차 신호 및 복호 신호를 수반하는 입력 신호를 따로따로 고려함으로써 설계된 포스트 필터를 구비하는 비디오 인코더를 나타내는 블록도이다.
도 7은 취득된 포스트 필터 정보를 이용하여 설정된 포스트 필터를 구비하는 비디오 디코더를 나타내는 블록도이다.
도 8은 종래의 동화상 복호 장치의 예를 나타내는 블록도이다.
도 9a는 평행 이동 불변 변환의 블록도이다.
도 9b는 비선형 노이즈 제거 필터의 블록도이다.
도 10은 평행 이동 불변 변환 결과의 예를 나타내는 도면이다.
도 11a는 원화상 신호(x)에 평행 이동 불변 변환을 적용한 예를 나타내는 도면이다.
도 11b는 재구축 신호(y)에 평행 이동 불변 변환을 적용한 예를 나타내는 도면이다.
도 12는 비선형 노이즈 제거 필터의 처리를 나타내는 도면이다.
도 13은 주파수 영역에 더해진 노이즈를 수반하는 부호화 시스템의 예를 나타내는 개략도이다.
도 14는 주파수 영역에 더해진 노이즈와 공간 영역에 적용된 필터링을 수반하는 부호화 시스템의 예를 나타내는 개략도이다.
도 15는 공간 영역에 더해진 노이즈와 공간 영역에 적용된 필터링을 수반하는 부호화 시스템의 등가적 예를 나타내는 개략도이다.
도 16은 주파수 영역에 더해진 노이즈와 주파수 영역에 적용된 필터링의 양쪽을 수반하는 부호화 시스템의 예를 나타내는 개략도이다.
도 17은 부호화 시스템의 예에 이용되는 공간 영역이 아니라, 주파수 영역에 있어서 필터링을 설계 또한 적용함으로써 달성되는, 최소 평균 제곱 오차의 삭감을 나타내는 그래프이다.
도 18a는 본 발명의 비디오 인코더를 나타내는 블록도이다.
도 18b는 본 발명의 다른 비디오 인코더를 나타내는 블록도이다.
도 19a는 본 발명의 적합한 실시 형태의 비디오 디코더를 나타내는 블록도이다.
도 19b는 본 발명의 적합한 실시 형태의 다른 비디오 디코더를 나타내는 블록도이다.
도 20a는 주파수 영역에 있어서 인루프 필터를 실시하는 본 발명의 실시 형태의 비디오 인코더를 나타내는 블록도이다.
도 20b는 도 20a에 나타내는 동화상 부호화 장치의 동작을 나타내는 플로우챠트이다.
도 21a는 주파수 영역에 있어서 인루프 필터를 실시하는 본 발명의 실시 형태의 비디오 디코더를 나타내는 블록도이다.
도 21b는 도 21a에 나타내는 동화상 부호화 장치의 동작을 나타내는 플로우챠트이다.
도 22는 본 발명의 인코더 또는 디코더에 적용되는 주파수 영역의 필터링의 예를 나타내는 블록도이다.
도 23은 주파수 영역에 있어서 포스트 필터를 실시하는 본 발명의 다른 실시 형태의 비디오 인코더를 나타내는 블록도이다.
도 24는 주파수 영역에 있어서 포스트 필터를 실시하는 본 발명의 다른 실시 형태의 비디오 디코더를 나타내는 블록도이다.
도 25는 본 발명의 인코더 또는 디코더에 적용되는 주파수 영역의 필터링의 예를 나타내는 블록도이다.
도 26은 주파수 영역에 있어서 루프 필터를 실시하는 본 발명의 비디오 인코더의 예를 나타내는 블록도이다.
도 27은 디블로킹 필터에 추가하여, 주파수 영역에 있어서 루프 필터를 실시하는 본 발명의 비디오 인코더의 예를 나타내는 블록도이다.
도 28은 주파수 영역에 있어서 포스트 필터 설계를 실시하는 본 발명의 비디오 인코더의 예를 나타내는 블록도이다.
도 29는 주파수 영역에 있어서 포스트 필터 설계를 실시하는 본 발명의 비디오 디코더의 예를 나타내는 블록도이다.
도 30은 본 발명의 인코더 또는 디코더에 적용되는 주파수 영역 필터링의 다른 예를 나타내는 블록도이다.
도 31a는 필터링에 이용되어도 되고, 공간적으로 인접하고, 또한 중복하지 않는 블록의 예를 나타내는 개략도이다.
도 31b는 필터링에 이용되어도 되고, 공간적으로 인접하고, 또한 중복해 있는 블록의 예를 나타내는 개략도이다.
도 32a는 필터링에 이용되어도 되고, 시간적으로 인접해 있는 블록의 예를 나타내는 개략도이다.
도 32b는 필터링에 이용되어도 되고, 시간적으로 인접해 있는 블록의 다른 예를 나타내는 개략도이다.
도 33은 주파수 영역에 있어서 예측 신호의 필터링을 실시하는 본 발명의 비디오 인코더의 예를 나타내는 블록도이다.
도 34는 주파수 영역에 있어서 예측 신호의 필터링을 실시하는 본 발명의 비디오 디코더의 예를 나타내는 블록도이다.
도 35는 예측 오차 신호 또는 예측 신호에 필터링이 적용되는, 본 발명의 인코더의 예의 일부분을 나타내는 블록도이다.
도 36은 예측 오차 신호 또는 예측 신호에 무한 임펄스 응답 필터링이 적용되는, 본 발명의 인코더의 예의 일부분을 나타내는 블록도이다.
도 37은 본 발명의 인코더 및 디코더를 구비하는 시스템을 나타내는 개략도이다.
도 38은 본 발명의 부호화 및 복호를 적용함으로써 달성되는 결과를, 기술 수준의 부호화 및 복호와 비교하여 나타내는 그래프이다.
도 39a는 실시의 형태 6에 관련된 변환부의 일예를 나타내는 도면이다.
도 39b는 실시의 형태 6에 관련된 필터부의 처리 플로우의 일예를 나타내는 도면이다.
도 40a는 실시의 형태 6에 관련된 변환부의 다른 예를 나타내는 도면이다.
도 40b는 실시의 형태 6에 관련된 필터부의 처리 플로우의 다른 예를 나타내는 도면이다.
도 41a는 실시의 형태 6에 관련된 변환부의 다른 예를 나타내는 도면이다.
도 41b는 실시의 형태 6에 관련된 필터부의 처리 플로우의 다른 예를 나타내는 도면이다.
도 42는 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템의 전체 구성의 일예를 나타내는 모식도이다.
도 43은 휴대전화의 외관을 나타내는 도면이다.
도 44는 휴대전화의 구성예를 나타내는 블록도이다.
도 45는 디지털 방송용 시스템의 전체 구성의 일예를 나타내는 모식도이다.
도 46은 텔레비전의 구성예를 나타내는 블록도이다.
도 47은 광 디스크인 기록 미디어에 정보의 읽고 쓰기를 행하는 정보 재생 기록부의 구성예를 나타내는 블록도이다.
도 48은 광 디스크인 기록 미디어의 구조예를 나타내는 도면이다.
도 49는 각 실시의 형태에 관련된 화상 부호화 방법 및 화상 복호 방법을 실현하는 집적 회로의 구성예를 나타내는 블록도이다.
본 발명에 의하면, 동화상 신호의 필터 설계 및 필터링은, 공간 주파수의 영역(주파수 영역)에서 실행된다. 또한, 디코더가 적절하게 필터링을 설정할 수 있도록 하는 목적으로, 인코더측에서 입수할 수 있지만 디코더측에서는 입수할 수 없는 정보가, 부호화 동화상 데이터와 함께 제공된다. 본 발명의 디코더에서는, 주파수 영역에 있어서 블록 단위로 필터가 설정되어, 필터링이 적용된다.
동화상 신호를 필터링하는 필터를 설계하는 것과, 주파수 영역에 있어서 필터링을 행하는 것은, 주파수 영역에 노이즈가 더해진 경우에도 특히 이점을 초래한다. 이는 실제, 주파수 영역으로 변환된 동화상 신호를 양자화 및 송신/격납하는 현재의 동화상 부호화 방법의 대부분에 해당한다.
이하에, 공간 영역에서 동작하는 위너 필터와 비교하여, 주파수 영역에서 동작하는 위너 필터의 이점을, 2개의 샘플을 수반하는 1차원 신호를 부호화하는 예시적인 부호화 시스템을 이용하여 나타낸다.
도 13은, 주파수 영역에 있어서의 양자화를 채용하여 고려된 예시적인 부호화 시스템을 나타낸다. 신호(s)가 DCT 변환부(810)에 입력된다. 여기에 적용된 DCT 변환부(810)는, 블록 사이즈가 2의 1차원 이산 코사인 변환(DCT)이다. 따라서, 신호(s)의 2개의 연속된 샘플(s(x)와 s(x+1))은, 그러한 DCT 변환부(810)를 이용하여 주파수 영역으로 변환된다. 그 결과인 2개의 변환 계수(c1 및 c2)는, 하기의 식 6에 의해 얻어진다.
[수학식 6]
Figure pct00006
2개의 변환 계수(c1 및 c2)는, 독립하여 양자화되고, 그 결과, 양자화 변환 계수(c1’ 및 c2’)가 얻어진다. 따라서 양자화 변환 계수(c1’ 및 c2’)는, 변환 계수(c1 및 c2)와, 이 예에 있어서 양자화 노이즈에 대응하는 노이즈(n1 및 n2)의 합으로서 식 7과 같이 나타내도 된다.
[수학식 7]
Figure pct00007
DCT 역변환부(820)는, 양자화 변환 계수(c1’ 및 c2’)에 역DCT 변환을 적용함으로써, 재구축 샘플(s’(x) 및 s’(x+1))을 생성한다. 재구축 샘플(s’(x) 및 s’(x+1))은, 식 8로 나타낸다.
[수학식 8]
Figure pct00008
이산 코사인 변환은 단일 변환이기 때문에, 공간 영역의 평균 제곱 양자화 오차 E[(s-s’)2]는, 변환(주파수) 영역의 평균 제곱 양자화 오차 E[(c-c’)2]와 동일하고, 그 결과는 상기 예에서는 식 9와 같이 된다.
[수학식 9]
Figure pct00009
이하에, 주파수 영역의 위너 필터에 의한 노이즈 삭감을, 공간 영역의 위너 필터에 의한 노이즈 삭감과 비교한다. 비교의 단순성을 유지하기 위해서, 이하와 같이 가정한다. 노이즈의 2개의 성분(n1 및 n2)은, 제로 평균이며, 변환 계수(c1 및 c2)와 페어 단위로도 상관없다. 신호(s)는 제로 평균이며, 적어도 넓은 의미로 정상이다. 이들 가정에 의거하여, 양자화 노이즈 신호의 최초의 2개의 모멘트는 식 10 및 식 11과 같다.
[수학식 10]
Figure pct00010
[수학식 11]
Figure pct00011
또한, 변환 계수(c2)에 적용되는 양자화가 없다고 가정하면, 식 12와 같이 된다.
[수학식 12]
Figure pct00012
각 i=0, 1, 2, …, 에 대한 신호(s)의 성분 s(x+i)=si의 최초의 2개의 모멘트는 식 13 및 식 14와 같다.
[수학식 13]
Figure pct00013
[수학식 14]
Figure pct00014
변환 신호(s) 및 노이즈의 조인트 모멘트는 식 15와 같다.
[수학식 15]
Figure pct00015
신호(s)가 임의의 2개의 연속하는 샘플(si 및 si +1)의 상관 계수는 식 16과 같다.
[수학식 16]
Figure pct00016
노이즈를 삭감하는 위너 필터는, 필터의 길이가 1이며, 1필터 계수만을 가진다. 이 필터 계수는, 공간 영역의 필터링의 경우는 hs로 표시되고, 주파수 영역의 필터링의 경우는 hc로 표시된다. 이들 가정에 의해, 변환 계수(c1 및 c2)의 분산은, 하기의 식 17 및 식 18에 의해 얻어진다.
[수학식 17]
Figure pct00017
[수학식 18]
Figure pct00018
도 14는 주파수 영역의 양자화와, 공간 영역의 1필터 계수를 가지는 노이즈 삭감 위너 필터를 구비하는 대응하는 부호화 시스템을 나타낸다. DCT 변환부(910), 양자화부, 및 DCT 역변환부(920)를 구비하는 부호화 시스템은, 상기 가정을 적용하는 것, 및 공간 영역에 있어서 1개의 필터 계수(hs)만을 가지는 노이즈 삭감을 위한 위너 필터(930)를 이용함으로써 간이화되어 있다. 변환 계수(c1)의 양자화에 의해, 필터링후의 입력 신호(s)와 신호(s’)의 사이의 평균 제곱 오차는, 식 19와 같이 된다.
[수학식 19]
Figure pct00019
도 15에 나타내는 부호화 시스템은, 도 14에 나타내는 부호화 시스템과 등가이다. 제로 평균의 노이즈 신호(nq), 분산 σ2 q=(σ2 n/2), 및 상관 E[s·nq]=0은, 주파수 영역에 삽입되는 노이즈(n1)와 등가이며, 공간 영역의 신호(s)에 추가된다.
입력 신호(s)와 필터링 후의 신호(s”)의 사이의 평균 제곱 오차를 최소화하는 필터 계수(hs)는, E[(s-s”)2]→min을 의미하는데, 식 20의 미분 함수를 제로로 설정함으로써 산출할 수 있다.
[수학식 20]
Figure pct00020
상기 식 20의 해에 의해, 식 21과 같이, 평균 제곱 오차를 최소화하는 필터 계수(hs)의 최적값을 얻는다.
[수학식 21]
Figure pct00021
신호(s)와, 공간 영역의 필터 계수(hs)의 최적값을 이용하여 노이즈 삭감 위너 필터링을 행한 후의 신호(s”)의 사이의 대응하는 최소 평균 제곱 오차는, 하기의 식 22에 의해 얻어진다.
[수학식 22]
Figure pct00022
도 16은, DCT 변환부(1110)의 후에 주파수 영역에 있어서 양자화를 적용하고, 또한, 변환후에(주파수 영역에 있어서), 1개의 계수(hc)를 가지는 노이즈 삭감을 위한 위너 필터(1130)를 적용하는 부호화 시스템을 나타낸다. DCT 역변환부(1120)는, 위너 필터(1130)로부터 출력되는 신호(c1”)에 대하여 실행된다.
변환 계수(c1)의 양자화에 의해, 또한 상기와 동일한 가정에 의거하여, 변환 계수(c1)와 변환 양자화 신호(c1’)의 사이의 평균 제곱 오차는, σ2 n이다.
필터링 후의 변환된 신호(c1)와 변환된 양자화 신호(c”)의 사이의 평균 제곱 오차를 최소화하는 위너 필터(1130)의 필터 계수(hc)는, E[(c1-c1”)2]→min을 의미하는데, 식 23의 미분항을 제로로 설정함으로써 산출할 수 있다.
[수학식 23]
Figure pct00023
상기 식 23의 해답에 의해, 평균 제곱 오차를 최소화하는 필터 계수(hc)의 최적값은, 식 24와 같이 표시된다.
[수학식 24]
Figure pct00024
신호(c1)와, 최적의 필터 계수(hc)를 이용하여 위너 필터로 필터링을 행한 후의 신호(c1”)의 사이의 대응하는 최소 평균 제곱 오차는, 하기의 식 25에 의해 얻어진다.
[수학식 25]
Figure pct00025
따라서, 신호(s)와, 주파수 영역의 노이즈 삭감을 위한 위너 필터(1130)에 의한 신호(s”)의 사이의 최소 평균 제곱 오차는, 식 26과 같다.
[수학식 26]
Figure pct00026
도 17은, 상기 예에 있어서의, 공간 영역의 필터링으로부터 생기는 최소 평균 제곱 오차와, 주파수 영역의 필터링에서 생기는 최소 평균 제곱 오차의 비교이다. 당해 그래프는, 식 27을 그래프화한 것이다.
[수학식 27]
Figure pct00027
보다 구체적으로는, 주파수 영역의 신호(c1’)에 적용되는 위너 필터(1130)에 의해 달성되는 최소 평균 제곱 오차의 삭감을, 상관 계수(ρ)의 값과, 신호(s)의 분산에 의해 정규화된 양자화 노이즈(n1)의 분산에 관해서, 공간 영역의 신호(s’)에 적용되는 위너 필터(930)와 비교하여 나타낸 것이다.
이 예에 관한 그래프로부터 알 수 있듯이, 상관 계수(ρ)가 1과 같지 않고, 양자화 노이즈의 분산이 제로보다도 큰 경우는 항상, 평균 제곱 오차를 삭감할 수 있다. 따라서, 2개의 샘플을 가지는 1차원 신호에 관한 이 예는, 노이즈가 삽입된 영역의 필터링을 행함으로써, 평균 제곱 오차를 삭감하는 결과로 되는 것을 나타낸다.
이들의 고려에 의거하여, 본 발명은, 필터 설계 및 필터링이 주파수 영역에서 실행되는, 동화상 부호화 장치 및 동화상 복호 방법, 및 동화상 신호의 부호화 방법 및 복호 방법을 제공한다.
동화상 부호화 장치측에서, 주파수 영역에 있어서 필터 설계가 실행되고, 주파수 영역의 동화상 신호의 필터링에 이용되는 필터 데이터가 동화상 복호 장치측에 제공된다. 동화상 복호 장치에서는, 필터에 필터 정보가 설정되고, 주파수 영역에 있어서 블록 단위로 적용된다.
동화상 부호화 장치와 동화상 복호 장치에서 유사 동작을 보증하는 목적으로, 본 발명의 적합한 실시 형태에 의하면, 필터 정보가 부호화 동화상 데이터와 함께, 동화상 부호화 장치에 공급된다. 동화상 복호 장치는, 당해 필터 정보를 취득하고, 그에 따라 필터 특성을 설정할 수 있다.
도 18a 및 도 18b는, 본 발명의 동화상 부호화 장치(1300A, 1300B)를 개략적으로 도시하는 것이다. 동화상 부호화 장치(1300A)는, 동화상 신호(1301)를 주파수 영역으로 변환하는 변환부(1310)와, 주파수 영역으로 변환된 동화상 신호(1311)에 의거하여 필터 정보(1331)를 생성하는 필터 설계부(1330)를 구비한다.
여기에서 동화상 신호(1301)란, 화소값, 또는 예측 부호화가 적용되는 경우는 예측 오차값과 같은 2차원 신호를 가리킨다. 동화상 신호를 주파수 영역으로 변환하는 변환은, 푸리에 변환, 이산 코사인 변환, KL(Karhunen-Loeve) 변환, 또는 그러한 변환의 고속 및/또는 정수판 등의 임의의 변환일 수 있다.
그 후, 주파수 영역으로 변환된 동화상 신호(1311)는, 주파수 영역의 동화상 신호의 필터링에 이용되는 필터 정보(1331)를 결정하는 필터 설계부(1330)에 이용된다. 그러한 필터 정보(1331)는, 필터 계수 및/또는 주파수 영역의 동화상 신호의 오프셋이어도 된다. 그러나, 그러한 필터 정보(1331)은 또한, 필터 계수의 산출 및/또는 필터의 설정에 이용할 수 있는 주파수 영역으로 변환된 동화상 신호에 관련된 임의의 통계적 정보여도 된다. 필터 정보(1331)는 또한, (변환, 또는 필터 설계부(1330)의 일부로서) 양자화가 변환 후에 적용되는 경우는, 양자화 및 비양자화 변환 계수에 의거하여 결정되어도 된다.
그 후, 필터 정보(1331)는, 동화상 복호 장치측에 제공된다. 여기에서, 동화상 복호 장치측에 필터 정보(1331)를 제공하는 이점은, 동화상 복호 장치 자체를 취득할 수 없는 필터 설정을 위한 정보를, 동화상 복호 장치에 제공할 수 있는 가능성이 있는 것이다. 그러한 정보는, 예를 들면, 어떠한 불가역 압축이 행해지기 전의 동화상 신호에 관련된 정보이다.
필터 정보(1331)와, 주파수 영역으로 변환된 동화상 신호(1311)의 양쪽이, 다시 부호화되어도 된다. 필터 설계부(1330)는 또한 바람직하게는, 본 발명의 특정 실시 형태에 관해서 설명되는 바와같이, 주파수 영역의 부호화 및/또는 압축 동화상 신호를 이용하여 필터 정보(1331)를 결정한다.
도 18b에 나타내는 동화상 부호화 장치(1300B)는, 주파수 영역으로 변환된 동화상 신호(1311)에 필터 처리를 적용하는 필터(1340)와, 필터 설계부(1330)에서 생성된 필터 정보(1331)를 필터(1340)에 설정하는 필터 설정부(1335)를 더 구비한다.
필터(1340)를 설정하는 것은, 실행되는 필터링 동작을 정의하는 필터 계수, 동화상 신호 오프셋 등의 필터 파라미터를 제공하는 것을 포함한다. 이들 파라미터는, 필터 정보(1331)로부터 취득되거나, 필터 정보(1331) 및 변환된 동화상 신호(1311)에 의거하여 산출되는 중의 하나이다.
도 19a는, 본 발명의 동화상 복호 장치(1400A, 1400B)의 개략적으로 도시하는 것이다. 도 19a에 나타내는 동화상 복호 장치(1400A)는, 주파수 영역의 동화상 신호(1411)에 필터 처리를 적용하는 필터(1440)와, 필터(1440)의 설정을 행하는 필터 설정부(1435)와, 필터(1440)에 의해 필터 처리가 실시된 주파수 영역의 동화상 신호(1411)를 공간 영역의 동화상 신호(1421)로 변환하는 역변환부(1420)를 구비한다.
동화상 복호 장치(1400A)에는, 필터 정보(1431)와, 동화상 신호(1411)가 입력된다. 필터 정보(1431)는, 동화상 부호화 장치측, 예를 들면, 도 18a 및 13b에 나타내는 동화상 부호화 장치(1300A, 1300B) 중의 1개에 의해 제공된다. 필터 정보(1431)는, 주파수 영역의 동화상 신호(1411)의 필터링에 이용되는 필터(1440)의 설정에 이용된다.
동화상 복호 장치(1400B)에 입력되는 동화상 신호(1401)가 주파수 영역에 없으면, 우선, 도 19b에 도시되는 바와같이, 변환부(1410)에서 주파수 영역의 동화상 신호(1411)로 변환되지 않으면 안된다. 필터 설정부(1435)는, 필터 정보(1431)에 추가하여, 주파수 영역으로 변환된 동화상 신호(1411)를 이용하여 필터(1440)의 설정을 행해도 된다.
주파수 영역의 필터링이 끝난 동화상 신호(1441)는, 역변환부(1420)에서 공간 영역으로 역변환되어도 되고, 다시 처리되어도 된다. 그러나, 필터 설정부(1435)는, 필터 정보(1431)를 취득도 고려도 하지 않고 필터(1440)의 설정을 행해도 된다. 필터(1440)에서의 필터 처리는, 블록 단위로 적용된다.
(실시의 형태 1)
도 20a 및 도 20b를 참조하여, 본 발명의 실시의 형태 1에 관련된 동화상 부호화 장치(1500)를 설명한다. 도 20a는, 동화상 부호화 장치(1500)의 기능 블록도이다. 도 20b는, 동화상 부호화 장치(1500)의 동작을 나타내는 플로우챠트이다.
실시의 형태 1에 있어서의 부호화 신호를 생성하는 처리에는, 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여 양자화 계수를 생성하는 처리가 포함된다. 또한, 필터 정보는, 주파수 영역의 예측 오차 신호와, 필터 처리가 적용된 후의 주파수 영역의 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
동화상 부호화 장치(1500)는, 도 20a에 도시되는 바와같이, 감산기(105)와, 변환/양자화부(110)와, 가산기(125)와, 디블로킹 필터(130)와, 역변환부(1520)와, 필터 설계부(1530)와, 필터(1540)와, 엔트로피 부호화부(1590)와, 부호화 신호를 출력하는 출력부(도시 생략)와, 예측 블록 생성부(도시 생략)를 구비한다.
이 동화상 부호화 장치(1500)는, 입력 신호로서의 동화상 신호를 부호화하여, 부호화 신호를 출력한다. 출력처는 특별히 한정되지 않지만, 예를 들면, DVD(Digital Versatile Disc)나 BD(Blu-ray Disc) 등의 기록 매체여도 되고, 전송로를 통해서 동화상 복호 장치(1600)에 전송해도 된다.
감산기(105)는, 부호화 대상 블록(입력 신호)으로부터 예측 블록(예측 신호)을 감산하여 예측 오차 신호를 생성한다. 변환/양자화부(110)는, 예측 오차 신호를 DCT 변환(Discrete Cosine Transformation: 이산 코사인 변환)함과 더불어, 양자화하여 양자화 계수를 생성한다. 엔트로피 부호화부(1590)는, 양자화 계수를 엔트로피 부호화하여 부호화 신호를 생성한다. 또한, 양자화 계수와 함께, 움직임 예측부(165)에서 생성되는 움직임 보상 데이터나 필터 설계부(1530)에서 생성되는 필터 정보(1530) 등을 포함하여 엔트로피 부호화해도 된다.
필터 설계부(1530)는, 필터 계수와, 제1 및 제2의 오프셋값을 포함하는 필터 정보(1531)를 생성한다. 보다 구체적으로는, 주파수 영역으로 변환된 동화상 신호와, 필터(1540)에서의 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록, 각종 필터 정보가 결정된다. 필터 정보(1531)는, 필터(1540)에 제공됨과 더불어, 엔트로피 부호화부(1590)를 경유하여 출력된다. 또한, 출력되는 필터 정보(1531)는, 적어도 필터 계수 및 제2의 오프셋값이 포함되어 있을 필요가 있고, 제1의 오프셋값은 생략할 수 있다.
필터(1540)는, 양자화 후의 주파수 영역의 신호에, 필터 정보를 이용하여 필터 처리를 적용한다. 보다 구체적으로는, 양자화의 과정에서 중첩된 노이즈를, 주파수성분마다 제거하는 처리를 적용한다. 실시의 형태 1에 있어서의 필터(1540)는, 변환/양자화부(110)에서 생성된 양자화 계수를 역양자화한다. 그리고, 역양자화된 신호에 중첩된 노이즈를, 주파수 성분마다 제거한다. 필터 처리의 상세한 것은, 후술한다.
역변환부(1520)는, 필터(1540)에서 필터 처리됨과 더불어 역양자화된 양자화 계수를 DCT 역변환하여 양자화 예측 오차 신호를 생성한다. 가산기(125, 120)는, 양자화 예측 오차 신호와 예측 블록을 가산하여 재구축 신호를 생성한다. 디블로킹 필터(130)는, 재구축 신호로부터 블록 왜곡을 제거하여 복호 신호를 생성한다.
예측 블록 생성부는, 부호화 대상 블록(입력 신호)보다 앞에 부호화된 화상에 의거하여, 당해 부호화 대상 블록을 예측한 예측 블록을 생성한다. 이 예측 블록 생성부는, 메모리(140)와, 보간 필터(150)와, 움직임 예측부(165)와, 움직임 보상 예측부(160)와, 인트라 프레임 예측부(170)와, 스위치(175)에 의해 구성되어 있다.
메모리(140)는, 복호 신호를 일시 기억하는 지연기로서 기능한다. 보다 구체적으로는, 변환/양자화부(110)에서 양자화되고, 또한 역양자화된 블록을 순차적으로 기억하고, 1매의 화상(픽처)을 기억한다. 보간 필터(150)는, 움직임 보상 예측에 앞서 복호 신호의 화소값을 공간적으로 보간한다. 움직임 예측부(165)는, 복호 신호와 다음의 부호화 대상 블록에 의거하여 움직임 예측을 행하고, 움직임 데이터(움직임 벡터)를 생성한다. 움직임 보상 예측부(160)는, 복호 신호와 움직임 데이터에 의거하여 움직임 보상 예측을 행하여, 예측 블록을 생성한다. 인트라 프레임 예측부(170)는, 복호 신호를 화면 내 예측하여 예측 신호를 생성한다. 스위치(175)는, 예측 모드로서 「인트라」모드 및 「인터」모드 중 어느 하나를 선택한다. 그리고, 스위치(175)로부터 출력되는 예측 블록은, 다음 부호화 대상 블록을 예측한 신호로 된다.
다음에, 도 20b를 참조하여, 동화상 부호화 장치(1500)의 동작을 설명한다.
우선, 감산기(105)는, 입력 신호로부터 예측 신호를 감산하고, 예측 오차 신호를 생성한다 (S11). 다음에, 변환/양자화부(110)는, 예측 오차 신호를 DCT 변환함과 더불어, 양자화하여 양자화 계수를 생성한다(S12).
다음에, 필터 설계부(1530)는, 예측 오차 신호와 양자화 계수를 취득하여, 필터 정보(1531)를 생성한다. 보다 구체적으로는, 예측 신호를 주파수 영역으로 변환(DCT 변환)하고, 양자화 계수를 역양자화한다. 그리고, 주파수 영역의 예측 신호와, 역양자화되고, 또한 필터 처리된 후의 신호의 평균 제곱 오차가 최소로 되는 필터 정보(1531)를 생성한다.
다음에, 엔트로피 부호화부(1590)는, 양자화 계수, 움직임 데이터, 및 필터 정보(1531)를 엔트로피 부호화하여 부호화 신호를 생성한다(S14). 또한, 필터 정보(1531)는, 양자화 계수 등과 함께 엔트로피 부호화해도 되고, 이들과는 따로 출력해도 된다. 한편, 엔트로피 부호화부(1590)의 동작과 평행하여, 필터(1540)는, 필터 정보(1530)를 이용하여, 양자화 계수에 필터 처리를 적용한다(S15).
다음에, 역변환부(1520)는, 필터(1540)로부터의 출력 신호를 DCT 역변환하여 양자화 예측 오차 신호를 생성한다. 또한, 가산기(125)는, 양자화 예측 오차 신호와 예측 블록을 가산하여 재구축 신호를 생성한다. 디블로킹 필터(130)는, 재구축 신호로부터 블록 왜곡을 제거하여 복호 신호를 생성한다. 그리고, 예측 블록 생성부는, 복호 신호에 의거하여 예측 블록을 생성한다(S16).
다음에, 도 21a 및 도 21b를 참조하여, 본 발명의 일실시 형태에 관련된 동화상 복호 장치(1600)의 구성 및 동작을 설명한다. 도 21a는, 동화상 복호 장치(1600)의 블록도이다. 도 21b는, 동화상 복호 장치(1600)의 동작을 나타내는 플로우 챠트이다.
실시의 형태 1에 있어서의 부호화 신호는, 동화상 신호가 공간 영역으로부터 주파수 영역으로 변환되고, 양자화되어, 엔트로피 부호화되어 얻어진다. 또한, 복호 신호를 생성하는 처리에는, 부호화 신호를 엔트로피 복호하여 복호 신호로서의 양자화 계수를 생성하는 처리가 포함된다. 또한, 필터 처리에는, 양자화 계수에 필터 처리를 적용함과 더불어, 당해 양자화 계수를 역양자화하는 처리가 포함된다.
동화상 복호 장치(1600)는, 도 21a에 나타내는 바와같이, 부호화 신호를 취득하는 취득부 (취득부)와, 엔트로피 복호부(1690)와, 필터(1640)와, 역변환부(1620)와, 가산기(225)와, 디블로킹 필터(230)와, 예측 블록 생성부(도시 생략)를 구비한다. 이 동화상 복호 장치(1600)는, 도 20a에 나타내는 동화상 부호화 장치(1500)에서 부호화된 부호화 신호를 복호하여 복호 블록(복호 신호)을 생성한다.
엔트로피 복호부(1690)는, 동화상 부호화 장치(1500)로부터 출력된 부호화 신호를 엔트로피 복호하여, 양자화 계수, 움직임 데이터, 및 필터 정보(1691)를 취득한다. 필터(1640)는, 필터(1540)와 마찬가지로, 필터 정보(1691)를 이용하여, 양자화 계수에 필터 처리를 적용한다.
역변환부(1620)는, 필터(1640)로부터 출력되는 신호를 DCT 역변환함으로써, 양자화 예측 오차 신호를 생성한다. 가산기(225)는, 역변환부(1620)로부터 출력되는 양자화 예측 오차 신호와, 예측 블록 생성부에서 출력되는 예측 신호를 가산하여, 재구축 신호를 생성한다. 디블로킹 필터(230)는, 가산기(225)로부터 출력되는 재구축 신호에 대하여 적용되고, 블록의 에지를 평활화하여 주관적 화질을 개선한다.
예측 블록 생성부는, 메모리(240)와, 인트라 프레임 예측부(270)와, 움직임 보상 예측부(260)와, 보간 필터(250)와, 스위치(275)를 구비한다. 이 예측 블록 생성부는, 기본적인 구성 및 동작은 공통되지만, 움직임 예측부(170)를 생략하고, 움직임 데이터를 엔트로피 복호부(1690)로부터 취득하는 점이 다르다.
다음에, 도 21b를 참조하여, 동화상 복호 장치(1600)의 동작을 설명한다.
우선, 엔트로피 복호부(1690)는, 부호화 신호를 엔트로피 복호하고, 양자화 계수, 움직임 데이터, 및 필터 정보(1691)를 취득한다(S21). 다음에, 필터(1640)는, 필터 정보(1691)를 이용하여, 양자화 계수에 필터 처리를 적용한다(S22).
다음에, 역변환부(1620)는, 필터(1640)로부터 출력되는 신호를 DCT 역변환함으로써, 양자화 예측 오차 신호를 생성한다. 다음에, 가산기(225)는, 양자화 예측 오차 신호와 예측 블록을 가산하여 재구축 신호를 생성한다(S23). 또한, 디블로킹 필터(230)는, 재구축 신호로부터 블록 왜곡을 제거한다. 다음에, 예측 블록 생성부는, 예측 블록을 생성한다(S24). 본 발명의 실시 형태에 의하면, 주파수 영역의 필터 설계 및 필터링은, 루프 필터링용에 채용된다. 도 20a 및 도 21a는, 각각, 그러한 동화상 부호화 장치(1500) 및 동화상 복호 장치(1600)의 예를 나타낸다.
(변환된) 예측 오차 신호, 및 대응하는 양자화 변환 계수에 의거하여, 필터 설계부(1530)가, 주파수 필터(1540)가 사용하는 필터 계수를 예측하여, 양자화 변환 계수를 필터링한다. 그 후, 필터 계수는, 부호화를 위해서 새로운 루프 필터 정보(1531) 내의 엔트로피 부호화부(1590)에 제공되어도 된다. 그러나, 필터 계수 그 자체를 제공/부호화할 필요가 없어도 된다.
새로운 루프 필터 정보(1531)는, 대체로, 동화상 부호화 장치(1500)와 유사한 방법으로 동화상 복호 장치(1600)측에 필터를 설정하기 위해서 필요한 정보를 포함해야 한다. 이는, 동화상 복호 장치(1600)가 필터 계수를 결정할 수 있도록 하는 어떠한 정보여도 된다.
엔트로피 부호화부(1590)는, 지수 골롬, 골롬, 유니터리 부호, 또는 부호화되는 새로운 루프 필터 정보의 특정 통계를 고려하여 설계된 부호 등의 정수 가변 길이 부호를 이용해도 된다. 부호화된 새로운 루프 필터 정보는, 그 후, 다른 부호화 동화상 데이터와 함께 동화상 복호 장치(1600)측에 제공된다. 동화상 부호화 장치(1500)에 있어서의 필터링이 끝난 변환 계수는, 역변환부(1520)에서 역변환되어, 필터링이 끝난 양자화 예측 오차 신호가 취득된다.
동화상 복호 장치(1600)에 있어서, 새로운 루프 필터 정보(1691)가, 엔트로피 복호부(1690)에 의해 복호되어, 필터 설계 및 필터 처리를 실행하는 필터(1640)에 제공된다. 필터 설계는, 필터 계수가 동화상 부호화 장치(1500)로부터 직접 제공되지 않을 경우에, 새로운 루프 필터 정보에 의거하여 필터 계수를 산출하기 위해서 필요하다. 필터(1640)는, 그와같이 산출된 필터 계수를 이용하여 설정되거나, 또는 필터 계수 및 새로운 루프 필터 정보(1691) 내에서 취득된 다른 필요한 데이터를 취득한 엔트로피 복호부(1690)로부터 직접 설정된다.
그 후, 양자화 변환 계수가 필터(1640)에 의해 필터링되고, 역변환부(1620)에 의해 역변환되어, 대응하는 필터링이 끝난 양자화 예측 오차 신호값이 되고, 또한 예측 신호에 추가하여, 재구축 신호를 얻는다. 재구축 신호는, 예를 들면, 디블로킹 필터(230)에 의해, 다시 필터링되어도 된다.
도 22는, 동화상 부호화 장치(1500) 및/또는 동화상 복호 장치(1600)에 채용된 예시적인 주파수 영역의 필터(1540, 1640)의 상세를 나타낸다. K개의 양자화 변환 계수(c1’, …, ck’)로부터, 각각의 오프셋(o1’, …, ok’)(제1의 오프셋에 상당한다. 이하 동일)이 감산되어, 오프셋없는 변환 계수(c1”, …, ck”)로 된다. 바람직하게는, 오프셋(o1’, …, ok’)은, 각 양자화 변환 계수(c1’, …, ck’)의 평균치 E [c1’], …, E [ck’]에 대응한다.
각 변환 계수(c1”, …, ck”)는, 그 후, 필터(1740)에서 필터링되어, K개의 양자화 변환 계수(c1”’, …, ck”’)로 된다. 또한, 필터(1740)는, 각 변환 계수(c1”, …, ck”) 각각에 대응하는 독립된 필터(1∼K)를 포함한다. 이 필터(1∼K)에는, 각 변환 계수(c1”, …, ck”) 각각에 적응하는 필터 계수가 개별로 설정된다.
필터링 후에, 각각의 오프셋(o1, …, ok)(제2의 오프셋에 상당한다. 이하 동일)의 각각이 K개의 필터링이 끝난 변환 계수(c1”’, …, ck”’)의 각각에 가산된다. 오프셋(o1, …, ok)은, 바람직하게는, 원예측 오차 신호(s)의 변환 계수(c1, …, ck)의 평균값이다. 결과로서 얻어진 변환 계수(1741)는, 역변환부(1520, 1620)에서 역변환된다. 역변환부(1520, 1620)로부터의 출력 신호(e’)는, 필터링이 끝난 양자화 예측 오차값(잔차)에 대응한다.
동화상 부호화 장치(1500)에 있어서, (M개의 필터 계수에 의해 얻어지는) M차의 필터에서 K개의 변환 계수(k=l, …, K)를 필터링하는 필터 계수(wl,k, …, wM,k)가, 예를 들면, 위너 필터로서 산출된다. 동화상 복호 장치(1600)가 동화상 부호화 장치(1500)와 동일한 필터링을 행할 수 있도록 하는 목적으로, 필터 정보(1531)는, 오프셋(o1, …, ok) 및 필터 계수(wl,k, …, wM,k)를 포함한다.
도 22에 나타내는 필터 처리는, 복호 신호를 구성하는 복수의 블록 각각에 대해서, 처리 대상 블록의 각 주파수 성분의 값과, 처리 대상 블록에 시간적 또는 공간적으로 인접하는 블록의 대응하는 주파수 성분의 값을, 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계와, 가중 가산을 실행하기 전의 처리 대상 블록에 대하여, 각 주파수 성분의 값으로부터 제1의 오프셋 값을 감산하는 단계와, 가중 가산한 후의 처리 대상 블록에 대하여, 각 주파수 성분의 값에 필터 정보에 포함되는 제2의 오프셋값을 가산하는 단계를 포함한다.
또한, 가중 계수는, 필터 처리가 적용된 후의 주파수 영역의 처리 대상 블록과, 주파수 영역의 동화상 신호에 포함되는 처리 대상 블록에 대응하는 블록의 평균 제곱 오차가 최소가 되도록 결정되어 있다. 또한, 제1의 오프셋값은, 주파수 영역의 복호 신호에 포함되는 블록 중, 처리 대상 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 산출된다. 또한, 제2의 오프셋값은, 주파수 영역의 동화상 신호에 포함되는 블록 중, 처리 대상 블록에 대응하는 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 산출되어 있다.
보다 구체적으로는, 필터(1540, 1640)는, 양자화가 행해지는 블록 단위의 신호에 대하여 적용된다. 즉, c1’, …, ck’은, 양자화 계수의 각 주파수 성분의 값(즉, k=64)에 상당한다.
필터 처리의 제1의 공정에서는, 양자화 계수의 각 주파수 성분의 값(c1’, …, ck’)으로부터 제1의 오프셋값(o1’, …, ok’)을 감산한다. 이 제1의 오프셋값(o1’, …, ok’)은, 양자화 계수의 각 주파수 성분의 값(c1’, …, ck’)을, 시간적 또는 공간적으로 연속하는 복수의 블록으로부터 추출하여 동일 주파수 성분마다 평균한 값이다.
다음에, 필터 처리의 제2의 공정에서는, 제1의 오프셋값(o1’, …, ok’)이 감산된 후의 양자화 계수(c1”, …, ck”)를 역양자화하여, 필터(1740)를 적용한다. 필터(1740)는, 주파수 성분마다의 필터(1∼K)로 구성되어 있고, 각각에 필터 계수(w1, …, wk)가 제공된다. 또한, 필터 계수(wk)는, M(예를 들면, M=9)개의 가중 계수(w1 ,k, …, wM ,k)로 구성된다. 이 가중 계수는, 처리 대상 블록의 각 주파수 성분의 값과, 처리 대상 블록에 시간적 또는 공간적으로 인접하는 블록의 대응하는 주파수 성분의 값을, 가중 가산하는데도 사용된다.
또한, 이 가중 계수(w1 ,k, …, wM ,k)는, 필터(1740)로부터 출력되는 필터링이 끝난 변환 계수(c1”’, …, ck”’)와, 원예측 오차 신호(s)의 변환 계수(c1, …, ck)로부터 제2의 오프셋값(o1, …, ok)이 감산된 값(c1-o1, …, ck-ok)의 평균 제곱 오차가 최소가 되도록 결정된다.
다음에, 필터 처리의 제3의 공정에서는, 필터링이 끝난 변환 계수(c1”’, …, ck”’)에 제2의 오프셋값(o1, …, ok)이 가산된다. 이 제2의 오프셋값(o1, …, ok)은, 원예측 오차 신호(s)의 변환 계수(c1, …, ck)를, 시간적 또는 공간적으로 연속하는 복수의 블록으로부터 추출하여 동일 주파수 성분마다 평균한 값이다.
필터 계수를 송신하는 대신, 동화상 복호 장치(1600)로 취득할 수 없는 필터 계수 취득에 필요한 정보를 송신해도 된다. 그러한 정보는, 양자화 전의 입력 변환 계수(c1, …, ck)에 관련된 임의의 정보이며, 필터 계수(w1 ,k, …, wM ,k)의 산출에 이용할 수 있다. 위너 필터 설계의 경우, 예를 들면, 입력 변환 계수와 필터링이 끝난 변환 계수의 사이의 상호 상관 벡터, 또는 노이즈의 자기 상관 등이 송신되어도 된다. 부호화 동화상 신호와 함께 오프셋(o1, …, ok)을 제공함으로써, 필터링 후의 화질이 향상된다. 그러나, 오프셋(o1, …, ok)을 제공하지 않고 본 발명을 실시하는 것도 가능하다.
이 예에 있어서, M차의 필터는, 각각의 변환 계수의 필터링에 이용되는 각각의 계수 필터에 대하여 마찬가지다. 그러나, 다른 변환 계수의 필터링에 이용되는 필터 차수가 다르면, 이점이 되는 경우가 있다. 다양한 변환 계수에 대한 특정 필터 차수(M1, …, Mk)는, 그 후, 고정되거나(디폴트 또는 동화상 부호화 장치/동화상 복호 장치에 설정된다), 필터 정보와 함께 신호 송신된다.
(실시의 형태 2)
도 23 및 도 24를 참조하여, 본 발명의 실시의 형태 2에 관련된 동화상 부호화 장치(1800) 및 동화상 복호 장치(1900)를 설명한다. 본 발명의 실시의 형태 2에 의하면, 주파수 영역의 필터 설계 및 필터링은, 재구축 화상/동화상 신호에 대하여 동작하는 포스트 필터에 적용된다. 도 23 및 도 24는, 각각, 이러한 동화상 부호화 장치(1800) 및 동화상 복호 장치(1900)를 나타낸다. 또한, 실시의 형태 1에 관련된 동화상 부호화 장치(1500) 및 동화상 복호 장치(1600)과 공통되는 구성 요소에는 동일한 참조 번호를 붙이고, 상세한 설명을 생략한다.
실시의 형태 2에 관련된 부호화 신호를 생성하는 처리에는, 주파수 영역의 동화상 신호를 양자화하고, 역양자화하여 재구축 신호를 생성하는 처리가 포함된다. 또한, 필터 정보는, 주파수 영역의 동화상 신호와, 필터 처리가 적용된 후의 주파수 영역의 재구축 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
동화상 부호화 장치(1800)는, 도 23에 나타내는 바와같이, 필터 설계부(1530) 및 필터(1540)를 생략하는 대신, 필터 설계부(1830)를 구비하는 점에서 도 20a에 나타내는 동화상 부호화 장치(1500)와 상이하다.
필터 설계부(1830)는, 동화상 복호 장치(1900)의 필터(1940)로 사용되는 필터 정보(1831)를 생성한다. 구체적으로는, 입력 신호와 재구축 신호를 취득하고, 각각을 주파수 영역으로 변환한다. 그리고, 주파수 영역의 입력 신호와, 필터(1940)에서 필터 처리된 후의 주파수 영역의 재구축 신호의 평균 제곱 오차가 최소가 되도록 필터 정보(1831)를 결정한다.
동화상 복호 장치(1900)는, 도 24에 나타내는 바와같이, 필터(1640)를 생략하는 대신, 필터(1940)를 구비하는 점에서 도 6A에 나타내는 동화상 복호 장치(1600)와 상이하다.
실시의 형태 2에 관련된 부호화 신호는, 동화상 신호로부터 예측 신호가 감산되고, 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어진다. 또한, 복호 신호를 생성하는 처리에는, 부호화 신호를 엔트로피 복호하고, 역양자화하여, 주파수 영역으로부터 공간 영역으로 역변환하고, 예측 신호를 가산하여 복호 신호로서의 재구축 신호를 생성하는 처리가 포함된다. 또한, 필터 처리에는, 재구축 신호를 공간 영역으로부터 주파수 영역으로 변환하는 처리와, 주파수 영역의 재구축 신호에 필터 처리를 적용하는 처리와, 필터 처리를 적용한 후의 재구축 신호를 주파수 영역으로부터 공간 영역으로 역변환하는 처리가 포함된다.
필터(1940)는, 가산기(225)로부터 출력되는 재구축 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 주파수 영역의 신호에 대하여 필터 정보(1991)를 이용하여 필터 처리를 적용하고, 필터 처리후의 신호를 주파수 영역으로부터 공간 영역으로 역변환한다.
동화상 부호화 장치(1800) 내에 실장된 주파수 영역의 포스트 필터를 설계하는 필터 설계부(1830)가, 새로운 포스트 필터 정보(1831)를 엔트로피 부호화부(1890)에 제공한다. 여기서, 새로운 포스트 필터 정보(1831)는, 필터 계수를 직접 포함하거나, 동화상 복호 장치(1900)가 포스트 필터 계수를 산출할 수 있도록 하는 임의의 다른 정보를 포함해도 된다.
동화상 부호화 장치(1800)측에 있어서, 포스트 필터링은 예측 루프로 이용되지 않으므로, 적용될 필요는 없다. 필터 설계부(1830)는, 입력 신호와 재구축 신호에 의거하여 제공되는 필터 계수, 또는 다른 관련 정보를 산출한다. 필터 계수는, 예를 들면, 위너 필터 계수로서 예측되어도 되고, 또는 그 대신에, 입력 신호와 재구축 신호의 사이의 상호 상관, 노이즈의 자기 상관, 혹은 노이즈와 신호의 사이의 상관과 같은 통계적 데이터로서 제공되어도 된다.
동화상 복호 장치(1900)에 있어서, 부호화 동화상 데이터와 함께 동화상 부호화 장치(1800)에 의해 제공된 새로운 포스트 필터 정보(1991)는, 엔트로피 복호부(1990)에 의해 복호된다. 필터(1940)는, 새로운 포스트 필터 정보(1991)와 재구축 동화상 신호를 취득할 수 있고, 또한, 필터를 설정하여, 재구축 신호를 필터링할 수 있다.
도 25는, 본 발명의 이 실시 형태에 이용되는 주파수 영역의 예시적인 필터(1940)의 상세를 나타낸다. 재구축 신호(s’)가, 변환부(2010)에서 주파수 영역으로 변환된다. 바람직하게는, 예측 오차의 부호화에, 동화상 부호화 장치(1800)의 변환/양자화부(110)에 있어서의 변환과 동일한 변환 수법이 이용된다. 이에 따라, 소프트웨어 및/또는 하드웨어에 있어서 가능한 실시 양태를 간이화해도 된다. 그러나, 동화상 부호화 장치(1800)에 의한 변환 수법과 다른 변환, 예를 들면 기능 및/또는 사이즈에 의거하는 변환도 이용되어도 된다. 당해 변환은 또한, 필터 설계부(1830)의 일부로서 선택되어도 되고, 선택된 변환은, 부호화 동화상 데이터와 함께 동화상 복호 장치(1900)에 제공되어도 된다. 당해 선택은, 미리 정해진 변환의 세트로부터 실행되어도 되고, 또는, 변환 매트릭스 전체가 결정되어 신호 송신되어도 된다.
변환부(2010)는, 입력 재구축 신호(s’)를 K개의 변환 계수(c1’, …, ck’)로 변환한다. K개의 변환 계수(c1’, …, ck’)로부터, 각각의 오프셋(o1’, …, ok’)(제1의 오프셋값)이 감산되어, 변환 계수(c1”, …, ck”)로 된다. 역시, 오프셋(o1’, …, ok’)은, 바람직하게는, 대응하는 변환 계수(c1’, …, ck’)를, 시간적 또는 공간적으로 인접하는 복수의 블록으로부터 추출하여 평균한 값이다.
오프셋을 감산한 후의 변환 계수(c1”, …, ck”)의 각각은, 필터(2040)에서 필터링되고, K개의 필터링이 끝난 변환 계수(c1’”, …, ck’”)로 된다.
K개의 필터링이 끝난 변환 계수(c1’”, …, ck’”)의 각각에 대하여, 각각의 오프셋(o1, …, ok)(제2의 오프셋값)이 가산된다. 오프셋(o1, …, ok)은, 바람직하게는, 원입력 신호(s)의 변환 계수(c1, …, ck)를, 시간적 또는 공간적으로 인접하는 복수의 블록으로부터 추출하여 평균한 값에 대응한다. 결과로서 얻어진 변환 계수(2041)는, 역변환부(2020)에서 역변환된다. 출력 신호(s”)는, 필터링이 끝난 재구축 화상을 나타낸다.
이미 설명한 본 발명의 실시의 형태 1과 마찬가지로, 필터 계수(w1 ,k, …, wM,k) 및 오프셋(o1, …, ok)은, 바람직하게는, 엔트로피 부호화부(1890)에서 엔트로피 부호화되고, 동화상 부호화 장치(1800)로부터 동화상 복호 장치(1900)에 제공된다. 또한, 변환부(2010) 및/또는 역변환부(2020)에 적용되는 변환 수법을 신호로 전하는 변환 정보가, 동화상 부호화 장치(1800)로부터 동화상 복호 장치(1900)에 송신되어도 된다. 그러한 변환 정보는, 미리 정해진 고정의 세트로 되어 있는 실행 가능한 변환 중의 1개를 지정하는 것이어도 된다. 또는, 변환 및/또는 역변환 매트릭스가 신호 송신되어도 된다. 다른 가능성으로서, 수신한 동화상 데이터에 의거하여 변환을 암시적으로 결정하는 것 등도 실시되어도 된다. 동화상 데이터라고 하는 용어는, 부호화가 끝난 양자화 변환 계수와 함께 송신되는, 동화상 시퀀스를 바르게 복호하기 위해서 필요한 모든 신택스 요소를 가리킨다.
(실시의 형태 3)
도 26 및 도 27을 참조하여, 본 발명의 실시의 형태 3에 관련된 동화상 부호화 장치(2100, 2200)를 설명한다. 본 발명의 실시의 형태 3에 의하면, 주파수 영역의 필터링은, 재구축 동화상 신호에 적용된다. 도 26 및 도 27은, 그러한 동화상 부호화 장치(2100, 2200)의 예를 나타낸다. 또한, 실시의 형태 1에 관련된 동화상 부호화 장치(1500) 및 동화상 복호 장치(1600)와 공통되는 구성 요소에는 동일한 참조 번호를 붙이고, 상세한 설명을 생략한다.
특히, 도 26에 나타내는 동화상 부호화 장치(2100)는, 디블로킹 필터(130)의 대신에 필터 및 설계부(2140)를 구비하는 점에서 도 20a에 나타내는 동화상 부호화 장치(1500)와 상이하다. 필터 및 설계부(2140)는, 필터 설계 및 필터 처리를 실행한다. 필터의 계수는, 입력 동화상 신호(원하는 신호)와 재구축 동화상 신호에 의거하여, 주파수 영역에 있어서 산출된다. 그 후, 필터 정보(2131)가, 부호화를 위해 엔트로피 부호화부(2190)에 제공된다.
도 27에 나타내는 동화상 부호화 장치(2200)는, 디블로킹 필터(130)에 추가하여, 그 후에 동작하는 필터 및 설계부(2230)를 구비하는 점에서 도 20a에 나타내는 동화상 부호화 장치(2200)와 상이하다. 필터 및 설계부(2230)는, 입력(원하는) 동화상 신호와, 재구축 또한 디블로킹된 동화상 신호에 의거하여, 주파수 영역에 있어서 산출된 필터 계수 등의 필터 정보(2231)를, 엔트로피 부호화부(2290)에 제공한다.
또한, 도 26 및 도 27에 나타내는 필터 및 설계부(2140, 2230)는, 예를 들면, 도 23에 나타내는 필터 설계부(1830)와 동일한 방법으로 필터 정보(2131, 2231)를 생성함과 더불어, 도 25에 나타내는 것과 같은 방식으로 필터 처리를 실행한다. 단, 도 27에 나타내는 필터 및 설계부(2230)는, 디블로킹 필터(130)로부터 출력되는 신호를 취득하는 점에서, 가산기(125)로부터 출력되는 신호를 직접 취득하는 도 23 및 도 26의 예와 다르다.
주파수 영역의 루프 필터를 구비하는 동화상 부호화 장치(2100, 2200)에 대응하는 동화상 복호 장치는, 기본적으로, 필터링에 이용되는 동화상 부호화 장치(2100, 2200)와 유사한 기능적 블록을 구비한다. 필터 설계는, 취득된 필터 정보 및/또는 국소적으로 산출된 정보에 의거하여 실행된다. 필터 설정 후, 재구축 동화상 신호는, 주파수 영역에 있어서 필터링된다.
(실시의 형태 4)
도 28∼도 30을 참조하여, 본 발명의 실시의 형태 4에 관련된 동화상 부호화 장치(2300) 및 동화상 복호 장치(2400)를 설명한다. 본 발명의 실시의 형태 4에 의하면, 예측 신호와, 양자화 예측 오차 신호와, 재구축 신호가, 필터링(설계)의 프로세스에 있어서 따로따로 고려된다. 도 28은, 동화상 부호화 장치(2300)의 기능 블록도이다. 도 29는, 동화상 복호 장치(2400)의 기능 블록도이다. 도 30은, 실시의 형태 4에 관련된 필터링의 프로세스의 예를 나타낸다. 또한, 실시의 형태 1에 관련된 동화상 부호화 장치(1500) 및 동화상 복호 장치(1600)와 공통되는 구성 요소에는 동일한 참조 번호를 붙이고, 상세한 설명을 생략한다.
실시의 형태 4에 관련된 부호화 신호를 생성하는 처리에는, 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 역양자화하며, 주파수 영역으로부터 공간 영역으로 변환하여 양자화 예측 오차 신호를 생성하고, 양자화 예측 오차 신호에 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 또한, 필터 정보는, 주파수 영역의 예측 신호, 주파수 영역의 양자화 예측 오차 신호, 및 주파수 영역의 재구축 신호에 의거하여, 주파수 영역의 예측 오차 신호와, 필터 처리가 적용된 후의 주파수 영역의 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
도 28에 나타내는 동화상 부호화 장치(2300)는, 입력(원하는) 동화상 신호, 예측 신호, 양자화 예측 오차 신호, 및 복호(재구축 또한 디블로킹된) 동화상 신호에 의거하여 주파수 영역의 필터 정보(2331)를 결정하는 필터 설계부(2330)를 구비하는 점에서 도 20a에 나타내는 동화상 부호화 장치(1500)와 상이하다. 필터 정보(2331)는, 엔트로피 부호화부(2390)에 제공된다.
필터 설계부(2330)는, 주파수 영역의 예측 오차 신호와, 필터(2440)에서 필터 처리가 적용된 후의 주파수 영역의 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록, 필터 정보(2331)를 결정한다.
도 29에 나타내는 동화상 복호 장치(2400)는, 동화상 부호화 장치(2300)에 대응하는 동화상 복호 장치(2400)를 나타낸다.
엔트로피 복호부(2490)는, 필터 정보(2491)를 복호하고, 이를 필터(2440)에 제공한다. 필터(2440)는 포스트 필터를 설정하고, 이를 재구축 신호에 적용한다. 여기에서, 필터의 설정은 또한, 특히, 필터 계수 대신에, 필터 계수의 산출에 필요한 정보가 제공되는 경우에, 동화상 부호화 장치(2300)측에서의 필터 설계부(2330)와 유사 필터 설계도 포함해도 된다.
필터 설계부(2440)는, 양자화 예측 오차 신호, 예측 신호, 및 재구축 신호를 공간 영역으로부터 주파수 영역으로 변환한다. 그리고, 주파수 영역으로 변환된 각 신호의 서로 대응하는 블록에 포함되는 동일 주파수 성분의 값마다, 필터 정보(2491)를 이용하여 필터 처리를 적용한다.
도 30은, 동화상 복호 장치(2400)의 필터(2440)의 상세를 나타내는 도면이다.
이 예에 있어서의 부호화 신호는, 동화상 신호로부터 예측 신호가 감산되어 예측 오차 신호가 생성되고, 당해 예측 오차 신호가 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어진다. 또한, 복호 신호를 생성하는 처리에는, 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하여 양자화 예측 오차 신호를 생성하고, 양자화 예측 오차 신호와 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 또한, 필터 처리는, 복호 신호로서의 양자화 예측 오차 신호, 예측 신호, 및 재구축 신호의 서로 대응하는 블록에 포함되는 동일 주파수 성분의 값을 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함한다. 또한, 가중 계수는, 주파수 영역의 예측 오차 신호와, 필터 처리가 적용된 후의 주파수 영역의 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
이 필터(2440)에서는, 예측 신호(s^), 양자화 예측 오차 신호(e’), 및 재구축 신호(s’)가 필터링에 있어서 따로따로 고려된다.
양자화 예측 오차 신호(e’)의 변환 계수(c1 ,e’’, …, ck ,e’’)를, 시간적 또는 공간적으로 인접하는 복수의 블록으로부터 추출하여 평균한 값과, 원예측 오차 신호(e)의 변환 계수(c1, …, ck)를, 시간적 또는 공간적으로 인접하는 복수의 블록으로부터 추출하여 평균한 값을 조정하는 목적으로, 도 22를 참조하여 이미 간결하게 설명한 바와 같이, 평균 조정이 행해진다.
이 목적을 위하여, 오프셋(o1 ,e’’, …, ok ,e’’)이, ok ,e’’=E[ck ,e’’]로서 산출된다. 단, k=1, …, K이다. 오프셋(o1, …, ok)이, ok=E[ck]로서 산출된다. 단, k=1, …, K이다. 여기서 산출이란, 양자화 예측 오차 신호(e’)의 평균과, 원예측 오차 신호(e)의 평균을, 예를 들면 복수의 대응하는 샘플로 넘어가는 평균으로서 예측하는 것을 가리킨다.
주파수 영역의 각 변환 계수에 대한 K개의 필터 설계의 최적화 기준은, 원하는 신호(c1-o1, …, ck-ok)와의 사이의 최소 평균 제곱 오차이며, 이 원하는 신호는, 오프셋 신호(o1, …, ok)없는 원예측 오차 신호(e)의 변환 계수, 및 필터링이 끝난 신호(c1”’, …, ck”’)에 대응한다. 선형 필터링이, 식 28과 같이 실행된다.
[수학식 28]
Figure pct00028
여기에서, w1 ,k, …, wM ,k는, 주파수 영역의 K개의 필터의 M·K 필터 계수이며, 1개의 M차 필터, 즉, 각 주파수 성분에 대하여 M개의 필터 계수를 가지는 필터이다. 그러한 개별 필터의 각각은, 예를 들면, 도 31a 및 도 31b에 나타내는 것과 같은 M블록에 놓여진 동일 주파수 성분의 M개의 변환 계수(ck ,m”)에 가중된다.
특히, 도 31a는, 중복되지 않은 9개의 블록의 배치를 나타내고, 당해 블록의 변환 계수는 필터링에 이용된다. 그러나, 블록간의 상관이 보다 높을 가능성이 있기 때문에, 중복되는 블록의 변환 계수를 이용하는 쪽이 이점이 되는 경우가 있다. 대칭적으로 중복되는 블록의 배치가, 도 31b에 나타난다. 그러나, 당해 블록은, 영역의 사이즈가 다른만큼, 비대칭으로 중복되어도 된다. 중복의 방법은, 예를 들면, 블록의 특성에 따라서 선택해도 된다. 또한, 중복은, 대상 블록에 대하여 단일 화소(또는 서브 픽셀) 단위로 인접 블록을 어긋나게 함으로써 최대화되어도 된다. 그러한 경우는, 필터링이 끝난 신호가 복수 표시되고, 또한 임의로 선택되며, 또한/또는 원하는 필터링이 끝난 화상을 취득하기 위해서 조합되어도 된다.
또는, 필터링에 의해, 시간축에 있어서 대상 블록에 인접하는 동일 주파수의 블록, 즉 선행 및/또는 후속 프레임의 블록에 대응하는 변환 계수에 가중해도 된다. 그러한 인접 블록의 2개의 예를, 각각 도 32a 및 27b에 나타낸다.
도 32a는, 대상 블록(2701)을 포함하는 프레임(2710)을 나타낸다. 시간적으로 대상 블록(2701)에 인접하는 블록(2702)은, 프레임(2710)에 시간적으로 인접하는 프레임(2720)에 있다. 다른 시간적으로 인접하는 프레임으로부터의 다른 시간적으로 인접하는 블록은, M번째의 프레임(2730) 내의 M번째의 블록(2703)까지의 필터링에 고려가능하다. 이 예에 있어서, 시간적으로 인접하는 블록(2701, 2702, …, 2703)은, 동화상 시퀀스의 다른 프레임 내에서 동일한 위치에 위치한다.
도 32b는, 대상 블록(2751)을 가지는 프레임(2750), 및 대상 블록(2751)에 시간적으로 인접하는 블록(2752)을 가지는 프레임(2760)의 다른 예를 나타낸다. 프레임(2750)에 인접하는 프레임(2760) 내의 블록(2752)은, 움직임 예측에 의해 취득된다. 움직임 벡터(2780)는, 프레임(2760)의 최적 블록(2752)이 프레임(2750)의 대상 블록(2751)으로 된 움직임을 나타낸다. 따라서, 이 예에 있어서, 시간적으로 인접하는 블록은, 움직임 예측, 즉 인접 프레임(2760)의 대상 블록(2751)에 대한 최적 블록(2752)을 발견함으로써 취득된 블록이다. 다른 인접 프레임(예를 들면, 프레임(2770))의 블록(예를 들면, 블록(2753))은, 대상 블록(2751)에 대한 최적 블록으로서, 또는 인접 프레임(2760) 내의 블록(2752)과 같은 대상 블록의 다른 인접 블록에 대한 최적 블록으로 되어도 된다.
도 32b에 나타내는 바와같이, 필터링에 이용되는 인접 블록을 결정하기 위해서 움직임 보상을 적용함으로써, 도 32a의 예의 통계보다도 유사한 통계를 가지는 인접 블록의 세트가 얻어진다. 대체로, 필터링에 이용되는 일시적으로 인접하는 블록은, 반드시 직접적으로 인접한 프레임에 있는 것은 아니다. 예를 들면, 차폐의 경우, 인접 프레임으로부터의 블록은, 필터링에 고려할 필요는 없다. 또한, M개의 인접 블록은, 이미 부호화/복호된 프레임으로부터뿐만 아니라, 대상 블록을 포함하는 프레임의 후속 프레임으로부터 선택되어도 된다. M개의 인접 블록은 또한 대상 블록에 시간적으로 인접한 블록과 공간적으로 인접한 블록의 양쪽으로부터 선택되어도 된다.
원하는 신호(c1-o1, …, ck-ok)와, 필터링이 끝난 신호(c1”’, …, ck”’)의 사이의 평균 제곱 오차를 최소화하는 필터 계수(wk ,1, …, wk ,M)는, 식 29의 Wiener―Hopf 방정식의 해답에 의해 결정할 수 있다.
[수학식 29]
Figure pct00029
필터 계수(wk ,1, …, wk ,M)의 계산에는, Wiener―Hopf 방정식에 있어서의 모든 기대되는 값(상관항)의 지식을 요한다. 마찬가지로, 동화상 복호 장치(2400)의 필터(2440)에서 이용되는 필터 정보(2491)는, 동화상 부호화 장치(2300)의 필터 설계부(2330)에서 상기의 방법으로 산출된다. 역시, 재구축 신호(s’)의 변환 계수(c1’, …, ck’)를, 시간적 또는 공간적으로 인접하는 복수의 블록으로부터 추출하여 평균한 값과, 원입력 신호(s)의 변환 계수(c1, …, ck)를, 시간적 또는 공간적으로 인접하는 복수의 블록으로부터 추출하여 평균한 값은, ok’=E[ck’]에 대응하는 오프셋(o1’, …, ok’) 및 ok=E[ck]에 대응하는 오프셋(o1, …, ok)에 의해 조정된다.
여기에서, k=1, …, K이다. 원하는 신호(c1―o1, …, ck―ok)와, 필터링이 끝난 신호(c1”’, …, ck”’)의 사이의 평균 제곱 오차를 최소화함으로써 필터 계수를 취득하면, 역시, 상기와 같은 Wiener―Hopf 방정식의 방식으로 된다.
동화상 부호화 장치(2100, 2200, 2300) 및/또는 대응하는 동화상 복호 장치(2400)의 각 예에 이용되는 필터 설계의 예를 이하에 나타낸다. 필터 설계의 결과는, 예를 들면, 도 30에 나타내는 필터의 설정에 이용되어도 된다.
여기에서, 예측 신호(s^), 양자화 예측 오차 신호(e’) 및 재구축 신호(s’)가 따로따로 고려된다. 대응하는 오프셋(o1 ,s’’, …, ok ,s’’)은 ok ,s’’=E[ck ,s’’]로서 산출되고, 오프셋(o1 ,e’’, …, ok ,e’’)은 ok ,e’’=E[ck ,e’’]로서 산출되고, 오프셋(o1 ,s^’, …, ok ,s^’)은 ok ,s^’=E[ck ,s^’]로서 산출되고, 오프셋(o1, …, ok)은 ok=E[ck]로서 산출된다. 여기에서 k=1, …, K이다.
주파수 영역의 K개의 필터 설계의 최적화 기준은, 역시, 원하는 신호(c1―o1, …, ck―ok)와 필터링이 끝난 신호(c1”’, …, ck”’)의 사이의 최소 평균 제곱 오차이다. 선형 필터링은 식 30과 같이 실행된다.
[수학식 30]
Figure pct00030
여기에서, wk ,s’,1, …, wk ,s’,M은, 재구축 신호에 이용되는 M·K 필터 계수이며, wk ,s^,1, …, wk ,s^,N은, 예측 신호에 이용되는 N·K 필터 계수이며, wk ,e’,1, …, wk,e’,O는, 양자화 예측 오차 신호에 이용되는 O·K 필터 계수이다. 파라미터(M, N 및 O)는 필터의 차수를 나타낸다. 각 필터는, M+N+O 블록의 동일 주파수 성분의 M+N+O 변환 계수(ck ,s’, m”, ck ,s^, n”, ck ,e’, o”)에 가중된다.
원하는 신호(c1―o1, …, ck―ok)와, 필터링이 끝난 신호(c1”’, …, ck”’)의 사이의 평균 제곱 오차를 최소화하는 필터 계수는, 식 31의 Wiener―Hopf 방정식의 방식에 의해 결정할 수 있다.
[수학식 31]
Figure pct00031
여기에서, E[xixj]은, xi와 xj의 사이의 모든 상호 상관항으로 이루어지는 서브 매트릭스를 나타낸다. 주파수 영역에 있어서의 필터 설계 및/또는 필터링은, 선택된 주파수만에 대하여 실행되어도 된다. 예를 들면, DC 계수만이 필터링되어도 된다. 또는, 예를 들면, 최초의 L개의 계수의 세트가 필터링되어도 되고, 필터링 대상의 계수가 동화상의 내용에 의거하여 결정되어도 된다. 특히, 변환 계수의 값이, 필터링을 적용해야 할지 여부를 결정하는 목적으로 평가된다.
이에 따라, 예를 들면, 필터링 대상의 변환 계수치가 대폭 다른 경우에, 필터링을 무효로 할 가능성이 생긴다. 변환 계수치는, 바람직하게는 역치와의 비교에 의거하여 평가된다. 예를 들면, 대상 블록의 변환 계수와, 필터링에 이용되는 다른 블록과의 차분이 산출되고, 이에 의거하여 필터링이 유효 또는 무효로 된다.
계수간의 차분이 역치를 넘으면, 필터링이 무효로 된다. 넘지 않으면, 필터링이 유효로 된다. 이 결정은, 또는, 분산 등의, 가까운 블록 내의 변환 계수의 통계에 의거하여 행할 수 있다. 필터링에 이용되는 가까운 블록에 있어서의 동일 주파수의 변환 계수의 분산이 역치를 넘으면, 필터링이 무효로 된다. 주파수 성분마다의 역치는, 양자화 파라미터에 의거하여 설정되어도 되고, 고정되어도 되고, 부호화 동화상 데이터와 함께 신호 송신되어도 된다.
필터링을 무효로 할 수 있음으로써, 필터링 대상의 블록의 특성이 실질적으로 다른 경우, 예를 들면, 고구배가 있는 경우(공간적으로 인접하는 블록의 에지, 시간적으로 인접하는 블록의 씬(scene) 전환)에, 필터링이 끝난 신호의 질이 향상하는 경우가 있다.
상기의 설명에 있어서, 변환 계수는, 입력 컬러 포맷에 의해 주어진 래스터에 있어서 수직 및 수평으로 샘플링된 통상의 (전형적으로는 사용이 끝난) 매크로 블록을 변환함으로써 얻어지는 것으로서 기재했다. 그러나, 본 발명은, 필터 정보를 결정하는 것, 필터를 설정하는 것, 및, 이 방법으로 취득된 변환 계수를 필터링하는 것에 한정되지 않는다. 변환되는 블록은 또한 예를 들면 45도와 같은 미리 정해진 각도로 회전한 후에 샘플링되어도 된다. 이는, 어떤 특정한 내용을 가지는 블록에 유익해도 된다. 샘플링 및 변환은 모두 반드시 적용된 동화상 코드의 샘플링 및 변환에 대응한다고는 할 수 없다.
또한, 도 31a, 도 31b, 도 32a, 및 도 33을 이용하여 설명한 상기의 방식은, 실시의 형태 4뿐만 아니라, 다른 실시의 형태 1∼3, 5에 있어서의 필터 설계 및 필터 처리에 응용할 수 있다.
(실시의 형태 5)
도 33 및 도 34를 참조하여, 본 발명의 실시의 형태 5에 관련된 동화상 부호화 장치(2800) 및 동화상 복호 장치(2900)를 설명한다. 도 33은, 동화상 부호화 장치(2800)의 기능 블록도이다. 도 34는, 동화상 복호 장치(200)의 기능 블록도이다. 또한, 실시의 형태 1에 관련된 동화상 부호화 장치(1500) 및 동화상 복호 장치(1600)와 공통되는 구성 요소에는 동일한 참조 번호를 붙이고, 상세한 설명을 생략한다.
도 33에 나타내는 동화상 부호화 장치(2800)는, 루프 내에서 주파수 영역의 예측 신호만을 필터링하는 필터(2880)를 구비하는 점에서 도 20a에 나타내는 동화상 부호화 장치(1500)와 상이하다.
실시의 형태 5에 관련된 부호화 신호를 생성하는 처리에는, 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하여, 양자화하고, 역양자화하며, 주파수 영역으로부터 공간 영역으로 변환하여 양자화 예측 오차 신호를 생성하고, 양자화 예측 오차 신호에 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 또한, 필터 정보는, 주파수 영역의 동화상 신호와, 필터 처리가 적용된 후의 주파수 영역의 예측 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
필터 정보는, 주파수 영역의 입력 신호 및 예측 신호에 의거하여 위너 필터 계수로서 예측된다. 필터링이 끝난 예측 신호는, 그 후, 다시 변환/부호화부(110), 및 엔트로피 부호화부(2890)에 공급됨과 더불어, 디블로킹 필터(130)의 전에 재구축에 이용된다. 필터 정보는, 엔트로피 부호화부(2890)에 의해 부호화되어, 동화상 복호 장치(2900)측에 제공된다.
도 34에 나타내는 동화상 복호 장치(2900)는, 주파수 영역의 예측 신호에 필터 처리를 적용하는 필터(2980)를 구비하는 점에서 도 21a에 나타내는 동화상 복호 장치(1600)와 상이하다.
실시의 형태 5에 관련된 부호화 신호는, 동화상 신호로부터 예측 신호가 감산되고, 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어진다. 또한 복호 신호를 생성하는 단계에는, 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하여 양자화 예측 오차 신호를 생성하고, 양자화 예측 오차 신호와 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함된다. 또한, 필터 처리에는, 예측 신호를 공간 영역으로부터 주파수 영역으로 변환하는 처리와, 주파수 영역의 예측 신호에 필터 처리를 적용하는 처리와, 필터 처리가 적용된 후의 예측 신호를 주파수 영역으로부터 공간 영역으로 역변환하는 처리가 포함된다.
엔트로피 복호부(2990)는, 필터 정보를 복호하고, 이들을, 예측 신호의 필터링에 이용하기 위해서 필터(2980)로 보낸다. 예측 신호는, 가산기(225) 및 디블로킹 필터(230)에 이용되기 전에 필터링된다. 예측 신호를 그와 같이 필터링함으로써, 예측 오차를 최소화할 수 있고, 따라서 재구축 동화상의 화질을 더욱 향상시킬 수 있다.
도 35는, 상기의 각 실시의 형태에 관련된 동화상 부호화 장치의 예를 상세하게 나타내는 블록도이다. 다른 (공간적으로 및/또는 시간적으로 인접하는) 블록으로부터의 동일 주파수의 변환 계수에 가중함으로써 필터링을 적용하는 경우, 이들 인접 블록을 기억할 필요가 있다. 필터링이 재구축 동화상 신호에 적용되는 경우, 재구축 동화상 신호는 루프 내에서 메모리(140, 240)에 기억되기 때문에, 추가적인 기억 용량은 필요없다.
그러나, 필터(3030)의 경우, 예를 들면, 예측 신호 또는 예측 오차 신호의 대상 블록(3001), 인접 블록(3002)의 계수값이, 메모리(3020)에 기억되지 않으면 안된다. 필터링이 끝난 신호는, 그 후, 역변환되고, 역변환된 신호(3041)로 되어, 재구축에 사용할 수 있다. 이 예의 인접 블록(3002)은, 이미 부호화/복호된 공간적으로 인접하는 블록이다. 그러나, 대체로, 동화상 시퀀스 내의 다른 위치에 있는 임의의 수의 블록이 이용되어도 된다.
도 36은, 필터(3130)가 무한 임펄스 응답(IIR) 필터링인 다른 예를 나타낸다. 유한 응답 필터링(FIR)과는 달리, IIR 필터는, 입력 신호의 샘플뿐만 아니라 출력(필터링이 끝난) 신호의 샘플에도 가중된다. 따라서, 필터링이 끝난 신호는, 필터링 대상의 신호에 더하여 메모리(3120)에 기억되지 않으면 안된다. 상기 예의 대부분은 FIR 필터링에 관한 것인데, 본 발명은 이에 한정되지 않는다.
FIR 필터는 대체로 설계하기 쉽지만, 주파수 영역에 있어서 IIR 필터링의 쪽이 성능이 좋은 경우가 있다. 대상 블록(3101)의 필터링에 관련된 블록은 대체로, 모두, 이미 필터링이 끝난 인접 블록(3102)이다. 도 36은, 4개의 선행 블록만을 나타낸다. 그러나, 이미 필터링이 끝난 신호에 가중됨으로써, 이론적으로, 모든 이미 필터링이 끝난 블록이 필터링 결과에 공헌한다. 각 블록의 공헌도는, 대상 블록(3101)으로부터의 거리(인접 블록의 선택에 따라, 공간적 및/또는 시간적 거리)와 함께 감소한다.
또한, 도 35 및 도 36을 이용하여 설명한 상기의 방식은, 실시의 형태 5뿐만 아니라, 다른 실시의 형태 1∼4에 있어서의 필터 설계 및 필터 처리에 응용할 수 있다.
본 발명의 상기 실시 형태는, 적용되는 필터의 적응성에 관해서 제한되는 것은 아니다. 동 화상 부호화 장치(1300) 및/또는 동화상 복호 장치(1400)에 채용된 필터는, 동화상 시퀀스마다, 또는 몇개의 동화상 시퀀스에 1회씩 설계되어도 된다. 그러나, 현재의 통계에 필터 설계를 적용시키면, 통상, 화질이 향상된다. 필터 설계는, 예를 들면, 그룹 오브 픽쳐 단위, 화상 단위, 슬라이스 혹은 매크로 블록 단위, 블록 혹은 이러한 화상 요소의 몇개 단위로 정기적으로 실행되어도 된다. 여기에 대응하여, 필터 정보가 같은 규칙성으로 제공(신호 송신)되어도 된다.
그러나, 필터 설계의 실행보다도 낮은 빈도로 필터 정보를 제공하면 이점이 되는 경우가 있다. 특히, 원하는 신호와 필터링이 끝난 신호의 사이의 상호 상관, 또는 노이즈의 자기 상관과 같은, 필터 계수를 산출하기 위한 정보가 제공된 경우, 이 정보는, 필터 계수가 실제로 산출되는 것 보다도 낮은 빈도로 송신되어도 된다. 필터 정보는 갱신되지 않지만, 복호 동화상 변환 계수 및/또는 동화상 신호로부터 취득 가능한, 필터 계수의 산출에 필요한 추가적 정보가 리플레시된다.
필터 설계 및/또는 필터 정보의 신호 송신은 또한 부정기적으로, 예를 들면 동화상 신호의 통계가 대폭 변화되었을 때에 실행되어도 된다. 필터의 국소 적응은, 유럽 출원 제08015661.5호에 개시된 방법과 유사한 방법으로 달성되어도 된다. 당해 출원을 여기에 인용하여, 원용한다. 또한, 양자화 파라미터 및/또는 양자화 매트릭스값과 같은 양자화 설정은, 특정한 주파수 성분에 대한 필터 계수의 결정에 이용되어도 된다.
적응적 필터, 필터 정보, 예를 들면 필터 계수의 경우는, (엔트로피)부호화되어, 보조 정보로서 동화상 복호 장치에 제공된다. H.264/MPEG-4AVC 부호화 방식 또는 그 장래의 확장판 및 후속 규격의 컨텍스트에 있어서, 필터 정보는 바람직하게는, 픽쳐 파라미터 셋트(PPS) NAL 유닛, 또는 시퀀스 파라미터 세트(SPS) NAL 유닛의 슬라이스 헤더 내로 송신된다. 적응적 포스트 필터 방식에서는, 포스트 필터 정보는 또한 SEI(보조 강화 정보)로서 동화상 복호 장치에 송신할 수 있다.
양자화 예측 오차가 필터링의 프로세스에 있어서 (즉, 필터 설계 및/또는 필터링을 위해서) 고려될 때, 그 양자화 예측 오차는 변환 영역에 있어서 이미 이용가능하므로, 반드시 도 30에 나타내는 바와같이 따로따로 변환될 필요는 없다. 그러나, 동화상 부호화 장치에 의해 사용되는 변환/양자화부(110), 및 역양자화/역변환부(120)에 상관없이, 다른 변환 수법이 선택되어도 된다. 그러한 변환 및/또는 역변환은, 동화상 부호화 장치에서 결정되고, 부호화되어, 동화상 복호 장치에 제공되어도 된다.
또한, 필터링의 프로세스(적어도 필터의 설계 및 적용 중의 1개)에 있어서의 변환에 이용되는 블록 그리드는, 반드시 변환/양자화부(110)와 같은 부호화 단계 중의 1개에 있어서의 블록 그리드와 같을 필요는 없다. 필터링의 프로세스에 이용되는 블록 그리드는, 예를 들면, 1개 또는 2개의 픽처 요소(예를 들면 화소) 단위로, 좌측, 우측, 상측 및 또는 하측으로 어긋나도 된다. 다른 어긋남 방법도 가능하다. 필터 설계 및 필터 적용에 이용되는 블록은, 반드시, 부호화에 이용되는 블록과 같은 사이즈일 필요는 없다.
적용된 변환의 수는, 완전한 것을 넘어도 된다. 이는, 변환을 중복하여 이용함으로써, 공간 영역의 픽처 요소보다도 많은 계수가 변환 영역에 있어서 생성되어도 되는 것을 의미한다. 이에 따라, 각 픽처 요소(예를 들면 화소값)에 대하여 2개 이상의 필터링이 끝난 표현을 얻을 수 있을 것이다. 이들은, 최종적인 필터링이 끝난 표현을 얻기 위해서 가중되어도 된다. 이 가중은 또한 적응적이어도 되고, 부호화되어, 동화상 복호 장치에 제공되어도 된다.
상기 동화상 부호화 장치의 예에 적용된 엔트로피 부호화부는, 반드시 같지 않다. 바람직하게는, 필터 정보의 엔트로피 부호화는, 보다 높은 부호화 효율을 달성하기 위해서 당해 필터 정보의 통계에 적응되어도 된다.
본 발명의 실시 형태의 예는, 위너 필터 설계에 초점을 두고 설명했다. 이는, 위너 필터는, 최초의 2개의 통계 모멘트의 지식에 의거하여 용이하게 산출할 수 있기 때문이다. 그러나, 예를 들면 보다 고차(高次)의 통계(예를 들면, 최대 우도(likelihood) 추정)도 고려할 수 있거나, 또는 평균 제곱 오차 이외의 다른 기준이나 측정 기준을 최적화 할 수 있는 다른 필터 설계도 또한 적용해도 된다.
도 37은, 본 발명에 의한, 동화상 부호화 장치(3201)측으로부터 동화상 복호 장치(3203)측으로 동화상 신호를 송신하는 시스템을 설명하는 도면이다. 입력 화상 신호는, 동화상 부호화 장치(3201)에 의해 부호화되어, 채널(3202)에 제공된다. 상술한 바와 같이, 동화상 부호화 장치(3201)는, 본 발명의 임의의 실시 형태에 관련된 동화상 부호화 장치이다.
도 37에 나타내는 동화상 부호화 장치(3201)는, 적어도, 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 부호화 신호를 생성하는 부호화부와, 양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 필터 설계부와, 부호화 신호 및 필터 정보를 출력하는 출력부를 구비한다. 또한, 필터 정보는, 주파수 영역의 동화상 신호와, 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정된다.
한편, 도 37에 나타내는 동화상 복호 장치(3203)는, 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 취득부와, 부호화 신호를 복호하여 복호 신호를 생성하는 복호부와, 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 복호 신호의 주파수 성분마다 제거하는 필터 처리를, 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 필터부를 구비한다. 또한, 필터 정보는, 주파수 영역의 동화상 신호와, 필터 처리가 적용된 후의 주파수 영역의 복호 신호의 평균 제곱 오차를 최소한으로 하기 위한 정보를 포함한다.
채널(3202)은, 격납 수단이나 전송 채널이다. 격납 수단은, 예를 들면, 임의의 휘발성 또는 비휘발성 메모리나, 임의의 자기 또는 광학 매체나, 대용량 격납 수단 등이다. 임의의 전송 시스템이나, 무선 혹은 배선 또는 고정적 혹은 이동가능한, xDSL, ISDN, WLAN, GPRS, UMTS, Internet와 같은 것이나, 표준화 또는 특허화된 시스템의 물리적 리소스에 의해, 전송 채널을 형성해도 된다.
동화상 부호화 장치(3201)측은, 동화상 신호의 부호화 이외에도, 채널(3202)을 통해서 부호화 동화상 신호를 전송하는 포맷 컨버터 및/또는 트랜스미터 등에 의한 입력 동화상 신호의 전 처리나, 부호화 동화상 신호를 기록 매체에 송신하기 위한 어플리케이션을 포함해도 된다. 부호화 동화상 신호는, 채널(3202)을 통하여 동화상 복호 장치(3203)에 의해 취득된다. 상술한 것과 같이, 동화상 복호 장치(3203)는, 본 발명의 실시 형태에 관련된 동화상 복호 장치이다. 동화상 복호 장치(3203)는, 부호화 동화상 신호를 복호한다. 동화상 복호 장치(3203)측은, 동화상 신호의 복호 이외에, 채널(3202)로부터의 부호화 동화상 신호 또는 격납 수단으로부터의 부호화 동화상 데이터를 추출하기 위한 어플리케이션을 수신하는 리시버와, 또한/또는 포맷 변환 등 복호 동화상 신호의 후처리를 행하는 후처리 수단을 더 구비해도 된다.
본 발명의 다른 실시 형태는, 하드웨어 및 소프트웨어를 이용하는, 상술의 다양한 실시 형태의 실시 양태에 관련되는 것이다. 본 발명의 다양한 실시 형태는, 연산 장치(프로세서)를 이용하여 실현되어 실시된다고 알 수 있다. 연산 장치 또는 프로세서는, 예를 들면, 범용 프로세서, 디지털 신호 프로세서(DSP), 어플리케이션용 집적 회로(ASIC), 필드 프로그래머블 게이트 어레이(FPGA), 또는, 프로그래머블 로직 디바이스 등이어도 된다. 본 발명의 다양한 실시 형태는, 이들 장치를 조합시켜서 실시 또는 구체화화되어도 된다.
또한, 본 발명의 다양한 실시 형태를, 프로세서 또는 하드웨어 내에서 직접적으로 실행되는 소프트웨어 모듈을 이용하여 실현해도 된다. 소프트웨어 모듈과 하드웨어의 실시 양태를 조합시키는 것도 가능하다. 예를 들면 RAM, EPROM, EEPROM, 플래시 메모리, 레지스터, 하드디스크, CD-ROM, DVD 등, 임의의 종류의 컴퓨터로 판독 가능한 기억 매체에 소프트웨어 모듈을 격납해도 된다.
H.264/AVC에 의거하는 동화상 부호화 시스템에 관련되어 상술의 예의 대부분을 개요 설명했다. 용어는, 주로, H.264/AVC의 용어에 관련된 것이다. 그러나, H.264/AVC에 의거하는 부호화에 대한 다양한 실시 형태의 용어 및 기술은, 본 발명의 원리 및 생각을, 해당 시스템에 한정하는 것을 의도하지 않는다. H.264/AVC 표준 규격에 준거한 부호화 및 복호에 관한 상세한 설명은, 여기에서 설명한 예시적인 실시 형태에 대한 이해를 깊게 하는 것을 의도하고 있고, 동화상 부호화에 있어서의 프로세스 및 기능을 설명한 특정 실시 양태에 본 발명이 한정되도록 이해되어야하는 것은 아니다. 한편, 여기에서 제안한 개량책은, 동화상 부호화에 있어서 용이하게 응용가능할 것이다. 또한, 본 발명의 컨셉은, JVT에 의해 현재 토의되고 있는 H.264/AVC의 확장 부호화에 있어서도 용이하게 이용가능할 것이다.
도 38은, 본 발명에 의해 달성할 수 있는 이점의 예를 나타내는 그래프이다. 이 그래프는, 공간 해상도가 1920×1080화소, 또한 프레임 레이트가 매초 24프레임의 YUV4:2:0의 색 공간에 있어서의 MPEG 테스트 시퀀스「Dinner」의 부호화에 필요한 비트 레이트에 대한 Y-PSNR(휘도 성분(Y)의 피크 신호 대 노이즈비)을 나타낸다. 본 발명의 부호화 방식이, 포스트 필터가 없는 H.264/MPEG-4AVC와, 유럽 출원 제08012036.3호에 의한, 분리할 수 없는 2차원 위너 포스트 필터에서 확장된 H.264/MPEG-4AVC와 비교된다. 실험은 양자화 가중 행렬(Q매트릭스)을 이용하여 행해졌다. 인트라 부호화 및 4×4변환이 적용되었다.
요약하면, 본 발명에 의한 동화상의 부호화 및 복호는, 주파수 영역에 있어서의 필터 설계 및 필터링을 채용하여, 대응하는 필터를 설정하기 위한 필터 정보를 동화상 부호화 장치측으로부터 동화상 복호 장치측에 제공가능하게 한다. 주파수 영역에 있어서 필터링을 행하는 것은, 주파수 영역에 노이즈도 삽입된 경우에, 예를 들면, 변환 동화상 신호의 양자화에 의거하는 동화상 부호화에 있어서, 특히 이점을 초래한다.
(실시의 형태 6)
다음에, 상기 노이즈 제거 필터의 효율을 향상시킬 목적으로, 도 39a 및 도 39b에 도시하는 바와같은 확장 알고리즘의 플로우를 제안한다. 도 9a 및 도 9b의 알고리즘 플로우와의 차이는, 계수(ci ,k^)로의 위너 필터 연산이다. 위너 필터링의 결과, 계수(ci ,k∼)로 된다. 이들은, 가중 역변환의 계산에 이용된다. 위너 필터 연산은, 식 32에 나타내는 것과 같은 선형 필터이다. 여기에서, 기호 「∼ (틸더)」는, 각각 직전의 문자 위에 붙여지는 기호를 나타내고, 본 명세서에서는, 이하, 기호 「∼ (틸더)」를 동일한 의미로 사용한다.
[수학식 32]
Figure pct00032
상기 식 32에 의하면, 계수(ci ,k∼(j))는, 계수 예측값(ci,k^(j))의 선형 결합의 결과이다. 필터 길이는 L이다. 오프셋(ok(j))을 부가가능하다. 계수(ci ,k∼(j))는 L개의 계수 예측값(ci ,k^(j))의 가중합이다. 각각의 계수 예측값(ci,k^(j))은 현재 블록 또는 현재 블록에 인접하는 블록의 계수이며(도 31a 참조), 주파수 영역으로의 변환에 의해 얻어지는 계수이다. 인접하는 블록은 현재 블록에 오버랩해도 된다(도 31b 참조). 계수(al ,k(j)) 및 오프셋(ok(j))은, 바람직하게는, k=0, …, 2에 의해 나타내는 노이즈 제거 루프의 각각에 대하여 개별의 것이다.
계수(al ,k(j)) 및 오프셋(ok(j))은, 원래의 계수(ci(j))와 필터링이 끝난 계수(ci ,k∼(j))의 사이의 평균 제곱 오차를 최소화함으로써, 동화상 부호화 장치측에서 예측된다. 계수(al ,k(j)) 및 오프셋(ok(j))은, 부호화되어, 동화상 복호 장치측에 송신된다.
계수의 부호화는, 바람직하게는, 다음의 방법으로 예측 부호화를 이용하여 행해진다. k=1, 2일 때 계수(a1 ,k(j))의 각각은 a1 ,k-1(j)에 의해 예측된다. 차분(a1 ,k(j)-a1 ,k-1(j))만이 부호화되어 송신된다. 이 부호화는 고정 길이 부호 또는 가변 길이 부호에 의해 실행되어도 된다.
k=1, 2일 때 오프셋(ok(j))의 각각은 ok -1(j)에 의해 예측된다. 차분(ok(j)-ok-1(j))만이 부호화되어 송신된다. 이 부호화는 고정 길이 부호 또는 가변 길이 부호에 의해 실행되어도 된다.
이 노이즈 제거 필터를 위너 필터와 조합하여, 포스트 필터로서 이용하는 것도 가능하지만, 부호화/복호 루프 내에서는 적용되지 않는다. 이 경우, 보조적 확장 정보(SEI) 메시지를 이용하여 위너 필터 계수를 송신하는 것이 바람직하다.
도 40a 및 도 40b는, 그 외의 확장 알고리즘의 플로우를 나타낸다. 도 39a 및 도 39b에 도시되는 플로우와의 차이는, 위너 필터의 입력 신호는 1개뿐만이 아니라, 2개의 다른 입력 신호가 있는 것이다. 제1의 입력 신호는, 계수 노이즈 제거 연산전의 계수(f1 ,k-1, …, fL ,k-1)이며, 제2의 입력 신호는, 노이즈 제거 연산후의 계수(c1 ,k^, ···, cL ,k^)이다. 위너 필터링의 결과는, 식 33과 같다.
[수학식 33]
Figure pct00033
위너 필터링에의 각각의 입력으로서 2개의 다른 신호(f1 ,k-1, …, fL ,k-1 및 c1,k^,…, cL ,k^)을 이용함으로써, 신호(c1 ,k^,…, cL ,k^)만을 이용하는 경우와 비교하여, 평균 제곱 오차를 보다 작게 할 수 있다. 이 이유는, 양 신호는 원화 신호의 노이즈를 표현한 것이지만, 노이즈는 양 신호에서 다르기 때문이다. 상기 식 33은, 3개의 위너 필터와 1개의 오프셋이 연결된 구성도 포함한다. 노이즈의 표현(f1 ,k-1,…, fL ,k-1 또는 c1 ,k^, …, cL ,k^)은, 각각, 위너 필터링된다. 2개의 결과도, 역시 위너 필터링된다. 그 결과에 대하여, 오프셋이 부가된다. 계수(a1 ,k(j) 및 b1 ,k(j))가 부호화되어 송신된다. 또한, 오프셋(ok(j))이 부호화되어 송신된다. 이 부호화 단계에 관하여, 상기에 설명한 것과 같은 단계 k의 계수와 단계 k-1의 계수의 사이의 예측이, a1 ,k(j), b1 ,k(j), 및 ok(j)에 적용가능하다.
도 41a 및 도 41b는, 그 외의 확장 알고리즘의 플로우를 나타낸다. 이 경우, 계수가 우선 선형 위너 필터에 의해 필터링된다. 그 결과 얻어진 필터링이 끝난 계수는, 다시 비선형 노이즈 제거 필터에 의해 노이즈 제거된다.
또한, 실시의 형태 6에 관련된 처리는, 실시의 형태 1∼5에 관련된 동화상 부호화 장치 및 동화상 복호 장치에 적용할 수 있다.
(실시의 형태 7)
상기 실시의 형태에서 나타낸 화상 부호화 방법 또는 화상 복호 방법의 구성을 실현하기 위한 프로그램을 기억 미디어에 기록함으로써, 상기 실시의 형태에서 나타낸 처리를 독립된 컴퓨터 시스템에 있어서 간단히 실시하는 것이 가능해진다. 기억 미디어는, 자기 디스크, 광 디스크, 광 자기 디스크, IC 카드, 반도체 메모리 등, 프로그램을 기록할 수 있는 것이면 된다.
또한 여기서, 상기 실시의 형태에서 나타낸 화상 부호화 방법 및 화상 복호 방법의 응용예와 이를 이용한 시스템을 설명한다.
도 42는, 컨텐츠 전송 서비스를 실현하는 컨텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 에어리어를 원하는 크기로 분할하고, 각 셀 내에 각각 고정 무선 통신국인 기지국(ex106∼ex110)이 설치되어 있다.
이 컨텐츠 공급 시스템(ex100)은, 인터넷(ex101)에 인터넷 서비스 프로바이더(ex102) 및 전화망(ex104), 및, 기지국(ex106∼ex110)을 통하여, 컴퓨터(ex111), PDA(Personal Digital Assistant)(ex112), 카메라(ex113), 휴대전화(ex114), 게임기(ex115) 등의 각 기기가 접속된다.
그러나, 컨텐츠 공급 시스템(ex100)은 도 42와 같은 구성에 한정되지 않고, 어느 하나의 요소를 조합하여 접속하도록 해도 된다. 또한, 고정 무선 통신국인 기지국(ex106∼ex110)을 통하지 않고, 각 기기가 전화망(ex104)에 직접 접속되어도 된다. 또한, 각 기기가 근거리 무선 등을 통하여 직접 서로 접속되어 있어도 된다.
카메라(ex113)는 디지털 비디오 카메라 등의 동화 촬영이 가능한 기기이며, 카메라(ex116)는 디지털 카메라 등의 정지화상 촬영, 동화상 촬영이 가능한 기기이다. 또한, 휴대전화(ex114)는, GSM(Global System for Mobile Communications) 방식, CDMA(Code Division Multiple Access) 방식, W―CDMA(Wideband-Code Division Multiple Access)방식, 혹은 LTE(Long Term Evolution) 방식, HSPA(High Speed Packet Access)의 휴대전화기, 또는, PHS(Personal Handyphone System)등이며, 어떠한 것이어도 상관없다.
컨텐츠 공급 시스템(ex100)에서는, 카메라(ex113) 등이 기지국(ex109), 전화망(ex104)을 통해서 스트리밍 서버(ex103)에 접속됨으로써, 라이브 전송 등이 가능해진다. 라이브 전송에서는, 사용자가 카메라(ex113)를 이용하여 촬영하는 컨텐츠(예를 들면, 음악 라이브 영상 등)에 대하여 상기 실시의 형태에서 설명한 것 같이 부호화 처리를 행하여, 스트리밍 서버(ex103)에 송신한다. 한편, 스트리밍 서버(ex103)는 요구가 있는 클라이언트에 대하여 송신된 컨텐츠 데이터를 스트림 전송한다. 클라이언트로는, 상기 부호화 처리된 데이터를 복호하는 것이 가능한, 컴퓨터(ex111), PDA(ex112), 카메라(ex113), 휴대전화(ex114), 게임기(ex115) 등이 있다. 전송된 데이터를 수신한 각 기기에서는, 수신한 데이터를 복호 처리하여 재생한다.
또한, 촬영한 데이터의 부호화 처리는 카메라(ex113)로 행해도 되고, 데이터의 송신 처리를 하는 스트리밍 서버(ex103)로 행해도 되고, 서로 분담하여 행해도 된다. 동일하게 전송된 데이터의 복호 처리는 클라이언트에서 행하거나, 스트리밍 서버(ex103)에서 행해도 되고, 서로 분담해 행해도 된다. 또한, 카메라(ex113)에 한정되지 않고, 카메라(ex116)로 촬영한 정지화상 및/또는 동화상 데이터를, 컴퓨터(ex111)를 통하여 스트리밍 서버(ex103)에 송신해도 된다. 이 경우의 부호화 처리는 카메라(ex116), 컴퓨터(ex111), 스트리밍 서버(ex103) 중 어느 하나로 행해도 되고, 서로 분담하여 행해도 된다.
또한, 이들 부호화 처리 및 복호 처리는, 일반적으로 컴퓨터(ex111) 및 각 기기가 가지는 LSI(Large Scale Integration)(ex500)에 있어서 처리한다. LSI(ex500)는, 원 칩이거나 복수 칩으로 이루어지는 구성이어도 된다. 또한, 화상 부호화용 및 화상 복호용의 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 미디어(CD-ROM, 플렉시블 디스크, 하드 디스크 등)에 넣고, 그 소프트웨어를 이용하여 부호화 처리 및 복호 처리를 행해도 된다. 또한, 휴대폰(ex114)이 카메라 부착인 경우에는, 그 카메라로 취득한 동화상 데이터를 송신해도 된다. 이 때의 동화상 데이터는 휴대전화(ex114)가 가지는 LSI(ex500)에서 부호화 처리된 데이터이다.
또한, 스트리밍 서버(ex103)는 복수의 서버 또는 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 전송하는 것이어도 된다.
이상과 같이 하여, 컨텐츠 공급 시스템(ex100)에서는, 부호화된 데이터를 클라이언트가 수신하여 재생할 수 있다. 이와 같이 컨텐츠 공급 시스템(ex100)에서는, 사용자가 송신한 정보를 실시간으로 클라이언트가 수신하여 복호하여, 재생할 수 있어, 특별한 권리 또는 설비를 가지지 않은 사용자라도 개인 방송을 실현할 수 있다.
이 컨텐츠 공급 시스템을 구성하는 각 기기의 부호화, 복호에는 상기 실시의 형태에서 나타낸 화상 부호화 방법 혹은 화상 복호 방법을 이용하도록 하면 된다.
그 일예로서 휴대전화(ex114)에 대해서 설명한다.
도 43은, 상기 실시의 형태에서 설명한 화상 부호화 방법과 화상 복호 방법을 이용한 휴대전화(ex114)를 나타내는 도면이다. 휴대전화(ex114)는, 기지국(ex110)과의 사이에 전파를 송수신하기 위한 안테나(ex601), CCD 카메라 등의 영상, 정지화상을 찍는 것이 가능한 카메라부(ex603), 카메라부(ex603)에서 촬영한 영상, 안테나(ex601)로 수신한 영상 등이 복호된 데이터를 표시하는 액정 디스플레이 등의 표시부(ex602), 조작 키(ex604)군으로 구성되는 본체부, 음성 출력을 하기 위한 스피커 등의 음성 출력부(ex608), 음성 입력을 하기 위한 마이크 등의 음성 입력부(ex605), 촬영한 동화상 혹은 정지화상 데이터, 수신한 메일 데이터, 동화상 데이터 혹은 정지화상 데이터 등, 부호화된 데이터 또는 복호된 데이터를 보존하기 위한 기록 미디어(ex607), 휴대전화(ex114)에 기록 미디어(ex607)를 장착 가능하게 하기 위한 슬롯부(ex606)를 가지고 있다. 기록 미디어(ex607)는 SD 카드 등의 플라스틱 케이스 내에 전기적으로 고쳐쓰기 및 소거가 가능한 불휘발성 메모리인 EEPROM의 일종인 플래시 메모리 소자를 격납한 것이다.
또한, 휴대전화(ex114)에 대해서 도 44를 이용하여 설명한다. 휴대전화(ex114)는 표시부(ex602) 및 조작 키(ex604)를 구비한 본체부의 각 부를 통괄적으로 제어하도록 이루어진 주제어부(ex711)에 대하여, 전원 회로부(ex710), 조작 입력 제어부(ex704), 화상 부호화부(ex712), 카메라 인터페이스부(ex703), LCD(Liquid Crystal Display) 제어부(ex702), 화상 복호부(ex709), 다중 분리부(ex708), 기록 재생부(ex707), 변복조 회로부(ex706) 및 음성 처리부(ex705)가 동기 버스(ex713)를 통하여 상호 접속되어 있다.
전원 회로부(ex710)는, 사용자의 조작에 의해 통화종료 및 전원 키가 온 상태로 되면, 배터리 팩으로부터 각 부에 대하여 전력을 공급함으로써 카메라 부착 디지털 휴대전화(ex114)를 동작가능한 상태로 기동한다.
휴대전화(ex114)는, CPU, ROM 및 RAM 등으로 이루어지는 주제어부(ex711)의 제어에 의거하여, 음성 통화 모드 시에 음성 입력부(ex605)에서 집음한 음성 신호를 음성 처리부(ex705)에 의해 디지털 음성 데이터로 변환하고, 이를 변복조 회로부(ex706)에서 스펙트럼 확산 처리하고, 송수신 회로부(ex701)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex601)를 통해서 송신한다. 또한 휴대전화(ex114)는, 음성통화 모드 시에 안테나(ex601)로 수신한 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 실시하고, 변복조 회로부(ex706)에서 스펙트럼 역확산 처리하고, 음성 처리부(ex705)에 의해 아날로그 음성 데이터로 변환한 후, 음성 출력부(ex608)를 통하여 이를 출력한다.
또한, 데이터 통신 모드 시에 전자 메일을 송신할 경우, 본체부의 조작 키(ex604)의 조작에 의해 입력된 전자 메일의 텍스트 데이터는 조작 입력 제어부(ex704)를 통하여 주제어부(ex711)로 송출된다. 주제어부(ex711)는, 텍스트 데이터를 변복조 회로부(ex706)에서 스펙트럼 확산 처리하고, 송수신 회로부(ex701)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex601)를 통하여 기지국(ex110)으로 송신한다.
데이터 통신 모드 시에 화상 데이터를 송신할 경우, 카메라부(ex603)에서 촬상된 화상 데이터를, 카메라 인터페이스부(ex703)를 통하여 화상 부호화부(ex712)에 공급한다. 또한, 화상 데이터를 송신하지 않는 경우에는, 카메라부(ex603)에서 촬상한 화상 데이터를 카메라 인터페이스부(ex703) 및 LCD 제어부(ex702)를 통하여 표시부(ex602)에 직접 표시하는 것도 가능하다.
화상 부호화부(ex712)는, 본원 발명에서 설명한 화상 부호화 장치를 구비한 구성이며, 카메라부(ex603)로부터 공급된 화상 데이터를 상기 실시의 형태에서 나타낸 화상 부호화 장치에 이용한 부호화 방법에 의해 압축 부호화함으로써 부호화 화상 데이터로 변환하고, 이를 다중 분리부(ex708)로 송출한다. 또한, 이 때 동시에 휴대전화(ex114)는, 카메라부(ex603)로 촬상 중에 음성 입력부(ex605)에서 집음한 음성을, 음성 처리부(ex705)를 통하여 디지털 음성 데이터로 하여 다중 분리부(ex708)에 송출한다.
다중 분리부(ex708)는, 화상 부호화부(ex712)로부터 공급된 부호화 화상 데이터와 음성 처리부(ex705)로부터 공급된 음성 데이터를 소정의 방식으로 다중화하고, 그 결과 얻어지는 다중화 데이터를 변복조 회로부(ex706)에서 스펙트럼 확산 처리하고, 송수신 회로부(ex701)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex601)를 통하여 송신한다.
데이터 통신 모드 시에 홈페이지 등에 링크된 동화상 파일 데이터를 수신할 경우, 안테나(ex601)를 통하여 기지국(ex110)으로부터 수신한 수신 데이터를 변복조 회로부(ex706)에서 스펙트럼 역확산 처리하고, 그 결과 얻어지는 다중화 데이터를 다중 분리부(ex708)에 송출한다.
또한, 안테나(ex601)를 통하여 수신된 다중화 데이터를 복호하기 위해서는, 다중 분리부(ex708)는, 다중화 데이터를 분리함으로써 화상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누고, 동기 버스(ex713)를 통하여 당해 부호화 화상 데이터를 화상 복호부(ex709)에 공급함과 더불어 당해 음성 데이터를 음성 처리부(ex705)에 공급한다.
다음에, 화상 복호부(ex709)는, 본원에서 설명한 화상 복호 장치를 구비한 구성이며, 화상 데이터의 비트 스트림을 상기 실시의 형태에서 나타낸 부호화 방법에 대응한 복호 방법으로 복호함으로써 재생 동화상 데이터를 생성하고, 이를, LCD 제어부(ex702)를 통하여 표시부(ex602)에 공급하고, 이에 따라, 예를 들면 홈페이지에 링크된 동화상 파일에 포함되는 동화상 데이터가 표시된다. 이 때 동시에 음성 처리부(ex705)는, 음성 데이터를 아날로그 음성 데이터로 변환한 후, 이를 음성 출력부(ex608)에 공급하고, 이에 따라, 예를 들면 홈페이지에 링크된 동화상 파일에 포함되는 음성 데이터가 재생된다.
또한, 상기 시스템의 예에 한정되지 않고, 최근에는 위성, 지상파에 의한 디지털 방송이 화제가 되고 있고, 도 45에 도시하는 바와같이 디지털 방송용 시스템에도 상기 실시의 형태의 적어도 화상 부호화 장치 또는 화상 복호 장치를 집어넣을 수 있다. 구체적으로는, 방송국(ex201)에서는 음성 데이터, 영상 데이터 또는 이들 데이터가 다중화된 비트 스트림이 전파를 통해서 통신 또는 방송 위성(ex202)에 전송된다. 이를 받은 방송 위성(ex202)은, 방송용 전파를 발신하고, 위성 방송 수신 설비를 가지는 가정의 안테나(ex204)는 이 전파를 수신하고, 텔레비전(수신기)(ex300) 또는 셋탑 박스(STB)(ex217) 등의 장치는 비트 스트림을 복호하여 이를 재생한다. 또한, 기록 매체인 CD 및 DVD 등의 기록 미디어(ex215), ex(216)에 기록한 화상 데이터와, 음성 데이터가 다중화된 비트 스트림을 읽어내고, 복호하는 리더/레코더(ex218)에도 상기 실시의 형태에서 나타낸 화상 복호 장치를 실장하는 것이 가능하다. 이 경우, 재생된 영상 신호는 모니터(ex219)에 표시된다. 또한, 케이블 TV용의 케이블(ex203) 또는 위성/지상파 방송의 안테나(ex204)에 접속된 셋탑 박스(ex217) 내에 화상 복호 장치를 실장하고, 이를 텔레비전 모니터(ex219)로 재생하는 구성도 생각할 수 있다. 이 때 셋탑 박스가 아니라, 텔레비전 내에 화상 복호 장치를 집어넣어도 된다. 또한, 안테나(ex205)를 가지는 차(ex210)에서, 위성(ex202) 또는 기지국 등으로부터 신호를 수신하고, 차(ex210)가 가지는 카네비게이션(ex211) 등의 표시 장치에 동화상을 재생하는 것도 가능하다.
또한, DVD, BD 등의 기록 미디어(ex215)에 기록한 음성 데이터, 영상 데이터 또는 이들 데이터가 다중화된 부호화 비트 스트림을 읽어내 복호하거나, 또는, 기록 미디어(ex215)에, 음성 데이터, 영상 데이터 또는 이들 데이터를 부호화하고, 다중화 데이터로서 기록하는 리더/레코더(ex218)에도 상기 실시의 형태에서 나타낸 화상 복호 장치 또는 화상 부호화 장치를 실장하는 것이 가능하다. 이 경우, 재생된 영상 신호는 모니터(ex219)에 표시된다. 또한, 부호화 비트 스트림이 기록된 기록 미디어(ex215)에 의해, 다른 장치 및 시스템 등은, 영상 신호를 재생할 수 있다. 예를 들면, 다른 재생 장치(ex212)는, 부호화 비트 스트림이 카피된 기록 미디어(ex214)를 이용하여, 모니터(ex213)에 영상 신호를 재생할 수 있다.
또한, 케이블 TV용의 케이블(ex203) 또는 위성/지상파 방송의 안테나(ex204)에 접속된 셋탑 박스(ex217) 내에 화상 복호 장치를 실장하고, 이를 텔레비전 모니터(ex219)로 표시해도 된다. 이 때 셋탑 박스가 아니라, 텔레비전 내에 화상 복호 장치를 집어넣어도 된다.
도 46은, 상기 실시의 형태에서 설명한 화상 복호 방법 및 화상 부호화 방법을 이용한 텔레비젼(수신기)(ex300)을 나타내는 도면이다. 텔레비전(ex300)은, 상기 방송을 수신하는 안테나(ex204) 또는 케이블(ex203) 등을 통하여 영상 정보의 비트 스트림을 취득, 또는, 출력하는 튜너(ex301)와, 수신한 부호화 데이터를 복조하거나, 또는, 생성된 부호화 데이터를 외부에 송신하기 위해서 변조하는 변조/복조부(ex302)와, 복조한 영상 데이터와 음성 데이터를 분리하거나, 또는, 부호화된 영상 데이터와 음성 데이터를 다중화하는 다중/분리부(ex303)를 구비한다. 또한, 텔레비전(ex300)은, 음성 데이터, 영상 데이터 각각을 복호하거나, 또는, 각각의 정보를 부호화하는 음성 신호 처리부(ex304), 영상 신호 처리부(ex305)를 가지는 신호 처리부(ex306)와, 복호된 음성 신호를 출력하는 스피커(ex307), 복호된 영상 신호를 표시하는 디스플레이 등의 표시부(ex308)를 가지는 출력부(ex309)를 가진다. 또한, 텔레비전(ex300)은, 사용자 조작의 입력을 접수하는 조작 입력부(ex312) 등을 가지는 인터페이스부(ex317)를 가진다. 또한, 텔레비전(ex300)은, 각 부를 통괄적으로 제어하는 제어부(ex310), 각 부에 전력을 공급하는 전원 회로부(ex311)를 가진다. 인터페이스부(ex317)는, 조작 입력부(ex312) 이외에, 리더/레코더(ex218) 등의 외부 기기와 접속되는 브리지(ex313), SD 카드 등의 기록 미디어(ex216)를 장착 가능하게 하기 위한 슬롯부(ex314), 하드 디스크 등의 외부 기록 미디어와 접속하기 위한 드라이버(ex315), 전화망과 접속하는 모뎀(ex316) 등을 가지고 있어도 된다. 또한, 기록 미디어(ex216)는, 격납하는 불휘발성/휘발성의 반도체 메모리 소자에 의해 전기적으로 정보의 기록을 가능하게 한 것이다. 텔레비전(ex300)의 각 부는 동기 버스를 통해서 서로 접속되어 있다.
우선, 텔레비전(ex300)이 안테나(ex204) 등에 의해 외부로부터 취득한 데이터를 복호하고, 재생하는 구성에 대해서 설명한다. 텔레비전(ex300)은, 리모트 컨트롤러(ex220) 등으로부터 사용자 조작을 받고, CPU 등을 가지는 제어부(ex310)의 제어에 의거하여, 변조/복조부(ex302)에서 복조한 영상 데이터, 음성 데이터를 다중/분리부(ex303)에서 분리한다. 또한 텔레비전(ex300)은, 분리한 음성 데이터를 음성 신호 처리부(ex304)에서 복호하고, 분리한 영상 데이터를 영상 신호 처리부(ex305)에서 상기 실시의 형태에서 설명한 복호 방법을 이용하여 복호한다. 복호한 음성 신호, 영상 신호는, 각각 출력부(ex309)로부터 외부를 향해서 출력된다. 출력할 때는, 음성 신호와 영상 신호가 동기하여 재생하도록, 버퍼(ex318, ex319) 등에 일단 이들 신호를 축적하면 된다. 또한, 텔레비전(ex300)은, 방송 등으로부터가 아니라, 자기/광 디스크, SD 카드 등의 기록 미디어(ex215, ex216)로부터 부호화된 부호화 비트 스트림을 읽어내도 된다. 다음에, 텔레비전(ex300)이 음성 신호 및 영상 신호를 부호화하고, 외부로 송신 또는 기록 미디어 등에 기입하는 구성에 대해서 설명한다. 텔레비전(ex300)은, 리모트 컨트롤러(ex220) 등으로부터의 사용자 조작을 받아, 제어부(ex310)의 제어에 의거하여, 음성 신호 처리부(ex304)에서 음성 신호를 부호화하고, 영상 신호 처리부(ex305)에서 영상 신호를 상기 실시의 형태에서 설명한 부호화 방법을 이용하여 부호화한다. 부호화한 음성 신호, 영상 신호는 다중/분리부(ex303)에서 다중화되어 외부로 출력된다. 다중화할 때는, 음성 신호와 영상 신호가 동기하도록, 버퍼(ex320, ex321) 등에 일단 이들 신호를 축적하면 된다. 또한, 버퍼(ex318∼ex321)는 도시하고 있는 바와같이 복수 구비되어도 되고, 하나 이상의 버퍼를 공유하는 구성이어도 된다. 또한, 도시하고 있는 이외에, 예를 들면 변조/복조부(ex302)와 다중/분리부(ex303)의 사이 등에서도 시스템의 오버플로우 및 언더플로우를 피하는 완충재로서 버퍼에 데이터를 축적하는 것으로 해도 된다.
또한, 텔레비전(ex300)은, 방송 및 기록 미디어 등으로부터 음성 데이터 및 영상 데이터를 취득하는 이외에, 마이크 및 카메라의 AV 입력을 접수하는 구성을 구비하고, 이들로부터 취득한 데이터에 대하여 부호화 처리를 행해도 된다. 또한, 여기에서 텔레비전(ex300)은, 상기의 부호화 처리, 다중화, 및, 외부 출력이 가능한 구성으로서 설명했는데, 이들 모든 처리를 행할 수는 없고, 상기 수신, 복호 처리, 및, 외부 출력 중 어느 하나만이 가능한 구성이어도 된다.
또한, 리더/레코더(ex218)로 기록 미디어로부터 부호화 비트 스트림을 판독하거나, 또는, 기입하는 경우에는, 상기 복호 처리 또는 부호화 처리는 텔레비전(ex300) 및 리더/레코더(ex218) 중 어느 하나로 행해도 되고, 텔레비전(ex300)과 리더/레코더(ex218)가 서로 분담하여 행해도 된다.
일예로서, 광 디스크로부터 데이터의 읽기 또는 기입을 하는 경우의 정보 재생/기록부(ex400)의 구성을 도 47에 도시한다. 정보 재생/기록부(ex400)는, 이하에 설명하는 요소(ex401∼ex407)를 구비한다. 광 헤드(ex401)는, 광 디스크인 기록 미디어(ex215)의 기록면에 레이저 스폿을 조사하여 정보를 기입, 기록 미디어(ex215)의 기록면에서의 반사광을 검출하여 정보를 읽어들인다. 변조 기록부(ex402)는, 광 헤드(ex401)에 내장된 반도체 레이저를 전기적으로 구동하여 기록 데이터에 따라서 레이저 광의 변조를 행한다. 재생 복조부(ex403)는, 광 헤드(ex401)에 내장된 포토디텍터에 의해 기록면에서의 반사광을 전기적으로 검출한 재생 신호를 증폭하고, 기록 미디어(ex215)에 기록된 신호 성분을 분리하여 복조하여, 필요한 정보를 재생한다. 버퍼(ex404)는, 기록 미디어(ex215)에 기록하기 위한 정보 및 기록 미디어(ex215)로부터 재생한 정보를 일시적으로 보유한다. 디스크 모터(ex405)는 기록 미디어(ex215)를 회전시킨다. 서보 제어부(ex406)는, 디스크 모터(ex405)의 회전 구동을 제어하면서 광 헤드(ex401)를 소정의 정보 트랙으로 이동시켜, 레이저 스폿의 추종 처리를 행한다. 시스템 제어부(ex407)는, 정보재생/기록부(ex400) 전체의 제어를 행한다. 상기의 판독 및 기입의 처리는, 시스템 제어부(ex407)가, 버퍼(ex404)에 보유된 각종 정보를 이용하고, 또한 필요에 따라서 새로운 정보의 생성 및 추가를 행함과 더불어, 변조 기록부(ex402), 재생 복조부(ex403) 및 서보 제어부(ex406)를 협조 동작시키면서, 광 헤드(ex401)를 통하여, 정보의 기록 재생을 행함으로써 실현된다. 시스템 제어부(ex407)는, 예를 들면 마이크로프로세서로 구성되고, 판독 기입의 프로그램을 실행함으로써 이들 처리를 실행한다.
이상에서는, 광 헤드(ex401)는 레이저 스폿을 조사하는 것으로서 설명했는데, 근접장 광을 이용하여 보다 고밀도의 기록을 행하는 구성이어도 된다.
도 48에 광 디스크인 기록 미디어(ex215)의 모식도를 나타낸다. 기록 미디어(ex215)의 기록면에는 안내홈(그루브)이 나선상으로 형성되고, 정보 트랙(ex230)에는, 미리 그루브 형상의 변화에 따라 디스크 상의 절대 위치를 나타내는 번지 정보가 기록되어 있다. 이 번지 정보는 데이터를 기록하는 단위인 기록 블록(ex231)의 위치를 특정하기 위한 정보를 포함하고, 기록 및 재생을 행하는 장치는, 정보 트랙(ex230)을 재생하여 번지 정보를 읽어냄으로써 기록 블록을 특정할 수 있다. 또한, 기록 미디어(ex215)는, 데이터 기록 영역(ex233), 내주 영역(ex232), 외주 영역(ex234)을 포함하고 있다. 사용자 데이터를 기록하기 위해서 이용하는 영역이 데이터 기록 영역(ex233)이며, 데이터 기록 영역(ex233)의 내주 또는 외주에 배치되어 있는 내주 영역(ex232)과 외주 영역(ex234)은, 사용자 데이터의 기록 이외의 특정 용도에 이용된다. 정보 재생/기록부(ex400)는, 이러한 기록 미디어(ex215)의 데이터 기록 영역(ex233)에 대하여, 부호화된 음성 데이터, 영상 데이터 또는 이들 데이터를 다중화한 부호화 데이터의 읽고쓰기를 행한다.
이상에서는, 1층의 DVD, BD 등의 광 디스크를 예로 들어 설명했는데, 이들에 한정된 것은 아니고, 다층 구조이며 표면 이외에도 기록가능한 광 디스크여도 된다. 또한, 디스크의 같은 장소에 다양한 다른 파장의 색의 광을 이용하여 정보를 기록하거나, 다양한 각도로부터 다른 정보의 층을 기록하는 등, 다차원적인 기록/재생을 행하는 구조의 광 디스크여도 된다.
또한, 디지털 방송용 시스템(ex200)에 있어서, 안테나(ex205)를 가지는 차(ex210)에서 위성(ex202) 등으로부터 데이터를 수신하고, 차(ex210)가 가지는 카네비게이션(ex211) 등의 표시 장치에 동화상을 재생하는 것도 가능하다. 또한, 카네비게이션(ex211)의 구성은 예를 들면 도 46에 도시하는 구성 중, GPS 수신부를 추가한 구성을 생각할 수 있고, 동일한 것을 컴퓨터(ex111) 및 휴대전화(ex114) 등에도 생각할 수 있다. 또한, 상기 휴대전화(ex114) 등의 단말은, 텔레비전(ex300)과 마찬가지로, 부호화기 및 복호기를 양쪽에 가지는 송수신형 단말 외에, 부호화기만의 송신 단말, 복호기만의 수신 단말이라는 3가지 실장 형식을 생각할 수 있다.
이와 같이, 상기 실시의 형태에서 나타낸 화상 부호화 방법 혹은 화상 복호 방법을 상술한 어느 하나의 기기 및 시스템에 이용하는 것이 가능하고, 그렇게 함으로써, 상기 실시의 형태에서 설명한 효과를 얻을 수 있다.
또한, 본 발명은, 상기 실시의 형태에 한정되는 것은 아니고, 본 발명의 범위를 일탈하지 않고 다양한 변형 또는 수정이 가능하다.
(실시의 형태 8)
상기 각 실시의 형태에서 나타낸 화상 부호화 방법 및 장치, 화상 복호 방법 및 장치는, 전형적으로는 집적 회로인 LSI에서 실현된다. 일예로서, 도 49에 1칩화된 LSI(ex500)의 구성을 나타낸다. LSI(ex500)는, 이하에 설명하는 요소(ex501∼ex509)를 구비하고, 각 요소는 버스(ex510)를 통하여 접속하고 있다. 전원 회로부(ex505)는 전원이 온 상태인 경우에 각 부에 대하여 전력을 공급함으로써 동작 가능한 상태로 기동한다.
예를 들면 부호화 처리를 행하는 경우에는, LSI(ex500)는, CPU(ex502), 메모리 컨트롤러(ex503) 및 스트림 컨트롤러(ex504) 등을 가지는 제어부(ex501)의 제어에 의거하여, AV I/O(ex509)에 의해 마이크(ex117) 및 카메라(ex113) 등으로부터 AV 신호의 입력을 접수한다. 입력된 AV 신호는, 일단 SDRAM 등의 외부 메모리(ex511)에 축적된다. 제어부(ex501)의 제어에 의거하여, 축적된 데이터는, 처리량 및 처리 속도에 따라서 적절히 복수회로 나누는 등으로 되어, 신호 처리부(ex507)에 보내진다. 신호 처리부(ex507)는, 음성 신호의 부호화 및/또는 영상 신호의 부호화를 행한다. 여기서 영상 신호의 부호화 처리는, 상기 실시의 형태에서 설명한 부호화 처리이다. 신호 처리부(ex507)에서는 또한, 경우에 따라 부호화된 음성 데이터와 부호화된 영상 데이터를 다중화하는 등의 처리를 행하고, 스트림 I/O(ex506)으로부터 외부로 출력한다. 이 출력된 비트 스트림은, 기지국(ex107)을 향해서 송신되거나, 또는, 기록 미디어(ex215)에 기입된다. 또한, 다중화할 때는 동기하도록, 일단 버퍼(ex508)에 데이터를 축적하면 된다.
또한, 예를 들면 복호 처리를 행하는 경우에는, LSI(ex500)는, 제어부(ex501)의 제어에 의거하여, 스트림 I/O(ex506)에 의해 기지국(ex107)을 통하여 얻은 부호화 데이터, 또는, 기록 미디어(ex215)로부터 읽어내 얻은 부호화 데이터를 일단 메모리(ex511) 등에 축적한다. 제어부(ex501)의 제어에 의거하여, 축적된 데이터는, 처리량 및 처리 속도에 따라서 적절히 복수회로 나누는 등으로 되어 신호 처리부(ex507)에 보내진다. 신호 처리부(ex507)는, 음성 데이터의 복호 및/또는 영상 데이터의 복호를 행한다. 여기서 영상 신호의 복호 처리는, 상기 실시의 형태에서 설명한 복호 처리이다. 또한, 경우에 따라 복호된 음성 신호와 복호 된 영상 신호를 동기하여 재생할 수 있도록 각각의 신호를 일단 버퍼(ex508) 등에 축적하면 된다. 복호된 출력 신호는, 메모리(ex511) 등을 적절히 통하면서, 휴대전화(ex114), 게임기(ex115) 및 텔레비전(ex300) 등의 각 출력부로부터 출력된다.
또한, 상기에서는, 메모리(ex511)가 LSI(ex500)의 외부 구성으로서 설명했는데, LSI(ex500)의 내부에 포함되는 구성이어도 된다. 버퍼(ex508)도 하나에 한정된 것은 아니고, 복수의 버퍼를 구비하고 있어도 된다. 또한, LSI(ex500)은 1칩화되어도 되고, 복수 칩화되어도 된다.
또한, 여기서는, LSI로 했는데, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI로 호칭되는 경우도 있다.
또한, 집적 회로화의 수법은 LSI에 한정되는 것은 아니고, 전용 회로 또는 범용 프로세서로 실현해도 된다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA, 또는, LSI 내부의 회로 셀의 접속 및 설정을 재구성 가능한 리컨피규러블·프로세서를 이용해도 된다.
나아가, 반도체 기술의 진보 또는 파생하는 별도 기술에 의해 LSI로 치환하는 집적 회로화의 기술이 등장하면, 당연, 그 기술을 이용하여 기능 블록의 집적화를 행해도 된다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
이상, 본 발명에 관련된 화상 부호화 방법, 화상 부호화 장치, 화상 복호 방법 및 화상 복호 장치에 대해서, 실시의 형태에 의거하여 설명했는데, 본 발명은, 이들 실시의 형태에 한정되는 것은 아니다. 본 발명의 취지를 일탈하지 않는 한, 당업자가 생각해 내는 각종 변형을 당해 실시의 형태에 실시한 형태, 및, 다른 실시의 형태에 있어서의 구성 요소 및 단계 등을 조합시켜서 구축되는 별도의 형태도, 본 발명의 범위 내에 포함된다.
<산업 상의 이용 가능성>
본 발명은, 화상 부호화 방법(장치) 및 화상 복호 방법(장치)에 유리하게 이용된다.
100, 400, 500, 600, 1300A, 1300B, 1500, 1800, 2100, 2200, 2300, 2800, 3201 : 동화상 부호화 장치
105 : 감산기 110 : 변환/양자화부
120, 220 : 역양자화/역변환부 125, 225 : 가산기
130, 230 : 디블로킹 필터 140, 240, 3020, 3120 : 메모리
150, 250 : 보간 필터 160, 260 : 움직임 보상 예측부
165 : 움직임 예측부 170, 270 : 인트라 프레임 예측부
175, 275 : 스위치 180, 640 : 포스트 필터 설계부
190, 490, 590, 690, 1590, 1890, 2190, 2290, 2390, 2890 : 엔트로피 부호화부
200, 700, 1400A. 1400B, 1600, 1900, 2400, 2900, 3203 : 동화상 복호 장치
280, 740 : 포스트 필터
290, 1690, 1990, 2490, 2990 : 엔트로피 복호부
300, 930, 1130 : 위너 필터 440, 540 : 위너 필터 및 설계부
810, 910, 1110 : DCT 변환부 820, 920, 1120 : DCT 역변환부
1301, 1311, 1401, 1411, 1441 : 동화상 신호
1310, 1410, 2010 : 변환부
1330, 1530, 1830, 2330 : 필터 설계부
641, 1331, 1431, 1531, 1691, 1831, 1991, 2131, 2231, 2331, 2491 : 필터 정보
1420 : 역변환부 1435 : 필터 설정부
1440, 1540, 1640, 1740, 1940, 2040, 2440, 2880, 2980, 3030, 3130 : 필터
1520, 1620, 2020, 3040, 3140 : 역변환부
1741, 2041 : 변환 계수 2140, 2230 : 필터 및 설계부
2710, 2720, 2730, 2750, 2760, 2770 : 플레임
2701, 2702, 2703, 2751, 2752, 2753 : 블록
2780 : 움직임 벡터 3010, 3110 : 역양자화부
3041, 3141 : 신호 3001, 3101 : 대상 블록
3002, 3102 : 인접 블록 3202 : 채널
ex100 : 컨텐츠 공급 시스템 ex101 : 인터넷
ex102 : 인터넷 서비스 프로바이더 ex103 : 스트리밍 서버
ex104 : 전화망
ex106, ex107, ex108, ex109, ex110 : 기지국
ex111 : 컴퓨터 ex112 : PDA
ex113, ex116 : 카메라
ex114 : 카메라부착 디지털 휴대 전화(휴대 전화)
ex115 : 게임기 ex117 : 마이크
ex200 : 디지털 방송용 시스템 ex201 : 방송국
ex202 : 방송 위성(위성) ex203 : 케이블
ex204, ex205, ex601 : 안테나 ex210 : 차
ex211 : 카 네비게이션(카 네비) ex212 : 재생 장치
ex213, ex219 : 모니터
ex214, ex215, ex216, ex607 : 기록 미디어
ex217 : 셋탑 박스(STB) ex218 : 리더/레코더
ex220 : 리모트 컨트롤러 ex230 : 정보 트랙
ex231 : 기록 블록 ex232 : 내주 영역
ex233 : 데이터 기록 영역 ex234 : 외주 영역
ex300 : 텔레비젼 ex301 : 튜너
ex302 : 변조/복조부 ex303 : 다중/분리부
ex304 : 음성 신호 처리부 ex305 : 영상 신호 처리부
ex306, ex507 : 신호 처리부 ex307 : 스피커
ex308, ex602 : 표시부 ex309 : 출력부
ex310, ex501 : 제어부 ex311, ex505, ex710 : 전원 회로부
ex312 : 조작 입력부 ex313 : 브리지
ex314, ex606 : 슬롯부 ex315 : 드라이버
ex316 : 모뎀 ex317 : 인터페이스부
ex318, ex319, ex320, ex321, ex404, ex508 : 버퍼
ex400 : 정보 재생/기록부 ex401 : 광 헤드
ex402 : 변조 기록부 ex403 : 재생 복조부
ex405 : 디스크 모터 ex406 : 서보 제어부
ex407 : 시스템 제어부 ex500 : LSI
ex502 : CPU ex503 : 메모리 컨트롤러
ex504 : 스트림 컨트롤러 ex506 : 스트림 I/O
ex509 : AV I/O ex501 : 버스
ex603 : 카메라부 ex604 : 조작 키
ex605 : 음성 입력부 ex608 : 음성 출력부
ex701 : 송수신 회로부 ex702 : LCD 제어부
ex703 : 카메라 인터페이스부(카메라 I/F부)
ex704 : 조작 입력 제어부 ex705 : 음성 입력부
ex706 : 변복조 회로부 ex707 : 기록 재생부
ex708 : 다중 분리부 ex709 : 화상 복호부
ex711 : 주제어부 ex712 : 화상 부호화부
ex713 : 동기 버스

Claims (20)

  1. 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호하는 동화상 복호 방법으로서,
    상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 단계와,
    상기 부호화 신호를 복호하여 복호 신호를 생성하는 단계와,
    상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 단계를 포함하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함하는 동화상 복호 방법.
  2. 청구항 1에 있어서,
    상기 필터 처리는, 상기 복호 신호를 구성하는 복수의 블록 각각에 대해서, 처리 대상 블록의 각 주파수 성분의 값과, 상기 처리 대상 블록에 시간적 또는 공간적으로 인접하는 블록의 대응하는 주파수 성분의 값을, 상기 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함하고,
    상기 가중 계수는, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 처리 대상 블록과, 주파수 영역의 상기 동화상 신호에 포함되는 상기 처리 대상 블록에 대응하는 블록의 평균 제곱 오차가 최소가 되도록 결정되어 있는 동화상 복호 방법.
  3. 청구항 2에 있어서,
    상기 필터 처리는, 상기 가중 가산을 실행하기 전의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값으로부터 제1의 오프셋값을 감산하는 단계와,
    상기 가중 가산한 후의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값에 상기 필터 정보에 포함되는 제2의 오프셋값을 가산하는 단계를 더 포함하고,
    상기 제1의 오프셋값은, 주파수 영역의 상기 복호 신호에 포함되는 블록 중, 상기 처리 대상 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 산출되고,
    상기 제2의 오프셋값은, 주파수 영역의 상기 동화상 신호에 포함되는 블록 중, 상기 처리 대상 블록에 대응하는 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 산출되어 있는 동화상 복호 방법.
  4. 청구항 1에 있어서,
    상기 부호화 신호는, 상기 동화상 신호가 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이며,
    상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여 상기 복호 신호로서의 양자화 계수를 생성하는 처리가 포함되고,
    상기 필터 처리를 적용하는 단계에는, 상기 양자화 계수에 상기 필터 처리를 적용함과 더불어, 당해 양자화 계수를 역양자화하는 처리가 포함되는 동화상 복호 방법.
  5. 청구항 1에 있어서,
    상기 부호화 신호는, 상기 동화상 신호로부터 예측 신호가 감산되고, 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이며,
    상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하며, 상기 예측 신호를 가산하여 상기 복호 신호로서의 재구축 신호를 생성하는 처리가 포함되고,
    상기 필터 처리를 적용하는 단계에는, 상기 재구축 신호를 공간 영역으로부터 주파수 영역으로 변환하는 처리와, 주파수 영역의 상기 재구축 신호에 상기 필터 처리를 적용하는 처리와, 상기 필터 처리를 적용한 후의 상기 재구축 신호를 주파수 영역으로부터 공간 영역으로 역변환하는 처리가 포함되는 동화상 복호 방법.
  6. 청구항 1에 있어서,
    상기 부호화 신호는, 상기 동화상 신호로부터 예측 신호가 감산되어 예측 오차 신호가 생성되고, 당해 예측 오차 신호가 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이며,
    상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호와 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함되고,
    상기 필터 처리는, 상기 복호 신호로서의 상기 양자화 예측 오차 신호, 상기 예측 신호, 및 상기 재구축 신호의 서로 대응하는 블록에 포함되는 동일 주파수 성분의 값을 상기 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함하고,
    상기 가중 계수는, 주파수 영역의 상기 예측 오차 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 결정되어 있는 동화상 복호 방법.
  7. 청구항 1에 있어서,
    상기 부호화 신호는, 상기 동화상 신호로부터 예측 신호가 감산되고, 공간 영역으로부터 주파수 영역으로 변환되어, 양자화되고, 엔트로피 부호화되어 얻어지는 것이며,
    상기 복호 신호를 생성하는 단계에는, 상기 부호화 신호를 엔트로피 복호하여, 역양자화하고, 주파수 영역으로부터 공간 영역으로 역변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호와 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함되고,
    상기 필터 처리를 적용하는 단계에는, 상기 예측 신호를 공간 영역으로부터 주파수 영역으로 변환하는 처리와, 주파수 영역의 상기 예측 신호에 상기 필터 처리를 적용하는 처리와, 상기 필터 처리가 적용된 후의 상기 예측 신호를 주파수 영역으로부터 공간 영역으로 역변환하는 처리가 포함되는 동화상 복호 방법.
  8. 동화상 신호를 부호화하여 부호화 신호를 생성하는 동화상 부호화 방법으로서,
    적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 단계와,
    양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 단계와,
    상기 부호화 신호 및 상기 필터 정보를 출력하는 단계를 포함하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정되는 동화상 부호화 방법.
  9. 청구항 8에 있어서,
    상기 동화상 부호화 방법은, 양자화 후의 주파수 영역의 신호에, 상기 필터 정보를 이용하여 상기 필터 처리를 적용하는 단계를 더 포함하고,
    상기 필터 처리는, 상기 양자화 후의 신호를 구성하는 복수의 블록 각각에 대해서, 처리 대상 블록의 각 주파수 성분의 값과, 상기 처리 대상 블록에 시간적 또는 공간적으로 인접하는 블록의 대응하는 주파수 성분의 값을, 상기 필터 정보에 포함되는 가중 계수를 이용하여 가중 가산하는 단계를 포함하고,
    상기 필터 정보를 생성하는 단계는, 상기 필터 처리가 적용된 상기 처리 대상 블록과, 주파수 영역의 상기 동화상 신호에 포함되는 상기 처리 대상 블록에 대응하는 블록의 평균 제곱 오차가 최소가 되도록 상기 가중 계수를 결정하는 동화상 부호화 방법.
  10. 청구항 9에 있어서,
    상기 필터 처리는, 상기 가중 가산을 실행하기 전의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값으로부터 제1의 오프셋값을 감산하는 단계와, 상기 가중 가산한 후의 상기 처리 대상 블록에 대하여, 각 주파수 성분의 값에 제2의 오프셋값을 가산하는 단계를 더 포함하고,
    상기 필터 정보를 생성하는 단계에서는,
    양자화 후의 주파수 영역의 신호에 포함되는 블록 중, 상기 처리 대상 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 상기 제1의 오프셋값이 산출되고,
    주파수 영역의 상기 동화상 신호에 포함되는 블록 중, 상기 처리 대상 블록에 대응하는 블록을 포함하는 시간적 또는 공간적으로 연속하는 복수의 블록을 이용하여 주파수 성분마다 상기 제2의 오프셋값이 산출되고,
    적어도 상기 제2의 오프셋값이 상기 필터 정보에 포함되는 동화상 부호화 방법.
  11. 청구항 8에 있어서,
    상기 부호화 신호를 생성하는 단계에는, 상기 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 상기 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여 양자화 계수를 생성하는 처리가 포함되고,
    상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 예측 오차 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되는 동화상 부호화 방법.
  12. 청구항 8에 있어서,
    상기 부호화 신호를 생성하는 단계에는, 주파수 영역의 상기 동화상 신호를 양자화하고, 역양자화하여 재구축 신호를 생성하는 처리가 포함되고,
    상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 재구축 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되는 동화상 부호화 방법.
  13. 청구항 8에 있어서,
    상기 부호화 신호를 생성하는 단계에는, 상기 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 상기 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하여, 양자화하고, 역양자화하며, 주파수 영역으로부터 공간 영역으로 변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호에 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함되고,
    상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 예측 신호, 주파수 영역의 상기 양자화 예측 오차 신호, 및 주파수 영역의 상기 재구축 신호에 의거하여, 주파수 영역의 상기 예측 오차 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 양자화 예측 오차 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되는 동화상 부호화 방법.
  14. 청구항 8에 있어서,
    상기 부호화 신호를 생성하는 단계에는, 상기 동화상 신호로부터 예측 신호를 감산하여 예측 오차 신호를 생성하고, 상기 예측 오차 신호를 공간 영역으로부터 주파수 영역으로 변환하여, 양자화하고, 역양자화하며, 주파수 영역으로부터 공간 영역으로 변환하여 양자화 예측 오차 신호를 생성하고, 상기 양자화 예측 오차 신호에 상기 예측 신호를 가산하여 재구축 신호를 생성하는 처리가 포함되고,
    상기 필터 정보를 생성하는 단계에서는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 예측 신호의 평균 제곱 오차가 최소가 되도록 상기 필터 정보가 결정되는 동화상 부호화 방법.
  15. 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호하는 동화상 복호 장치로서,
    상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 취득부와,
    상기 부호화 신호를 복호하여 복호 신호를 생성하는 복호부와,
    상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 필터부를 구비하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함하는 동화상 복호 장치.
  16. 동화상 신호를 부호화하여 부호화 신호를 생성하는 동화상 부호화 장치로서,
    적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 부호화부와,
    양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 필터 설계부와,
    상기 부호화 신호 및 상기 필터 정보를 출력하는 출력부를 구비하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정되는 동화상 부호화 장치.
  17. 컴퓨터에, 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호시키는 프로그램으로서,
    상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 단계와,
    상기 부호화 신호를 복호하여 복호 신호를 생성하는 단계와,
    상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 단계를 포함하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함하는 프로그램.
  18. 컴퓨터에, 동화상 신호를 부호화하여 부호화 신호를 생성시키는 프로그램으로서,
    적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 단계와,
    양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 단계와,
    상기 부호화 신호 및 상기 필터 정보를 출력하는 단계를 포함하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정되는 프로그램.
  19. 동화상 신호를 부호화하여 얻어지는 부호화 신호를 복호하는 집적 회로로서,
    상기 부호화 신호 및 필터 처리를 특정하는 필터 정보를 취득하는 취득부와,
    상기 부호화 신호를 복호하여 복호 신호를 생성하는 복호부와,
    상기 동화상 신호를 부호화하는 과정에서 중첩된 노이즈를, 주파수 영역의 상기 복호 신호의 주파수 성분마다 제거하는 상기 필터 처리를, 상기 필터 정보를 이용하여 주파수 영역의 복호 신호에 적용하는 필터부를 구비하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 상기 복호 신호의 평균 제곱 오차를 최소로 하기 위한 정보를 포함하는 집적 회로.
  20. 동화상 신호를 부호화하여 부호화 신호를 생성하는 집적 회로로서,
    적어도, 상기 동화상 신호를 공간 영역으로부터 주파수 영역으로 변환하고, 양자화하여, 상기 부호화 신호를 생성하는 부호화부와,
    양자화하는 과정에서 중첩된 노이즈를, 양자화 후의 주파수 영역의 신호의 주파수 성분마다 제거하는 필터 처리를 특정하는 필터 정보를 생성하는 필터 설계부와,
    상기 부호화 신호 및 상기 필터 정보를 출력하는 출력부를 구비하고,
    상기 필터 정보는, 주파수 영역의 상기 동화상 신호와, 상기 필터 처리가 적용된 후의 주파수 영역의 신호의 평균 제곱 오차가 최소가 되도록 결정되는 집적 회로.
KR1020117011901A 2008-11-27 2009-11-26 동화상 복호 방법, 동화상 부호화 방법, 동화상 복호 장치, 동화상 부호화 장치, 프로그램, 및 집적 회로 KR20110093811A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP08020651.9 2008-11-27
EP08020651A EP2192786A1 (en) 2008-11-27 2008-11-27 Frequency domain filters for video coding

Publications (1)

Publication Number Publication Date
KR20110093811A true KR20110093811A (ko) 2011-08-18

Family

ID=40568483

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117011901A KR20110093811A (ko) 2008-11-27 2009-11-26 동화상 복호 방법, 동화상 부호화 방법, 동화상 복호 장치, 동화상 부호화 장치, 프로그램, 및 집적 회로

Country Status (6)

Country Link
US (1) US20110228843A1 (ko)
EP (2) EP2192786A1 (ko)
JP (1) JPWO2010061607A1 (ko)
KR (1) KR20110093811A (ko)
CN (1) CN102227910A (ko)
WO (1) WO2010061607A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017065357A1 (ko) * 2015-10-16 2017-04-20 엘지전자 주식회사 영상 코딩 시스템에서 예측 향상을 위한 필터링 방법 및 장치
WO2017065509A3 (ko) * 2015-10-13 2017-06-29 엘지전자 주식회사 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
KR20190103315A (ko) * 2017-01-05 2019-09-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 화상의 블록 기반 예측 코딩 및 디코딩

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010134973A1 (en) * 2009-05-18 2010-11-25 Thomson Licensing Methods and apparatus for a generalized filtering structure for video coding and decoding
CA2808451C (en) * 2010-09-14 2016-06-21 Research In Motion Limited Methods and devices for data compression with adaptive filtering in the transform domain
US8503528B2 (en) * 2010-09-15 2013-08-06 Google Inc. System and method for encoding video using temporal filter
KR102086145B1 (ko) * 2010-12-13 2020-03-09 한국전자통신연구원 인트라 예측 방법 및 그 장치
WO2012081895A1 (ko) 2010-12-13 2012-06-21 한국전자통신연구원 인트라 예측 방법 및 그 장치
JP4951113B1 (ja) 2010-12-20 2012-06-13 株式会社東芝 画像復号化装置、画像復号化方法およびプログラム
KR101215152B1 (ko) * 2011-04-21 2012-12-24 한양대학교 산학협력단 인루프 필터링을 적용한 예측 방법을 이용한 영상 부호화/복호화 방법 및 장치
CA2823902C (en) 2011-04-21 2018-03-27 Mediatek Inc. Method and apparatus for improved in-loop filtering
WO2012167712A1 (en) * 2011-06-10 2012-12-13 Mediatek Inc. Method and apparatus of scalable video coding
JP2013090034A (ja) * 2011-10-14 2013-05-13 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
EP2595382B1 (en) 2011-11-21 2019-01-09 BlackBerry Limited Methods and devices for encoding and decoding transform domain filters
CN103188484A (zh) * 2011-12-27 2013-07-03 华晶科技股份有限公司 具备三维去杂讯化功能的视讯编码/解码装置及其视讯编码方法
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
EP2916547A4 (en) 2012-11-30 2016-05-11 Sony Corp IMAGE PROCESSING APPARATUS AND METHOD
US9106888B2 (en) 2013-09-25 2015-08-11 Apple Inc. Reducing quantization artifacts using neighbor-based weighted dithering
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
JP2018533284A (ja) * 2015-09-21 2018-11-08 エルジー エレクトロニクス インコーポレイティド 係数誘導予測を用いてビデオ信号を処理する方法及び装置
US10623778B2 (en) * 2015-09-29 2020-04-14 Lg Electronics Inc. Filtering method and apparatus in picture coding system
BR112018073434A2 (pt) * 2016-05-13 2019-03-26 Interdigital Vc Holdings, Inc. método e aparelho para codificação de vídeo com corte adaptativo
KR101974261B1 (ko) * 2016-06-24 2019-04-30 한국과학기술원 Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치
US11095922B2 (en) * 2016-08-02 2021-08-17 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
US11457239B2 (en) 2017-11-09 2022-09-27 Google Llc Block artefact reduction
WO2020009619A1 (en) * 2018-07-02 2020-01-09 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding
WO2020080623A1 (ko) * 2018-10-19 2020-04-23 삼성전자 주식회사 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
DE102018222140B3 (de) 2018-12-18 2020-02-06 Siemens Mobility GmbH Ermitteln einer Durchlassgüte einer Optikeinheit eines Kamerasystems
US11595662B2 (en) * 2019-02-06 2023-02-28 Tencent America LLC Method and apparatus for neighboring block availability in video coding
JP7383736B2 (ja) * 2019-06-18 2023-11-20 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオコーディングにおけるフィルタリング装置および方法
JP6811931B2 (ja) * 2019-06-20 2021-01-13 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
CN110798690B (zh) * 2019-08-23 2021-12-21 腾讯科技(深圳)有限公司 视频解码方法、环路滤波模型的训练方法、装置和设备
US20220312004A1 (en) * 2021-03-23 2022-09-29 Tencent America LLC Method and apparatus for video coding
US20230196623A1 (en) * 2021-12-22 2023-06-22 Red Hat, Inc. Content-based encoding of digital images
WO2023223901A1 (ja) * 2022-05-17 2023-11-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473384A (en) * 1993-12-16 1995-12-05 At&T Corp. Method of and system for enhancing distorted graphical information
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
JP2006211152A (ja) * 2005-01-26 2006-08-10 Hokkaido Univ 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化用プログラム、画像復号用プログラム
JP4775756B2 (ja) * 2005-03-18 2011-09-21 富士ゼロックス株式会社 復号化装置及びそのプログラム
US8050331B2 (en) * 2005-05-20 2011-11-01 Ntt Docomo, Inc. Method and apparatus for noise filtering in video coding
US8189934B2 (en) * 2006-03-27 2012-05-29 Panasonic Corporation Image coding apparatus and image decoding apparatus
EP1841230A1 (en) 2006-03-27 2007-10-03 Matsushita Electric Industrial Co., Ltd. Adaptive wiener filter for video coding
US20080101469A1 (en) * 2006-10-31 2008-05-01 Motorola, Inc. Method and apparatus for adaptive noise filtering of pixel data
EP1944974A1 (en) * 2007-01-09 2008-07-16 Matsushita Electric Industrial Co., Ltd. Position dependent post-filter hints
EP2141927A1 (en) * 2008-07-03 2010-01-06 Panasonic Corporation Filters for video coding
EP2161936A1 (en) * 2008-09-04 2010-03-10 Panasonic Corporation Locally adaptive filters for video coding controlled by local correlation data

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017065509A3 (ko) * 2015-10-13 2017-06-29 엘지전자 주식회사 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
US10701356B2 (en) 2015-10-13 2020-06-30 Lg Electronic Inc. Image decoding method and apparatus by deriving a frequency component based on filtering in image coding system
WO2017065357A1 (ko) * 2015-10-16 2017-04-20 엘지전자 주식회사 영상 코딩 시스템에서 예측 향상을 위한 필터링 방법 및 장치
US10602141B2 (en) 2015-10-16 2020-03-24 Lg Electronics Inc. Filtering method and apparatus for improving prediction in image coding system
KR20190103315A (ko) * 2017-01-05 2019-09-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 화상의 블록 기반 예측 코딩 및 디코딩
US11115682B2 (en) 2017-01-05 2021-09-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Block-based predictive coding and decoding of a picture
KR20220116352A (ko) * 2017-01-05 2022-08-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 화상의 블록 기반 예측 코딩 및 디코딩
US11729426B2 (en) 2017-01-05 2023-08-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Block-based predictive coding and decoding of a picture

Also Published As

Publication number Publication date
EP2352293A4 (en) 2012-05-09
CN102227910A (zh) 2011-10-26
US20110228843A1 (en) 2011-09-22
EP2192786A1 (en) 2010-06-02
EP2352293A1 (en) 2011-08-03
WO2010061607A1 (ja) 2010-06-03
JPWO2010061607A1 (ja) 2012-04-26

Similar Documents

Publication Publication Date Title
WO2010061607A1 (ja) 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化方法、プログラム、及び集積回路
JP5485983B2 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置および動画像復号装置
WO2010026770A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、システム、プログラム、及び集積回路
KR101746251B1 (ko) 필터 위치 결정 및 선택
KR101667836B1 (ko) 비디오 코딩에서 단예측 인접자들에 기초한 양예측 머지 모드
WO2010143427A1 (ja) 画像符号化方法、画像復号方法、およびそれらの装置
JP5588438B2 (ja) 画像符号化方法及び画像符号化装置
KR20110118641A (ko) 화상 부호화 방법 및 화상 복호 방법
WO2010050156A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、集積回路およびプログラム
JP5659160B2 (ja) 動画像復号装置、動画像符号化装置、動画像復号回路及び動画像復号方法
KR20120046724A (ko) 부호화 방법, 복호 방법, 부호화 장치 및 복호 장치
WO2011128023A1 (en) Complexity reduction for 1/8-pel interpolation
WO2011128055A1 (en) Efficient storing of picture representation using adaptive non-uniform quantizer
WO2011089865A1 (ja) 画像符号化方法、画像復号方法、それらの装置、プログラムおよび集積回路
CA2830242A1 (en) Bi-predictive merge mode based on uni-predictive neighbors in video coding
JP2011182132A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、集積回路およびプログラム

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid