KR20120123326A - 화상 처리 장치 및 방법 - Google Patents

화상 처리 장치 및 방법 Download PDF

Info

Publication number
KR20120123326A
KR20120123326A KR20127018240A KR20127018240A KR20120123326A KR 20120123326 A KR20120123326 A KR 20120123326A KR 20127018240 A KR20127018240 A KR 20127018240A KR 20127018240 A KR20127018240 A KR 20127018240A KR 20120123326 A KR20120123326 A KR 20120123326A
Authority
KR
South Korea
Prior art keywords
image
prediction
unit
weighting
motion
Prior art date
Application number
KR20127018240A
Other languages
English (en)
Inventor
가즈시 사또
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20120123326A publication Critical patent/KR20120123326A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/04Colour television systems using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors

Abstract

본 발명은 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있도록 하는 화상 처리 장치 및 방법에 관한 것이다. 휘도용 가중치 부여 움직임 보상부(96)는 움직임 보상부(82)로부터 움직임 벡터 정보가 가리키는 참조 화상 화소값이 입력되면, 휘도용 가중·오프셋 산출부(94)로부터의 가중 계수 및 오프셋값을 사용하여, 휘도 신호 및 색차 신호(RGB의 경우)에 대한 가중치 부여 예측 처리를 행한다. 색차용 가중치 부여 움직임 보상부(97)는 움직임 보상부(82)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값이 입력되면, 색차용 가중·오프셋 산출부(95)로부터의 가중 계수 및 오프셋값을 사용하여, 색차 신호(YCbCr의 경우)에 대한 가중치 부여 예측 처리를 행한다. 본 발명은 예를 들어, H.264/AVC 방식을 기초로 하여 부호화하는 화상 부호화 장치에 적용할 수 있다.

Description

화상 처리 장치 및 방법{IMAGE PROCESSING DEVICE AND METHOD}
본 발명은 화상 처리 장치 및 방법에 관한 것으로, 특히, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시키도록 한 화상 처리 장치 및 방법에 관한 것이다.
최근 들어, 화상 정보를 디지털로서 취급하고, 그 때, 효율이 높은 정보의 전송, 축적을 목적으로 하여, 화상 정보 특유의 장황성을 이용하여, 이산 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축하는 부호화 방식을 채용하여 화상을 압축 부호하는 장치가 보급되고 있다. 이 부호화 방식에는, 예를 들어, MPEG(Moving Picture Experts Group) 등이 있다.
특히, MPEG2(ISO/IEC 13818-2)는 범용 화상 부호화 방식으로서 정의되어 있고, 비월 주사 화상 및 순차 주사 화상의 양쪽 및 표준 해상도 화상 및 고정밀 화상을 망라하는 표준이다. 예를 들어, MPEG2는 프로페셔널 용도 및 소비자 용도의 광범위한 어플리케이션에 현재 널리 사용되고 있다. MPEG2 압축 방식을 사용함으로써, 예를 들어 720×480 화소를 갖는 표준 해상도의 비월 주사 화상이면 4 내지 8 Mbps의 부호량(비트레이트)이 할당된다. 또한, MPEG2 압축 방식을 사용함으로써, 예를 들어 1920×1088 화소를 갖는 고해상도의 비월 주사 화상이면 18 내지 22 Mbps의 부호량(비트레이트)이 할당된다. 이에 의해, 높은 압축률과 양호한 화질의 실현이 가능하다.
MPEG2는 주로 방송용에 적합한 고화질 부호화를 대상으로 하고 있었지만, MPEG1보다 낮은 부호량(비트레이트), 즉 보다 높은 압축률의 부호화 방식에는 대응하고 있지 않았다. 휴대 단말기의 보급에 의해, 앞으로 그러한 부호화 방식의 요구는 높아진다고 생각되며, 이에 대응하여 MPEG4 부호화 방식의 표준화가 행해졌다. 화상 부호화 방식에 대해서는 1998년 12월에 ISO/IEC 14496-2로서 그 규격이 국제 표준으로 승인되었다.
또한, 최근 들어, 당초 텔레비전 회의용 화상 부호화를 목적으로 하여, H.26L(ITU-T Q6/16VCEG)이라고 하는 표준의 규격화가 진행되고 있다. H.26L은 MPEG2나 MPEG4와 같은 종래의 부호화 방식에 비해, 그 부호화, 복호화에 보다 많은 연산량이 요구되기는 하지만, 보다 높은 부호화 효율이 실현되는 것이 알려져 있다. 또한, 현재, MPEG4의 활동의 일환으로서, 이 H.26L을 기초로 하여, H.26L에서는 서포트되지 않는 기능도 받아들여, 보다 높은 부호화 효율을 실현하는 표준화가 Joint Model of Enhanced-Compression Video Coding으로서 행해지고 있다. 표준화의 스케줄로서는, 2003년 3월에는 H.264 및 MPEG-4 Part10(Advanced Video Coding, 이하 H.264/AVC라 기재함)이라고 하는 국제 표준으로 되어 있다.
또한, 그 확장으로서, RGB나 4:2:2, 4:4:4와 같은, 업무용에 필요한 부호화 툴이나, MPEG-2에서 규정되어 있던 8x8DCT나 양자화 매트릭스도 포함한 FRExt(Fidelity Range Extension)의 표준화가 2005년 2월에 완료되었다. 이에 의해, H.264/AVC를 사용하여, 영화에 포함되는 필름 노이즈도 양호하게 나타내는 것이 가능한 부호화 방식으로 되고, Blu-Ray Disc(상표) 등의 폭넓은 어플리케이션에 사용되게 되었다.
그러나, 최근 들어, 하이비젼 화상의 4배인, 4000×2000 화소 정도의 화상을 압축하고자 하거나, 또는 인터넷과 같은 한정된 전송 용량의 환경에 있어서, 하이비젼 화상을 배신하고자 하는, 더 이상의 고압축율 부호화에 대한 요구가 높아지고 있다. 이 때문에, 상술한, ITU-T 산하의 VCEG(=Video Coding Expert Group)에 있어서, 부호화 효율의 개선에 관한 검토가 계속 행해지고 있다.
예를 들어, MPEG2나 MPEG4 방식에 있어서는, 페이드 씬과 같이 움직임이 존재하지만, 밝기가 변화하는 시퀀스에 있어서, 밝기의 변화를 흡수하는 부호화 툴이 준비되어 있지 않기 때문에, 부호화 효율이 저하할 우려가 있었다.
이에 반해, H.264/AVC 방식에 있어서는, 비특허 문헌 1에 있어서도 제안되고 있는 가중치 부여 예측 처리를 행하는 것이 가능하다.
가중치 부여 예측 처리란, P 픽쳐에 있어서는, Y0를 움직임 보상 예측 신호(참조 화상 화소값)라 하고, 가중 계수 W0 및 오프셋값을 D라 하면, 다음 수학식 1과 같이 예측 신호가 생성된다.
Figure pct00001
또한, B 픽쳐에 있어서는, List0 및 List1에 대한 움직임 보상 예측 신호를 Y0 및 Y1이라 하고, 각각에 대한 가중 계수를 W0 및 W1 및 오프셋값을 D라 하면, 다음 수학식 2와 같이 예측 신호가 생성된다.
Figure pct00002
또한, H.264/AVC 방식에 있어서는, 슬라이스 단위로, 이 가중치 부여 예측을 사용한다, 사용하지 않는다를 지정하는 것이 가능하다.
또한, H.264/AVC 방식의 가중치 부여 예측에는, 슬라이스 헤더에, W 및 D를 부가하여 보내는 Explicit Mode 및 해당 픽쳐와 참조 픽쳐에 있어서의 시간축 상에서의 거리로부터 W를 산출하는 Implicit Mode가 규정되어 있다.
2개의 모드 중, P 픽쳐에 있어서는 Explicit Mode만 사용하는 것이 가능하며, B 픽쳐에 있어서는 Explicit Mode와 Implicit Mode의 양쪽을 사용하는 것이 가능하다.
그런데, 컬러 화상 신호의 화상 압축을 행할 때, RGB 신호를, 다음 수학식 3과 같이 휘도 신호 Y 및 색차 신호 Cb, Cr로 변환하고, 그 후의 처리가 행해진다.
Figure pct00003
여기서, 휘도 신호 Y는 밝기를 나타내는 성분이고, 그 값은 0 내지 1의 범위에 든다. 8 비트로 나타내어지는 경우에는, 이것이 0 내지 255로 나타내어지게 된다.
한편, 색차 신호 Cb, Cr은 색의 강도나 종류를 나타내는 성분이며, 그 값은 -0.5 내지 0.5의 범위에 든다. 8 비트로 나타내어지는 경우에는, 128을 중심으로 하여, 0 내지 255로 나타내어지게 된다.
일반적으로 휘도 신호에 비해, 색차 신호는 해상도가 낮기 때문에, 4:2:2나 4:2:0과 같이, 화상 압축에서는 색차 신호에 대해서는, 휘도 신호에 비하여 보다 낮은 해상도의 포맷이 사용된다.
또한, H.264/AVC 방식에 있어서, 매크로 블록 사이즈는 16×16 화소이다. 그러나, 매크로 블록 사이즈를 16×16 화소로 하는 것은, 차세대 부호화 방식의 대상이 되는 UHD(Ultra High Definition; 4000×2000 화소)와 같은 큰 화면 프레임에 대해서는 최적이 아니다.
따라서, 비특허문헌 2 등에 있어서는 매크로 블록 사이즈를, 예를 들어 32×32 화소와 같은 크기로 확장하는 것도 제안되고 있다.
"Improved multiple frame motion compensation using frame interpolation", JVT-B075, 2002년 1월 "Video Coding Using Extended Block Sizes", VCEG-AD09, ITU-Telecommunications Standardization Sector STUDY GROUP Question 16- Contribution 123, Jan 2009
그런데, 전술한 바와 같이, 8비트의 화상 신호에 있어서, 휘도 신호가 128인 경우, 0.5를 의미하지만, 색차 신호가 128인 경우, 0을 의미하고 있다. 그러나, H.264/AVC 방식에 있어서의 가중치 부여 예측에 대해서는, 휘도 신호 및 색차 신호에서 마찬가지의 처리를 행하고 있다. 따라서, 휘도 신호에 비해, 색차 신호에 대한 예측 효율이 낮아져 버리는 경우가 있었다.
본 발명은 이러한 상황을 감안하여 이루어진 것으로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있는 것이다.
본 발명의 제1 측면의 화상 처리 장치는, 화상의 부호화 대상인 블록의 움직임 벡터를 탐색하는 움직임 탐색 수단과, 상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 움직임 탐색 수단에 의해 탐색된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 가중치 부여 예측 수단을 구비한다.
상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 색차 성분에 대하여 가중 계수 및 오프셋을 산출하는 계수 산출 수단을 더 구비하고, 상기 가중치 부여 예측 수단은, 상기 계수 산출 수단에 의해 산출된 상기 가중 계수 및 오프셋과, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대해서는 상기 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행할 수 있다.
상기 가중치 부여 예측 수단은, 상기 색차 성분에 대해서는, 상기 화상의 입력 비트 정밀도와 픽쳐 타입에 따라서 가중치 부여 예측을 행할 수 있다.
상기 가중치 부여 예측 수단은, P 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0를 상기 참조 화상 화소값, W0 및 D를 각각 가중 예측을 위한 가중 계수 및 오프셋으로 하면, W0*(Y0-2n-1)+D+2n-1과 같이 가중치 부여 예측을 행할 수 있다.
상기 가중치 부여 예측 수단은, B 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0 및 Y1을 각각 List0 및 List1의 상기 참조 화상 화소값, W0, W1 및 D를 각각 가중 예측을 위한 List0 및 List1에 대한 가중 계수 및 오프셋으로 하면, W0*(Y0-2n-1)+W1*(Y1-2n-1)D+2n-1과 같이 가중치 부여 예측을 행할 수 있다.
상기 화상의 색 포맷이 RGB 포맷인 경우, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대하여 상기 휘도 성분에 대한 것과 동일한 가중치 부여 예측을 행할 수 있다.
본 발명의 제1 측면의 화상 처리 방법은, 화상 처리 장치의 움직임 탐색 수단이, 화상의 부호화 대상인 블록의 움직임 벡터를 탐색하고, 상기 화상 처리 장치의 가중치 부여 예측 수단이, 상기 화상의 색 포맷이 YCbCr 포맷인 경우, 탐색된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행한다.
본 발명의 제2 측면의 화상 처리 장치는, 부호화되어 있는 화상의 복호 대상인 블록의 움직임 벡터를 복호하는 복호 수단과, 상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 복호 수단에 의해 복호된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 가중치 부여 예측 수단을 구비한다.
상기 가중치 부여 예측 수단은, 상기 색차 성분에 대해서는, 상기 화상의 입력 비트 정밀도와 픽쳐 타입에 따라서 가중치 부여 예측을 행할 수 있다.
상기 가중치 부여 예측 수단은, P 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0를 상기 참조 화상 화소값, W0 및 D를 각각 가중 예측을 위한 가중 계수 및 오프셋으로 하면, W0*(Y0-2n-1)+D+2n-1과 같이 가중치 부여 예측을 행할 수 있다.
상기 가중치 부여 예측 수단은, B 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0 및 Y1을 각각 List0 및 List1의 상기 참조 화상 화소값, W0, W1 및 D를 각각 가중 예측을 위한 List0 및 List1에 대한 가중 계수 및 오프셋으로 하면, W0*(Y0-2n-1)+W1*(Y1-2n-1) D+2n-1과 같이 가중치 부여 예측을 행할 수 있다.
상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 색차 성분에 대하여 가중 계수를 산출하는 계수 산출 수단을 더 구비하고, 상기 가중치 부여 예측 수단은, 상기 계수 산출 수단에 의해 산출된 상기 가중 계수와, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대해서는, 상기 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행할 수 있다.
상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 복호 수단은, 상기 색차 성분에 대한 상기 가중 계수 및 오프셋을 복호하고, 상기 가중치 부여 예측 수단은, 상기 복호 수단에 의해 복호된 상기 가중 계수 및 오프셋과, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대해서는, 상기 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행할 수 있다.
상기 화상의 색 포맷이 RGB 포맷인 경우, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대하여 상기 휘도 성분에 대한 것과 동일한 가중치 부여 예측을 행할 수 있다.
본 발명의 제2 측면의 화상 처리 방법은, 화상 처리 장치의 복호 수단이, 부호화되어 있는 화상의 복호 대상인 블록의 움직임 벡터를 복호하고, 상기 화상 처리 장치의 가중치 부여 예측 수단이, 상기 화상의 색 포맷이 YCbCr 포맷인 경우, 복호된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행한다.
본 발명의 제1 측면에 있어서는, 화상의 부호화 대상인 블록의 움직임 벡터가 탐색된다. 그리고, 상기 화상의 색 포맷이 YCbCr 포맷인 경우, 탐색된 움직임 벡터가 가리키는 참조 화상 화소값이 사용되고, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측이 행해진다.
본 발명의 제2 측면에 있어서는, 부호화되어 있는 화상의 복호 대상인 블록의 움직임 벡터가 복호된다. 그리고, 상기 화상의 색 포맷이 YCbCr 포맷인 경우, 복호된 움직임 벡터가 가리키는 참조 화상 화소값이 사용되고, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측이 행해진다.
또한, 전술한 화상 처리 장치의 각각은, 독립된 장치여도 되고, 1개의 화상 부호화 장치 또는 화상 복호 장치를 구성하고 있는 내부 블록이어도 된다.
본 발명에 따르면, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
도 1은 본 발명을 적용한 화상 부호화 장치의 일 실시 형태의 구성을 도시하는 블록도이다.
도 2는 1/4 화소 정밀도의 움직임 예측·보상 처리를 설명하는 도면이다.
도 3은 가변 블록 사이즈 움직임 예측·보상 처리를 설명하는 도면이다.
도 4는 멀티 참조 프레임의 움직임 예측·보상 방식에 대하여 설명하는 도면이다.
도 5는 움직임 벡터 정보의 생성 방법의 예를 설명하는 도면이다.
도 6은 Implicit Mode의 경우의 가중 계수 및 오프셋의 산출 방법을 설명하는 도면이다.
도 7은 움직임 탐색 방법을 설명하는 도면이다.
도 8은 도 1의 움직임 예측·보상부 및 가중치 부여 예측부의 구성예를 도시하는 블록도이다.
도 9는 도 1의 화상 부호화 장치의 부호화 처리를 설명하는 플로우차트이다.
도 10은 도 9의 스텝 S21의 인트라 예측 처리를 설명하는 플로우차트이다.
도 11은 도 9의 스텝 S22의 인터 움직임 예측 처리를 설명하는 플로우차트이다.
도 12는 도 11의 스텝 S54의 가중 예측 처리를 설명하는 플로우차트이다.
도 13은 본 발명을 적용한 화상 복호 장치의 일 실시 형태의 구성을 도시하는 블록도이다.
도 14는 도 13의 움직임 예측·보상부 및 가중치 부여 예측부의 구성예를 도시하는 블록도이다.
도 15는 도 13의 화상 복호 장치의 복호 처리를 설명하는 플로우차트이다.
도 16은 도 15의 스텝 S138의 예측 처리를 설명하는 플로우차트이다.
도 17은 도 16의 스텝 S175의 예측 처리를 설명하는 플로우차트이다.
도 18은 확장 매크로 블록의 예를 도시하는 도면이다.
도 19는 컴퓨터의 하드웨어의 구성예를 도시하는 블록도이다.
도 20은 본 발명을 적용한 텔레비전 수상기의 주된 구성예를 도시하는 블록도이다.
도 21은 본 발명을 적용한 휴대 전화기의 주된 구성예를 도시하는 블록도이다.
도 22는 본 발명을 적용한 하드디스크 레코더의 주된 구성예를 도시하는 블록도이다.
도 23은 본 발명을 적용한 카메라의 주된 구성예를 도시하는 블록도이다.
도 24는 HEVC에서 정의되어 있는 Coding Unit의 예를 도시하는 도면이다.
이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 설명한다.
[화상 부호화 장치의 구성예]
도 1은 본 발명을 적용한 화상 처리 장치로서의 화상 부호화 장치의 일 실시 형태의 구성을 도시하고 있다.
이 화상 부호화 장치(51)는, 예를 들어 H.264 및 MPEG-4 Part10(Advanced Video Coding)(이하 H.264/AVC라 함) 방식을 기초로 하여, 화상을 압축 부호화한다.
도 1의 예에 있어서, 화상 부호화 장치(51)는 A/D 변환부(61), 화면 재배열 버퍼(62), 연산부(63), 직교 변환부(64), 양자화부(65), 가역 부호화부(66), 축적 버퍼(67), 역양자화부(68), 역직교 변환부(69), 연산부(70), 디블록 필터(71), 프레임 메모리(72), 스위치(73), 인트라 예측부(74), 움직임 예측·보상부(75), 가중치 부여 예측부(76), 예측 화상 선택부(77) 및 레이트 제어부(78)에 의해 구성되어 있다.
A/D 변환부(61)는, 입력된 화상을 A/D 변환하고, 화면 재배열 버퍼(62)에 출력하고, 기억시킨다. 화면 재배열 버퍼(62)는 기억한 표시의 차례의 프레임의 화상을, GOP(Group of Picture)에 따라서, 부호화를 위한 프레임의 순서대로 재배열한다.
연산부(63)는, 화면 재배열 버퍼(62)로부터 판독된 화상으로부터, 예측 화상 선택부(77)에 의해 선택된 인트라 예측부(74)로부터의 예측 화상 또는 움직임 예측·보상부(75)로부터의 예측 화상을 감산하고, 그 차분 정보를 직교 변환부(64)에 출력한다. 직교 변환부(64)는 연산부(63)로부터의 차분 정보에 대하여, 이산 코사인 변환, 카루넨 루베 변환 등의 직교 변환을 실시하고, 그 변환 계수를 출력한다. 양자화부(65)는 직교 변환부(64)가 출력하는 변환 계수를 양자화한다.
양자화부(65)의 출력이 되는, 양자화된 변환 계수는, 가역 부호화부(66)에 입력되고, 여기서 가변 길이 부호화, 산술 부호화 등의 가역 부호화가 실시되고, 압축된다.
가역 부호화부(66)는 인트라 예측을 나타내는 정보를 인트라 예측부(74)로부터 취득하고, 인터 예측 모드를 나타내는 정보 등을 움직임 예측·보상부(75)로부터 취득한다. 또한, 인트라 예측을 나타내는 정보 및 인터 예측을 나타내는 정보는 이하, 각각, 인트라 예측 모드 정보 및 인터 예측 모드 정보라 칭한다.
가역 부호화부(66)는 양자화된 변환 계수를 부호화 함과 함께, 인트라 예측을 나타내는 정보, 인터 예측 모드를 나타내는 정보 등을 부호화하고, 압축 화상에 있어서의 헤더 정보의 일부로 한다. 가역 부호화부(66)는 부호화한 데이터를 축적 버퍼(67)에 공급하여 축적시킨다.
예를 들어, 가역 부호화부(66)에 있어서는, 가변 길이 부호화 또는 산술 부호화 등의 가역 부호화 처리가 행해진다. 가변 길이 부호화로서는, H.264/AVC 방식에서 정해져 있는 CAVLC(Context-Adaptive Variable Length Coding) 등을 들 수 있다. 산술 부호화로서는, CABAC(Context-Adaptive Binary Arithmetic Coding) 등을 들 수 있다.
축적 버퍼(67)는, 가역 부호화부(66)로부터 공급된 데이터를, 부호화된 압축 화상으로서, 예를 들어 후단의 도시하지 않은 기록 장치나 전송로 등에 출력한다.
또한, 양자화부(65)로부터 출력된, 양자화된 변환 계수는, 역양자화부(68)에도 입력되고, 역양자화된 후, 또한 역직교 변환부(69)에 있어서 역직교 변환된다. 역직교 변환된 출력은 연산부(70)에 의해 예측 화상 선택부(77)로부터 공급되는 예측 화상과 가산되고, 국부적으로 복호된 화상이 된다. 디블록 필터(71)는 복호된 화상의 블록 왜곡을 제거한 후, 프레임 메모리(72)에 공급하고, 축적시킨다. 프레임 메모리(72)에는, 디블록 필터(71)에 의해 디블록 필터 처리되기 전의 화상도 공급되고, 축적된다.
스위치(73)는 프레임 메모리(72)에 축적된 참조 화상을 움직임 예측·보상부(75) 또는 인트라 예측부(74)에 출력한다.
이 화상 부호화 장치(51)에 있어서는, 예를 들어 화면 재배열 버퍼(62)로부터의 I 픽쳐, B 픽쳐 및 P 픽쳐가, 인트라 예측(인트라 처리라 칭함)하는 화상으로서, 인트라 예측부(74)에 공급된다. 또한, 화면 재배열 버퍼(62)로부터 판독된 B 픽쳐 및 P 픽쳐가, 인터 예측(인터 처리라 칭함)하는 화상으로서, 움직임 예측·보상부(75)에 공급된다.
인트라 예측부(74)는, 화면 재배열 버퍼(62)로부터 판독된 인트라 예측하는 화상과 프레임 메모리(72)로부터 공급된 참조 화상에 기초하여, 후보가 되는 모든 인트라 예측 모드의 인트라 예측 처리를 행하고, 예측 화상을 생성한다. 그 때, 인트라 예측부(74)는 후보가 되는 모든 인트라 예측 모드에 대하여 비용 함수값을 산출하고, 산출한 비용 함수값이 최소값을 부여하는 인트라 예측 모드를, 최적 인트라 예측 모드로서 선택한다.
인트라 예측부(74)는, 최적 인트라 예측 모드에서 생성된 예측 화상과 그 비용 함수값을, 예측 화상 선택부(77)에 공급한다. 인트라 예측부(74)는 예측 화상 선택부(77)에 의해 최적 인트라 예측 모드에서 생성된 예측 화상이 선택된 경우, 최적 인트라 예측 모드를 나타내는 정보를, 가역 부호화부(66)에 공급한다. 가역 부호화부(66)는, 이 정보를 부호화하고, 압축 화상에 있어서의 헤더 정보의 일부로 한다.
움직임 예측·보상부(75)에는, 화면 재배열 버퍼(62)로부터 판독된 인터 처리하는 화상과, 스위치(73)를 거쳐 프레임 메모리(72)로부터 참조 화상이 공급된다. 움직임 예측·보상부(75)는, 후보가 되는 모든 인터 예측 모드의 움직임 탐색(예측)을 행한다.
그리고, 가중치 부여 예측부(76)에 의해 가중치 부여 예측을 행하는 것을 나타내는 제어 신호가 입력된 경우, 움직임 예측·보상부(75)는 가중치 부여 예측을 행하는 것을 나타내는 제어 신호와 함께, 탐색한 움직임 벡터가 가리키는 참조 화상을, 가중치 부여 예측부(76)에 공급한다. 가중치 부여 예측부(76)에 의해 가중치 부여 예측을 행하지 않는 것을 나타내는 제어 신호가 입력된 경우, 움직임 예측·보상부(75)는, 탐색한 움직임 벡터를 사용하여, 참조 화상에 보상 처리를 실시하고, 예측 화상을 생성한다.
움직임 예측·보상부(75)는, 생성한 예측 화상, 또는, 가중치 부여 예측부(76)로부터의 예측 화상 등을 사용하여, 후보가 되는 모든 인터 예측 모드에 대하여 비용 함수값을 산출한다. 움직임 예측·보상부(75)는, 산출한 비용 함수값 중, 최소값을 부여하는 예측 모드를, 최적 인터 예측 모드로서 결정하고, 최적 인터 예측 모드에서 생성된 예측 화상과 그 비용 함수값을, 예측 화상 선택부(77)에 공급한다. 움직임 예측·보상부(75)는, 예측 화상 선택부(77)에 의해 최적 인터 예측 모드에서 생성된 예측 화상이 선택된 경우, 최적 인터 예측 모드를 나타내는 정보(인터 예측 모드 정보)를 가역 부호화부(66)에 출력한다.
이때, 움직임 벡터 정보, 참조 프레임 정보 등도 가역 부호화부(66)에 출력된다. 가역 부호화부(66)는 움직임 예측·보상부(75)로부터의 정보를 역시 가변 길이 부호화, 산술 부호화와 같은 가역 부호화 처리하고, 압축 화상의 헤더부에 삽입한다.
가중치 부여 예측부(76)에는 화면 재배열 버퍼(62)로부터 인터 처리하는 화상이 입력된다. 가중치 부여 예측부(76)는 입력된 화상의 밝기의 변화를 보는 것에 의해 가중치 부여 예측을 행할지 여부를 판정하고, 그 판정 결과를 나타내는 제어 신호를, 움직임 예측·보상부(75)에 공급함과 함께, 입력된 화상의 색 포맷을 식별한다.
또한, 가중치 부여 예측부(76)에는 움직임 예측·보상부(75)로부터, 가중치 부여 예측이 행해지는 것을 나타내는 제어 신호와, 움직임 벡터가 가리키는 참조 화상이 입력된다. 가중치 부여 예측부(76)는 움직임 예측·보상부(75)로부터의 제어 신호가 입력되면, 색 포맷에 따른 가중 계수와 오프셋값을 산출한다. 이 가중 계수와 오프셋값은, 필요에 따라서, 가역 부호화부(66)에 출력된다.
가중치 부여 예측부(76)는 입력된 참조 화상을 사용하여, 식별된 색 포맷에 따른 가중 계수와 오프셋값에 의한 가중치 부여 예측을 행하여, 예측 화상을 생성한다. 생성된 예측 화상은, 움직임 예측·보상부(75)에 공급된다.
예측 화상 선택부(77)는 인트라 예측부(74) 또는 움직임 예측·보상부(75)로부터 출력된 각 비용 함수값에 기초하여, 최적 인트라 예측 모드와 최적 인터 예측 모드로부터, 최적 예측 모드를 결정한다. 그리고, 예측 화상 선택부(77)는 결정된 최적 예측 모드의 예측 화상을 선택하고, 연산부(63, 70)에 공급한다. 이때, 예측 화상 선택부(77)는 예측 화상의 선택 정보를, 인트라 예측부(74) 또는 움직임 예측·보상부(75)에 공급한다.
레이트 제어부(78)는 축적 버퍼(67)에 축적된 압축 화상에 기초하여, 오버플로우 또는 언더플로우가 발생하지 않도록, 양자화부(65)의 양자화 동작의 레이트를 제어한다.
[H.264/AVC 방식의 설명]
다음으로, 화상 부호화 장치(51)에 있어서 기초로 되어 있는 H.264/AVC 방식에 대하여 설명한다.
예를 들어, MPEG2 방식에 있어서는, 선형 내삽 처리에 의해 1/2 화소 정밀도의 움직임 예측·보상 처리가 행해지고 있다. 이에 반해, H.264/AVC 방식에 있어서는, 내삽 필터로서, 6탭의 FIR(Finite Impulse Response Filter) 필터를 사용한 1/4 화소 정밀도의 예측 보상 처리가 행해지고 있다.
도 2는 H.264/AVC 방식에 있어서의 1/4 화소 정밀도의 예측 보상 처리를 설명하는 도면이다. H.264/AVC 방식에 있어서는, 6탭의 FIR(Finite Impulse Response Filter) 필터를 사용한 1/4 화소 정밀도의 예측 보상 처리가 행해지고 있다.
도 2의 예에 있어서, 위치 A는, 정수 정밀도 화소의 위치, 위치 b, c, d는, 1/2 화소 정밀도의 위치, 위치 e1, e2, e3은 1/4 화소 정밀도의 위치를 나타내고 있다. 우선, 이하에서는, Clip()을 다음 수학식 4와 같이 정의한다.
Figure pct00004
또한, 입력 화상이 8비트 정밀도인 경우, max_pix의 값은 255가 된다.
위치 b 및 d에 있어서의 화소값은, 6탭의 FIR 필터를 사용하여, 다음 수학식 5와 같이 생성된다.
Figure pct00005
위치 c에 있어서의 화소값은, 수평 방향 및 수직 방향에 6탭의 FIR 필터를 적용하고, 다음 수학식 6과 같이 생성된다.
Figure pct00006
또한, Clip 처리는 수평 방향 및 수직 방향의 곱의 합 처리의 양쪽을 행한후, 마지막으로 한번만 실행된다.
위치 e1 내지 e3은 다음 수학식 7과 같이 선형 내삽에 의해 생성된다.
Figure pct00007
또한, 예를 들어 MPEG2 방식에 있어서는, 프레임 움직임 보상 모드의 경우에는, 16×16 화소, 필드 움직임 보상 모드의 경우에는, 제1 필드, 제2 필드의 각각에 대하여 16×8 화소를 단위로 하여 움직임 예측·보상 처리가 행해지고 있다.
이에 반해, H.264/AVC 방식의 움직임 예측·보상에 있어서는, 매크로 블록 사이즈는, 16×16 화소이지만, 블록 사이즈를 가변으로 해서, 움직임 예측·보상이 행해진다.
도 3은 H.264/AVC 방식에 있어서의 움직임 예측·보상의 블록 사이즈의 예를 도시하는 도면이다.
도 3의 상단에는, 좌측부터, 16×16 화소, 16×8 화소, 8×16 화소 및 8×8 화소의 파티션으로 분할된 16×16 화소로 구성되는 매크로 블록이 순서대로 나타내어져 있다. 또한, 도 3의 하단에는, 좌측부터, 8×8 화소, 8×4 화소, 4×8 화소 및 4×4 화소의 서브 파티션으로 분할된 8×8 화소의 파티션이 순서대로 나타내어져 있다.
즉, H.264/AVC 방식에 있어서는, 1개의 매크로 블록을, 16×16 화소, 16×8 화소, 8×16 화소, 또는 8×8 화소 중 어느 하나의 파티션으로 분할하여, 각각 독립된 움직임 벡터 정보를 갖는 것이 가능하다. 또한, 8×8 화소의 파티션에 관해서는, 8×8 화소, 8×4 화소, 4×8 화소, 또는 4×4 화소 중 어느 하나의 서브 파티션으로 분할하고, 각각 독립된 움직임 벡터 정보를 갖는 것이 가능하다.
또한, H.264/AVC 방식에 있어서는, 멀티 참조 프레임의 예측·보상 처리도 행해지고 있다.
도 4는 H.264/AVC 방식에 있어서의 멀티 참조 프레임의 예측·보상 처리를 설명하는 도면이다. H.264/AVC 방식에 있어서는, 멀티 참조 프레임(Multi-Reference Frame)의 움직임 예측·보상 방식이 정해져 있다.
도 4의 예에 있어서는, 지금부터 부호화될 대상 프레임 Fn과, 부호화 완료된 프레임 Fn-5, …, Fn-1이 나타내어져 있다. 프레임 Fn-1은, 시간축 상, 대상 프레임 Fn의 1개 전의 프레임이며, 프레임 Fn-2는, 대상 프레임 Fn의 2개 전의 프레임이며, 프레임 Fn-3은, 대상 프레임 Fn의 3개 전의 프레임이다. 또한, 프레임 Fn-4는, 대상 프레임 Fn의 4개 전의 프레임이며, 프레임 Fn-5는, 대상 프레임 Fn의 5개 전의 프레임이다. 일반적으로는, 대상 프레임 Fn에 대하여 시간축 상에 가까운 프레임일수록, 작은 참조 픽쳐 번호(ref_id)가 부가된다. 즉, 프레임 Fn-1이 가장 참조 픽쳐 번호가 작고, 이후, Fn-2, …, Fn-5의 순으로 참조 픽쳐 번호가 작다.
대상 프레임 Fn에는, 블록 A1과 블록 A2가 나타내어져 있고, 블록 A1은 2개 전의 프레임 Fn-2의 블록 A1'와 상관이 있는 것으로 되어, 움직임 벡터 V1이 탐색되어 있다. 또한, 블록 A2는, 4개 전의 프레임 Fn-4의 블록 A1'와 상관이 있는 것으로 되어, 움직임 벡터 V2가 탐색되어 있다.
이상과 같이, H.264/AVC 방식에 있어서는, 복수의 참조 프레임을 메모리에 저장해 두고, 1매의 프레임(픽쳐)에 있어서, 서로 다른 참조 프레임을 참조하는 것이 가능하다. 즉, 예를 들어 블록 A1이 프레임 Fn-2를 참조하여, 블록 A2가 프레임 Fn-4를 참조하고 있는 바와 같이, 1매의 픽쳐에 있어서, 블록마다 각각 독립된 참조 프레임 정보(참조 픽쳐 번호(ref_id))를 가질 수 있다.
여기서, 블록이란, 도 3을 참조하여 상술한 16×16 화소, 16×8 화소, 8×16 화소 및 8×8 화소의 파티션 중 어느 하나를 나타낸다. 8×8 서브 블록 내에 있어서의 참조 프레임은 동일해야만 한다.
이상과 같이, H.264/AVC 방식에 있어서는, 도 2를 참조하여 상술한 1/4 화소 정밀도의 움직임 예측·보상 처리 및 도 3 및 도 4를 참조하여 전술한 바와 같은 움직임 예측·보상 처리가 행해짐으로써, 방대한 움직임 벡터 정보가 생성된다. 이 방대한 움직임 벡터 정보를 그대로 부호화하는 것은, 부호화 효율의 저하를 초래해버린다. 이에 반해, H.264/AVC 방식에 있어서는, 도 5에 도시하는 방법에 의해, 움직임 벡터의 부호화 정보의 저감이 실현되고 있다.
도 5는 H.264/AVC 방식에 의한 움직임 벡터 정보의 생성 방법에 대하여 설명하는 도면이다.
도 5의 예에 있어서, 지금부터 부호화될 대상 블록 E(예를 들어, 16×16 화소)와, 이미 부호화 완료되고, 대상 블록 E에 인접하는 블록 A 내지 D가 나타내어져 있다.
즉, 블록 D는 대상 블록 E의 좌측 상방에 인접해 있고, 블록 B는 대상 블록 E 위에 인접해 있고, 블록 C는 대상 블록 E의 우측 위에 인접해 있고, 블록 A는 대상 블록 E의 좌측에 인접해 있다. 또한, 블록 A 내지 D가 구획되지 않은 것은, 각각 도 3에서 상술한 16×16 화소 내지 4×4 화소 중 어느 하나의 구성의 블록인 것을 나타내고 있다.
예를 들어, X(=A, B, C, D, E)에 관한 움직임 벡터 정보를, mvX로 나타낸다. 우선, 대상 블록 E에 대한 예측 움직임 벡터 정보 pmvE는, 블록 A, B, C에 관한 움직임 벡터 정보를 사용하여, 메디안 예측에 의해 다음 수학식 8과 같이 생성된다.
Figure pct00008
블록 C에 관한 움직임 벡터 정보가, 화상 프레임의 끝이거나, 또는 아직 부호화되지 않은 등의 이유에 의해, 이용할 수 없는(unavailable) 경우가 있다. 이 경우에는, 블록 C에 관한 움직임 벡터 정보는, 블록 D에 관한 움직임 벡터 정보로 대용된다.
대상 블록 E에 관한 움직임 벡터 정보로서, 압축 화상의 헤더부에 부가되는 데이터 mvdE는, pmvE를 사용하여, 다음 수학식 9와 같이 생성된다.
Figure pct00009
또한, 실제로는,움직임 벡터 정보의 수평 방향, 수직 방향의 각각의 성분에 대하여 독립적으로 처리가 행해진다.
이와 같이, 예측 움직임 벡터 정보를 생성하고, 인접하는 블록과의 상관으로 생성된 예측 움직임 벡터 정보와 움직임 벡터 정보의 차분을, 압축 화상의 헤더부에 부가함으로써, 움직임 벡터 정보가 저감된다.
다음으로, 도 6을 참조하여, H.264/AVC 방식에 있어서의 B 픽쳐의 Implicit Mode의 경우의 가중 계수 W 및 오프셋값 D의 산출 방법을 설명한다.
전술한 바와 같이, H.264/AVC 방식에 있어서의 가중 예측은, P 픽쳐에 있어서는, 전술한 수학식 1을 사용하여 행해지고, B 픽쳐에 있어서는, 전술한 수학식 2를 사용하여 행해진다.
또한, H.264/AVC 방식에 있어서는, 슬라이스 단위로, 이 가중치 부여 예측을 사용한다·사용하지 않는다를 지정하는 것이 가능하며, Explicit Mode와 Implicit Mode가 규정되어 있다. Explicit Mode는, 슬라이스 헤더에, W 및 D를 부가하여 보내는 모드이며, P 픽쳐나 B 픽쳐에서도 사용할 수 있다. 이에 반해, Implicit Mode는, 해당 픽쳐와 참조 픽쳐에 있어서의 시간축 상에서의 거리로부터 W를 산출하는 모드이며, B 픽쳐에서 밖에 사용할 수 없다.
도 6의 예에 있어서는, 해당 프레임의 시간적으로 앞에 L0 참조 프레임이 나타내어져 있고, 해당 프레임의 시간적으로 뒤에 L1 참조 프레임이 나타내어져 있다. 여기서, L0 참조 프레임과 해당 프레임의 시간적 거리 정보는, tb이며, L0 참조 프레임과 L1 참조 프레임의 시간적 거리 정보는 td이다. 이 시간적 거리 정보로서는, H.264/AVC 방식에 있어서는, 상당하는 정보가 없으므로, POC(Picture Order Count)이 사용된다.
또한, L0 참조 프레임 및 L1 참조 프레임 상에는, 각각 해당 프레임의 해당 블록에 대응하는 참조 블록 Ref(L0) 및 해당 블록에 대응하는 L1 참조 블록 Ref(L1)이 나타내어져 있다.
이와 같은 경우의 예측 화상은, Implicit Mode에서는, Ref(L0)에 대한 가중 계수를 W0 및 Ref(L1)에 대한 가중 계수를 W1 및 오프셋값을 D라 하면, 다음 수학식 10으로 산출된다.
Figure pct00010
그런데, 도 2에서 상술한 1/4 화소 정밀도로 구해지는 움직임 벡터를, 어떠한 처리에 의해 선택하는지도, 부호화 효율이 높은 압축 화상을 얻기 위해서는 중요하다. H.264/AVC 방식에 있어서는, 이 처리의 일례로서, 공개되어 있는 JM(Joint Model)이라 불리는 참조 소프트웨어(reference software)에 실장되어 있는 방법이 사용된다.
다음으로, 도 7을 참조하여, JM에 있어서 실장되어 있는 움직임 탐색 방법에 대하여 설명한다.
도 7의 예에 있어서, 화소 A 내지 I는, 정수 화소 정밀도의 화소값을 갖는 화소(이하, 정수 화소 정밀도의 화소라 칭함)를 나타내고 있다. 화소 1 내지 8은, 화소 E 주변에 있어서의 1/2 화소 정밀도의 화소값을 갖는 화소(이하, 1/2 화소 정밀도의 화소라 칭함)를 나타내고 있다. 화소 a 내지 h는, 화소 6 주위의 1/4 화소 정밀도의 화소값을 갖는 화소(이하, 1/4 화소 정밀도의 화소라 칭함)을 나타내고 있다.
JM에서는, 제1 스텝으로서, 소정의 탐색 범위 내에 있어서, SAD(Sum of Absolute Difference) 등의 비용 함수값을 최소로 하는 정수 화소 정밀도의 움직임 벡터가 구해진다. 이에 의해, 구해진 움직임 벡터에 대한 화소를, 화소 E라 한다.
다음으로, 제2 스텝으로서, 화소 E 및 화소 E 주변의 1/2 화소 정밀도의 화소 1 내지 8 중, 전술한 비용 함수값을 최소로 하는 화소값의 화소가 구해지고, 이 화소(도 2의 예의 경우, 화소 6)가, 1/2 화소 정밀도의 최적 움직임 벡터에 대한 화소로 된다.
그리고, 제3 스텝으로서, 화소 6 및 화소 6 주변의 1/4 화소 정밀도의 화소 a 내지 h 중, 전술한 비용 함수값을 최소로 하는 화소값의 화소가 구해진다. 이에 의해, 구해진 화소에 관한 움직임 벡터가, 1/4 화소 정밀도의 최적 움직임 벡터로 된다.
또한, 보다 높은 부호화 효율을 달성하기 위해서는, 적절한 예측 모드의 선택이 중요하다. H.264/AVC 방식에 있어서는, 예를 들어 JM에 있어서 정해져 있는 High Complexity Mode와, Low Complexity Mode의 2가지의 모드 판정 방법을 선택하는 방법이 사용되고 있다. 이 방법의 경우, 어느쪽도, 각각의 예측 모드 Mode에 대한 비용 함수값을 산출하고, 이것을 최소로 하는 예측 모드를 해당 블록 내지 매크로 블록에 대한 최적 모드로서 선택한다.
High Complexity Mode에 있어서의 비용 함수값은, 이하의 수학식 11과 같이 구할 수 있다.
Figure pct00011
수학식 11에 있어서, Ω는 해당 블록 내지 매크로 블록을 부호화하기 위한 후보 모드의 전체 집합이다. 또한, D는 해당 예측 모드 Mode에서 부호화한 경우의, 복호 화상과 입력 화상의 차분 에너지이다. 또한, λ는 양자화 파라미터의 함수로서 공급되는 라그랑제 미정승수이다. 또한, R은 직교 변환 계수를 포함한, 해당 모드 Mode에서 부호화한 경우의 총 부호량이다.
즉, High Complexity Mode에서의 부호화를 행하기 위해서는, 상기 파라미터 D 및 R을 산출하기 위해서, 모든 후보 모드 Mode에 의해, 일단, 가인코드 처리를 행할 필요가 있으며, 보다 높은 연산량을 필요로 한다.
이에 비해 Low Complexity Mode에 있어서의 비용 함수값은, 이하의 수학식 12와 같이 구할 수 있다.
Figure pct00012
가 된다. 수학식 12에 있어서, D는 High Complexity Mode의 경우와 달리, 예측 화상과 입력 화상의 차분 에너지가 된다. 또한, QP2Quant(QP)는 양자화 파라미터 QP의 함수로서 부여된다. 또한, HeaderBit는 직교 변환 계수를 포함하지 않는, 움직임 벡터나, 모드와 같은, Header에 속하는 정보에 관한 부호량이다.
즉, Low Complexity Mode에 있어서는, 각각의 후보 모드 Mode에 관해서, 예측 처리를 행할 필요가 있지만, 복호 화상까지는 필요없기 때문에, 부호화 처리까지 행할 필요는 없다. 이 때문에, High Complexity Mode보다 낮은 연산량에서의 실현이 가능하다.
이상과 같은 H.264/AVC 방식의 규격은, 도 1의 화상 부호화 장치(51)에 있어서는, 적절히 사용되고 있다.
[상세한 구성예]
그리고, 이 화상 부호화 장치(51)에 있어서는, 입력 신호의 색 포맷에 따라서 서로 다른 가중 예측 방법이 사용된다. 즉, 가중치 부여 예측부(76)에 있어서는 입력 신호가 RGB 포맷인 경우에는, H.264/AVC 방식과 마찬가지의 가중치 부여 예측이 행해진다. 한편, 입력 신호가, YCbCr 포맷인 경우에는, 휘도 신호와 색차 신호에 대하여 서로 다른 가중치 부여 예측 처리가 행해진다.
구체적으로는, 가중치 부여 예측부(76)에 있어서, 입력 신호가, YCbCr 포맷인 경우, 휘도 신호에 대해서는, 전술한 수학식 1 및 수학식 2를 사용한 가중치 부여 예측이 행해진다. 이에 반해, 색차 신호에 관해서는, 입력이 되는 화상 신호가n비트로 나타내어져 있다고 해서, P 픽쳐의 경우, 수학식 1 대신에, 다음 수학식 13과 같이 예측 신호의 생성이 행해진다.
Figure pct00013
여기서, 2n-1의 값은, 8비트 비디오의 경우, 27=128이 된다.
또한, 색차 신호에 관해서는, B 픽쳐의 경우, 수학식 2 대신에, 다음 수학식 14와 같이 예측 신호의 생성이 행해진다.
Figure pct00014
이상과 같이, 입력 신호가 YCbCr 포맷인 경우에, 휘도 신호와 색차 신호에 대하여 서로 다른 가중치 부여 예측을 행하도록 하였다.
즉, 휘도 신호의 가중치 부여 예측은, H.264/AVC 방식과 동일한 방법이지만, 색차 신호의 가중치 부여 예측을, 수학식 13 및 14에 나타낸 바와 같이, 승산 시에 2n-1을 빼고, 그 후 2n-1을 더하는 것과 같이 행하도록 하였다. 즉, 색차 성분에 대해서는, 화상의 입력 비트 정밀도와 픽쳐 타입에 따라서 가중치 부여 예측이 행해진다. 이에 의해, 종래, 예측 효율이 저하하고 있던 색차 신호의 가중치 부여 예측을, 예측 효율을 저하시키지 않고 실현하는 것이 가능해진다.
[움직임 예측·보상부 및 가중치 부여 예측부의 구성예]
도 8은 움직임 예측·보상부(75) 및 가중치 부여 예측부(76)의 상세한 구성예를 도시하는 블록도이다. 또한, 도 8에서는 도 1의 스위치(73)가 생략되어 있다.
도 8의 예에 있어서, 움직임 예측·보상부(75)는 움직임 탐색부(81), 움직임 보상부(82), 비용 함수 산출부(83) 및 모드 판정부(84)에 의해 구성되어 있다.
가중치 부여 예측부(76)는 색 포맷 식별부(91), 가중 예측 제어부(92), 색 성분 식별부(93), 휘도용 가중·오프셋 산출부(94), 색차용 가중·오프셋 산출부(95), 휘도용 가중치 부여 움직임 보상부(96) 및 색차용 가중치 부여 움직임 보상부(97)에 의해 구성되어 있다.
화면 재배열 버퍼(62)로부터의 인터하는 화상인 원화상 화소값은, 움직임 탐색부(81), 비용 함수 산출부(83), 색 포맷 식별부(91) 및 가중 예측 제어부(92)에 입력된다.
움직임 탐색부(81)에는, 원화상 화소값 외, 프레임 메모리(72)로부터의 참조 화상 화소값도 입력된다. 움직임 탐색부(81)는, 모든 인터 예측 모드의 움직임 탐색 처리를 행하고, 각각의 인터 예측 모드에 대한 최적 움직임 벡터 정보를 결정하고, 그것을, 움직임 보상부(82)에 공급한다. 또한, 이들 움직임 벡터 정보는, 최종적으로(부호화 시에), 도 5를 참조하여 전술한 바와 같이 생성되도록 해도 된다.
움직임 보상부(82)에는, 가중 예측 제어부(92)로부터, 가중치 부여 예측을 행하거나, 또는 행하지 않은 것을 나타내는 제어 신호가 공급된다. 가중치 부여 예측을 행하지 않는 경우, 움직임 보상부(82)는, 움직임 탐색부(81)로부터의 움직임 벡터 정보를 사용하여, 프레임 메모리(72)로부터의 참조 화상에 보상 처리를 실시하고, 예측 화상을 생성한다. 이때, 움직임 보상부(82)는, 생성한 예측 화상 화소값과 대응하는 움직임 벡터 정보를, 비용 함수 산출부(83)에 공급한다.
가중치 부여 예측을 행하는 경우, 움직임 보상부(82)는, 처리하는 신호(참조 화상)의 색 포맷이, RGB 포맷일 때, 움직임 벡터 정보가 가리키는 참조 화상 화소값 중, 휘도 신호 및 색차 신호를, 휘도용 가중치 부여 움직임 보상부(96)에 공급한다. 움직임 보상부(82)는 YCbCr 포맷일 때, 움직임 벡터 정보가 가리키는 참조 화상 화소값 중, 휘도 신호를, 휘도용 가중치 부여 움직임 보상부(96)에 공급하고, 색차 신호를, 색차용 가중치 부여 움직임 보상부(97)에 공급한다. 그리고, 움직임 보상부(82)는, 각각에 대응하여 생성되는 예측 화상 화소값을, 휘도용 가중치 부여 움직임 보상부(96)나 색차용 가중치 부여 움직임 보상부(97)로부터 수취한다.
움직임 보상부(82)는, 수취한 예측 화상 화소값과 대응하는 움직임 벡터 정보를, 비용 함수 산출부(83)에 공급한다. 또한, 가중치 부여 예측을 행하는 경우, 움직임 보상부(82)는, 그것을 나타내는 제어 신호를, 휘도용 가중·오프셋 산출부(94) 및 색차용 가중·오프셋 산출부(95)에 출력한다.
비용 함수 산출부(83)는, 화면 재배열 버퍼(62)로부터의 원화상 화소값과, 움직임 보상부(82)로부터의 예측 화상을 사용하여, 전술한 수학식 11 또는 수학식 12에 의해, 모든 인터 예측 모드에 대한 비용 함수값을 산출하고, 산출한 비용 함수값과 대응하는 예측 화상 및 움직임 벡터 정보를, 모드 판정부(84)에 출력한다.
모드 판정부(84)에는, 비용 함수 산출부(83)에 의해 산출된 비용 함수값과, 대응하는 예측 화상 및 움직임 벡터 정보가 입력된다. 모드 판정부(84)는 입력되는 비용 함수값 중, 최소의 것을, 해당 매크로 블록에 대한 최적 인터 모드로서 결정하고, 이 예측 모드에 대응하는 예측 화상을, 예측 화상 선택부(77)에 출력한다.
예측 화상 선택부(77)에 의해 최적 인터 모드의 예측 화상이 선택된 경우에는, 그것을 나타내는 신호가 예측 화상 선택부(77)로부터 공급되므로, 모드 판정부(84)는, 최적 인터 모드 정보 및 움직임 벡터 정보를, 가역 부호화부(66)에 공급한다.
색 포맷 식별부(91)는, 화면 재배열 버퍼(62)로부터의 원화상 화소값을 사용하여, 원화상의 포맷이, RGB인지 YCbCr인지를 식별하고, 식별한 색 포맷과 원화상 화소값을, 색 성분 식별부(93)에 출력한다.
가중 예측 제어부(92)는, 화면 재배열 버퍼(62)로부터의 원화상 화소값을 사용하여, 원화상에 있어서, 페이드 등의 요인에 의해, 프레임 간에, 화면의 밝기에 변화가 있는지의 여부의 검출을 행한다. 가중 예측 제어부(92)는, 그 검출 결과에 따라서, 해당 슬라이스에 있어서, 가중 예측을 사용하는지 여부를 결정하고, 가중 예측을 행할지 여부를 나타내는 제어 신호를, 움직임 보상부(82)에 공급한다. 또한, 이 가중 예측을 행할지 여부를 나타내는 제어 신호는, 플래그 정보로서, 가역 부호화부(66)에도 공급된다.
색 성분 식별부(93)는, 원화상(입력 신호)이 RGB 포맷인 경우, 원화상 화소값을 전부 휘도용 가중·오프셋 산출부(94)에 출력한다. 색 성분 식별부(93)는, 원화상(입력 신호)이 YCbCr 포맷인 경우, 원화상 화소값 중, 휘도 성분에 관해서는, 휘도용 가중·오프셋 산출부(94)에 출력하고, 색차 성분에 관해서는, 색차용 가중·오프셋 산출부(95)에 출력한다.
휘도용 가중·오프셋 산출부(94)는 움직임 보상부(82)로부터의 제어 신호가 입력된 경우, 가중 예측을 위한 가중 계수 및 오프셋값의 산출을, Explicit Mode 또는 Implicit Mode 중 어느 하나에 기초하여 행한다. 색차용 가중·오프셋 산출부(95)도, 움직임 보상부(82)로부터의 제어 신호가 입력된 경우, 가중 예측을 위한 가중 계수 및 오프셋값의 산출을, Explicit Mode 또는 Implicit Mode 중 어느 하나에 기초하여 행한다. Implicit Mode의 경우에는, 전술한 수학식 10을 사용하여, 가중 계수가 산출된다. 또한, B 픽쳐에 있어서, 어느쪽의 Mode가 사용될지는, 미리, 유저에 의해 설정되어 있다.
휘도용 가중·오프셋 산출부(94)는, 산출한 가중 계수 및 오프셋값을, 휘도용 가중치 부여 움직임 보상부(96)에 출력한다. 색차용 가중·오프셋 산출부(95)는, 산출한 가중 계수 및 오프셋값을, 색차용 가중치 부여 움직임 보상부(97)에 출력한다.
또한, Explicit Mode의 경우에는, 휘도용 가중·오프셋 산출부(94) 및 색차용 가중·오프셋 산출부(95)는 각각, 산출된 가중 계수 및 오프셋값을, 가역 부호화부(66)에도 공급한다.
휘도용 가중치 부여 움직임 보상부(96)는, 움직임 보상부(82)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값이 입력되면, 휘도용 가중·오프셋 산출부(94)로부터의 가중 계수 및 오프셋값을 사용하여, 휘도 신호 및 색차 신호(RGB의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 생성된 예측 화상 화소값은 움직임 보상부(82)에 출력된다.
색차용 가중치 부여 움직임 보상부(97)는, 움직임 보상부(82)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값이 입력되면, 색차용 가중·오프셋 산출부(95)로부터의 가중 계수 및 오프셋값을 사용하여, 색차 신호(YCbCr의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 생성된 예측 화상 화소값은, 움직임 보상부(82)에 출력된다.
[화상 부호화 장치의 부호화 처리의 설명]
다음으로, 도 9의 플로우차트를 참조하여, 도 1의 화상 부호화 장치(51)의 부호화 처리에 대하여 설명한다.
스텝 S11에서, A/D 변환부(61)는 입력된 화상을 A/D 변환한다. 스텝 S12에서, 화면 재배열 버퍼(62)는, A/D 변환부(61)로부터 공급된 화상을 기억하고, 각 픽쳐가 표시하는 차례로부터 부호화하는 차례로의 재배열을 행한다.
스텝 S13에서, 연산부(63)는, 스텝 S12에서 재배열된 화상과 예측 화상과의 차분을 연산한다. 예측 화상은, 인터 예측하는 경우에는 움직임 예측·보상부(75)로부터, 인트라 예측하는 경우에는 인트라 예측부(74)로부터, 각각 예측 화상 선택부(77)를 거쳐 연산부(63)에 공급된다.
차분 데이터는 원래의 화상 데이터에 비교하여 데이터량이 작게 되어 있다. 따라서, 화상을 그대로 부호화하는 경우에 비해, 데이터량을 압축할 수 있다.
스텝 S14에서, 직교 변환부(64)는 연산부(63)로부터 공급된 차분 정보를 직교 변환한다. 구체적으로는, 이산 코사인 변환, 카루넨 루베 변환 등의 직교 변환이 행해지고, 변환 계수가 출력된다. 스텝 S15에서, 양자화부(65)는 변환 계수를 양자화한다. 이 양자화 시에 있어서는, 후술하는 스텝 S26의 처리에서 설명되는 바와 같이, 레이트가 제어된다.
이상과 같이 하여 양자화된 차분 정보는, 다음과 같이 하여 국부적으로 복호된다. 즉, 스텝 S16에서, 역양자화부(68)는 양자화부(65)에 의해 양자화된 변환 계수를 양자화부(65)의 특성에 대응하는 특성에 의해 역양자화한다. 스텝 S17에서, 역직교 변환부(69)는 역양자화부(68)에 의해 역양자화된 변환 계수를 직교 변환부(64)의 특성에 대응하는 특성에 의해 역직교 변환한다.
스텝 S18에서, 연산부(70)는, 예측 화상 선택부(77)를 거쳐 입력되는 예측 화상을 국부적으로 복호된 차분 정보에 가산하고, 국부적으로 복호된 화상(연산부(63)로의 입력에 대응하는 화상)을 생성한다. 스텝 S19에 있어서 디블록 필터(71)는, 연산부(70)로부터 출력된 화상을 필터링한다. 이에 의해 블록 왜곡이 제거된다. 스텝 S20에 있어서 프레임 메모리(72)는, 필터링된 화상을 기억한다. 또한, 프레임 메모리(72)에는 디블록 필터(71)에 의해 필터 처리되지 않은 화상도 연산부(70)로부터 공급되고, 기억된다.
화면 재배열 버퍼(62)로부터 공급되는 처리 대상의 화상이 인트라 처리되는 블록의 화상인 경우, 참조되는 복호 완료된 화상이 프레임 메모리(72)로부터 판독되고, 스위치(73)를 거쳐 인트라 예측부(74)에 공급된다.
이들 화상에 기초하여, 스텝 S21에서, 인트라 예측부(74)는 처리 대상의 블록의 화소를, 후보가 되는 모든 인트라 예측 모드에서 인트라 예측한다. 또한, 참조되는 복호 완료된 화소로서는, 디블록 필터(71)에 의해 디블록 필터링되지 않은 화소가 사용된다.
스텝 S21에 있어서의 인트라 예측 처리의 상세 내용은, 도 10을 참조하여 후술하지만, 이 처리에 의해, 후보가 되는 모든 인트라 예측 모드에서 인트라 예측이 행해지고, 후보가 되는 모든 인트라 예측 모드에 대하여 비용 함수값이 산출된다. 그리고, 산출된 비용 함수값에 기초하여, 최적 인트라 예측 모드가 선택되고, 최적 인트라 예측 모드의 인트라 예측에 의해 생성된 예측 화상과 그 비용 함수값이 예측 화상 선택부(77)에 공급된다.
화면 재배열 버퍼(62)로부터 공급되는 처리 대상의 화상이 인터 처리되는 화상인 경우, 참조되는 화상이 프레임 메모리(72)로부터 판독되고, 스위치(73)를 거쳐 움직임 예측·보상부(75)에 공급된다. 이들 화상에 기초하여, 스텝 S22에서, 움직임 예측·보상부(75)는 인터 움직임 예측 처리를 행한다.
스텝 S22에 있어서의 인터 움직임 예측 처리의 상세 내용은, 도 11을 참조하여 후술한다. 이 처리에 의해, 가중 예측을 행할지 여부가 판정되고, 가중 예측의 경우, 또는 가중 예측을 행하지 않는 경우의 후보가 되는 모든 인터 예측 모드에서 움직임 탐색 처리가 행해지고, 후보가 되는 모든 인터 예측 모드에 대하여 비용 함수값이 산출되고, 산출한 비용 함수값에 기초하여, 최적 인터 예측 모드가 결정된다. 그리고, 최적 인터 예측 모드에 의해 생성된 예측 화상과 그 비용 함수값이 예측 화상 선택부(77)에 공급된다.
스텝 S23에서, 예측 화상 선택부(77)는, 인트라 예측부(74) 및 움직임 예측·보상부(75)로부터 출력된 각 비용 함수값에 기초하여, 최적 인트라 예측 모드와 최적 인터 예측 모드 중 한쪽을, 최적 예측 모드로 결정한다. 그리고, 예측 화상 선택부(77)는 결정한 최적 예측 모드의 예측 화상을 선택하고, 연산부(63, 70)에 공급한다. 이 예측 화상이, 전술한 바와 같이, 스텝 S13, S18의 연산에 이용된다.
또한, 이 예측 화상의 선택 정보는, 인트라 예측부(74) 또는 움직임 예측·보상부(75)에 공급된다. 최적 인트라 예측 모드의 예측 화상이 선택된 경우, 인트라 예측부(74)는 최적 인트라 예측 모드를 나타내는 정보(즉, 인트라 예측 모드 정보)를 가역 부호화부(66)에 공급한다.
최적 인터 예측 모드의 예측 화상이 선택된 경우, 움직임 예측·보상부(75)는, 최적 인터 예측 모드를 나타내는 정보와, 또한, 필요에 따라서, 최적 인터 예측 모드에 따른 정보를 가역 부호화부(66)에 출력한다. 최적 인터 예측 모드에 따른 정보로서는, 움직임 벡터 정보나 참조 프레임 정보 등을 들 수 있다. 또한, 가중치 부여 예측부(76)로부터도, 가중 예측을 행한다, 행하지 않는다 등을 나타내는 플래그 정보나, 가중 예측이 Explicit Mode인 경우에는, 가중 계수 및 오프셋값의 정보도 가역 부호화부(66)에 출력된다.
스텝 S24에서, 가역 부호화부(66)는 양자화부(65)로부터 출력된 양자화된 변환 계수를 부호화한다. 즉, 차분 화상이 가변 길이 부호화, 산술 부호화 등의 가역 부호화되고, 압축된다. 이때, 전술한 스텝 S21에 있어서 가역 부호화부(66)에 입력된, 인트라 예측부(74)로부터의 인트라 예측 모드 정보, 또는, 스텝 S22에서, 움직임 예측·보상부(75)로부터의 최적 인터 예측 모드에 따른 정보나, 가중치 부여 예측부(76)로부터의 정보 등도 부호화되고, 헤더 정보에 부가된다.
예를 들어, 인터 예측 모드를 나타내는 정보는, 매크로 블록마다 부호화된다. 움직임 벡터 정보나 참조 프레임 정보는, 대상이 되는 블록마다 부호화된다. 가중치 부여 예측부(76)로부터의 가중치 부여 예측에 대한 정보는, 슬라이스마다 부호화된다.
스텝 S25에 있어서 축적 버퍼(67)는 차분 화상을 압축 화상으로서 축적한다. 축적 버퍼(67)에 축적된 압축 화상이 적절히 판독되고, 전송로를 거쳐 복호측에 전송된다.
스텝 S26에 있어서 레이트 제어부(78)는, 축적 버퍼(67)에 축적된 압축 화상에 기초하여, 오버플로우 또는 언더플로우가 발생하지 않도록, 양자화부(65)의 양자화 동작의 레이트를 제어한다.
[인트라 예측 처리의 설명]
다음으로, 도 10의 플로우차트를 참조하여, 도 9의 스텝 S21에 있어서의 인트라 예측 처리를 설명한다. 또한, 도 10의 예에 있어서는, 휘도 신호의 경우를 예로 하여 설명한다.
인트라 예측부(74)는, 스텝 S41에서, 4×4 화소, 8×8 화소 및 16×16 화소의 각 인트라 예측 모드에 대하여 인트라 예측을 행한다.
휘도 신호의 인트라 예측 모드에는, 9종류의 4×4 화소 및 8×8 화소의 블록 단위 및 4종류의 16×16 화소의 매크로 블록 단위의 예측 모드가 있고, 색차 신호의 인트라 예측 모드에는 4종류의 8×8 화소의 블록 단위의 예측 모드가 있다. 색차 신호의 인트라 예측 모드는, 휘도 신호의 인트라 예측 모드와 독립적으로 설정이 가능하다. 휘도 신호의 4×4 화소 및 8×8 화소의 인트라 예측 모드에 대해서는, 4×4 화소 및 8×8 화소의 휘도 신호의 블록마다 1개의 인트라 예측 모드가 정의된다. 휘도 신호의 16×16 화소의 인트라 예측 모드와 색차 신호의 인트라 예측 모드에 대해서는, 1개의 매크로 블록에 대하여 1개의 예측 모드가 정의된다.
구체적으로는, 인트라 예측부(74)는, 처리 대상의 블록의 화소를, 프레임 메모리(72)로부터 판독하고, 스위치(73)를 거쳐 공급되는 복호 완료된 화상을 참조하여, 인트라 예측한다. 이 인트라 예측 처리가, 각 인트라 예측 모드에서 행해짐으로써, 각 인트라 예측 모드에서의 예측 화상이 생성된다. 또한, 참조되는 복호 완료된 화소로서는, 디블록 필터(71)에 의해 디블록 필터링되지 않은 화소가 사용된다.
인트라 예측부(74)는, 스텝 S42에서, 4×4 화소, 8×8 화소 및 16×16 화소의 각 인트라 예측 모드에 대한 비용 함수값을 산출한다. 여기서, 비용 함수값을 구하기 위한 비용 함수로서는, 전술한 수학식 11 또는 수학식 12의 비용 함수가 사용된다.
인트라 예측부(74)는, 스텝 S43에서, 4×4 화소, 8×8 화소 및 16×16 화소의 각 인트라 예측 모드에 대하여 각각 최적 모드를 결정한다. 즉, 전술한 바와 같이, 인트라 4×4 예측 모드 및 인트라 8×8 예측 모드의 경우에는, 예측 모드의 종류가 9종류 있고, 인트라 16×16 예측 모드의 경우에는, 예측 모드의 종류가 4종류 있다. 따라서, 인트라 예측부(74)는, 스텝 S42에 있어서 산출된 비용 함수값에 기초하여, 그들 중에서, 최적 인트라 4×4 예측 모드, 최적 인트라 8×8 예측 모드, 최적 인트라 16×16 예측 모드를 결정한다.
인트라 예측부(74)는, 스텝 S44에서, 4×4 화소, 8×8 화소 및 16×16 화소의 각 인트라 예측 모드에 대하여 결정된 각 최적 모드 중에서, 스텝 S42에 있어서 산출된 비용 함수값에 기초하여, 최적 인트라 예측 모드를 선택한다. 즉, 4×4 화소, 8×8 화소 및 16×16 화소에 대하여 결정된 각 최적 모드 중에서, 비용 함수값이 최소값인 모드를, 최적 인트라 예측 모드로서 선택한다. 그리고, 인트라 예측부(74)는, 최적 인트라 예측 모드에서 생성된 예측 화상과 그 비용 함수값을 예측 화상 선택부(77)에 공급한다.
[인터 움직임 예측 처리의 설명]
다음으로, 도 11의 플로우차트를 참조하여, 도 9의 스텝 S22의 인터 움직임 예측 처리에 대하여 설명한다.
움직임 탐색부(81)는, 스텝 S51에서, 16×16 화소 내지 4×4 화소로 이루어지는 8종류의 각 인터 예측 모드에 대하여 움직임 벡터와 참조 화상을 각각 결정한다. 즉, 각 인터 예측 모드의 처리 대상의 블록에 대해서, 움직임 벡터와 참조 화상이 각각 결정되고, 움직임 벡터 정보는, 움직임 보상부(82)에 공급된다.
가중 예측 제어부(92)는, 화면 재배열 버퍼(62)로부터의 원화상 화소값을 사용하여, 원화상에 있어서, 프레임 간에, 화면의 밝기에 변화가 있는지의 여부를 검출함으로써, 해당 슬라이스에 가중 예측을 적용할지 여부를 판정한다. 스텝 S52에서, 해당 슬라이스에 가중 예측을 적용하지 않는다고 판정된 경우, 그것을 나타내는 제어 신호가 움직임 보상부(82)에 공급된다.
스텝 S53에서, 움직임 보상부(82)는, 16×16 화소 내지 4×4 화소로 이루어지는 8종류의 각 인터 예측 모드에 대해서, 스텝 S63에서 결정된 움직임 벡터에 기초하여, 참조 화상에 보상 처리를 행한다. 이 보상 처리에 의해, 각 인터 예측 모드에서의 예측 화상이 생성되고, 생성된 예측 화상은, 대응하는 움직임 벡터 정보와 함께, 비용 함수 산출부(83)에 출력된다.
한편, 스텝 S52에서, 해당 슬라이스에 가중 예측을 적용한다고 판정된 경우, 그것을 나타내는 제어 신호가 움직임 보상부(82)에 공급된다.
스텝 S54에서, 움직임 보상부(82)와 가중치 부여 예측부(76)는, 가중 예측 처리를 실행한다. 이 가중 예측 처리의 상세 내용은, 도 12를 참조하여 후술한다.
스텝 S54의 처리에 의해, 가중치 부여 예측부(76)에 있어서 가중치 부여 예측 처리가 이루어진 결과의 예측 화상이, 움직임 보상부(82)에 공급된다. 움직임 보상부(82)는, 예측 화상 화소값과 대응하는 움직임 벡터 정보를, 비용 함수 산출부(83)에 공급한다.
비용 함수 산출부(83)는, 스텝 S55에서, 16×16 화소 내지 4×4 화소로 이루어지는 8종류의 각 인터 예측 모드에 대하여 전술한 수학식 11 또는 수학식 12로 나타내어지는 비용 함수값을 산출한다. 산출한 비용 함수값과 대응하는 예측 화상 및 움직임 벡터 정보는, 모드 판정부(84)에 출력된다.
스텝 S56에서, 모드 판정부(84)는 스텝 S53에 있어서 산출된 인터 예측 모드에 대한 비용 함수값을 비교하여, 최소값을 부여하는 예측 모드를, 최적 인터 예측 모드로서 결정한다. 그리고, 모드 판정부(84)는 최적 인터 예측 모드에서 생성된 예측 화상과 그 비용 함수값을, 예측 화상 선택부(77)에 공급한다.
그리고, 전술한 도 9의 스텝 S23에 있어서 최적 인터 예측 모드에서 생성된 예측 화상이 선택된 경우에는, 최적 인터 예측 모드의 정보 및 움직임 벡터 정보 등이 가역 부호화부(66)에 공급되고, 스텝 S24에 있어서 부호화된다.
다음으로, 도 12의 플로우차트를 참조하여, 도 11의 스텝 S54의 가중 예측 처리를 설명한다.
색 포맷 식별부(91)는, 화면 재배열 버퍼(62)로부터의 원화상 화소값을 사용하여, 원화상의 포맷이, RGB인지 YCbCr인지를 식별하고, 식별한 색 포맷과 원화상 화소값을, 색 성분 식별부(93)에 출력한다.
색 성분 식별부(93)는, 스텝 S61에서, 입력 신호(원화상)의 포맷이 YCbCr 포맷인지의 여부를 판정한다. 스텝 S61에서, 입력 신호의 포맷이 YCbCr 포맷이라고 판정된 경우, 스텝 S62로 진행한다.
색 성분 식별부(93)는, 스텝 S62에서, 입력 신호가 휘도 성분인지의 여부를 판정한다. 스텝 S62에서, 휘도 성분이라고 판정된 경우, 색 성분 식별부(93)는, 입력 신호(휘도 성분)를 휘도용 가중·오프셋 산출부(94)에 출력하고, 처리는 스텝 S63으로 진행한다.
또한, 스텝 S61에서, YCbCr 포맷이 아닌, 즉 RGB 포맷이라고 판정된 경우도, 처리는, 스텝 S63으로 진행한다. 즉, 이 경우, 입력 신호가 휘도 성분이나 색차 성분이라도, 휘도용 가중·오프셋 산출부(94)에 출력되고, 스텝 S63의 처리가 행해진다.
스텝 S63에서, 휘도용 가중·오프셋 산출부(94) 및 휘도용 가중치 부여 움직임 보상부(96)는, 휘도 신호용 가중치 부여 예측을 행한다.
즉, 가중 예측을 행하는 경우, 움직임 보상부(82)로부터의 제어 신호가 입력되므로, 휘도용 가중·오프셋 산출부(94)는, 수학식 1 또는 수학식 2에 있어서의 가중 예측을 위한 가중 계수 및 오프셋값의 산출을, Explicit Mode 또는 Implicit Mode 중 어느 하나에 기초하여 행한다.
휘도용 가중·오프셋 산출부(94)는, 산출한 가중 계수 및 오프셋값을, 휘도용 가중치 부여 움직임 보상부(96)에 출력한다. 또한, Explicit Mode의 경우에는, 휘도용 가중·오프셋 산출부(94)는, 산출된 가중 계수 및 오프셋값을, 가역 부호화부(66)에도 공급하므로, 가역 부호화부(66)는, 전술한 도 9의 스텝 S24에 있어서 그것을 부호화하고, 압축 화상의 헤더에 부가한다.
휘도용 가중치 부여 움직임 보상부(96)에는, 움직임 보상부(82)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값 중, 휘도 신호 및 색차 신호(RGB의 경우)가 입력된다. 이에 대응하여, 휘도용 가중치 부여 움직임 보상부(96)는, 휘도용 가중·오프셋 산출부(94)로부터의 가중 계수 및 오프셋값(즉, 수학식 1 또는 수학식 2)을 사용하여, 휘도 신호 또는 색차 신호(RGB의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 즉, 이 경우, H.264/AVC 방식에 기초하는 가중치 부여 예측이 행해진다. 생성된 예측 화상 화소값은 움직임 보상부(82)에 출력된다.
한편, 스텝 S62에서, 휘도 성분이 아닌, 즉 색차 성분이라 판정된 경우, 색 성분 식별부(93)는 입력 신호(색차 성분)를 색차용 가중·오프셋 산출부(95)에 출력하고, 처리는 스텝 S64로 진행한다.
스텝 S64에서, 색차용 가중·오프셋 산출부(95) 및 색차용 가중치 부여 움직임 보상부(97)는, 휘도 신호용 가중치 부여 예측을 행한다.
즉, 가중 예측을 행하는 경우, 움직임 보상부(82)로부터의 제어 신호가 입력되므로, 색차용 가중·오프셋 산출부(95)는, 수학식 13 또는 수학식 14에 있어서의 가중 예측을 위한 가중 계수 및 오프셋값의 산출을, Explicit Mode 또는 Implicit Mode 중 어느 하나에 기초하여 행한다.
색차용 가중·오프셋 산출부(95)는 산출한 가중 계수 및 오프셋값을, 색차용 가중치 부여 움직임 보상부(97)에 출력한다. 또한, Explicit Mode의 경우에는, 색차용 가중·오프셋 산출부(95)는, 산출된 가중 계수 및 오프셋값을, 가역 부호화부(66)에도 공급하므로, 가역 부호화부(66)는, 전술한 도 9의 스텝 S24에 있어서 그것을 부호화하고, 압축 화상의 헤더에 부가한다.
색차용 가중치 부여 움직임 보상부(97)에는, 움직임 보상부(82)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값 중, 색차 신호(YCbCr의 경우)가 입력된다. 이에 대응하여, 색차용 가중치 부여 움직임 보상부(97)는, 색차용 가중·오프셋 산출부(95)로부터의 가중 계수 및 오프셋값(즉, 수학식 13 또는 수학식 14)을 사용하여, 색차 신호(YCbCr의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 생성된 예측 화상 화소값은, 움직임 보상부(82)에 출력된다.
이상과 같이, 입력 신호가 YCbCr 포맷인 경우에, 휘도 신호와 색차 신호에 대하여 서로 다른 가중치 부여 예측을 행하도록 했으므로, 색차 신호의 가중치 부여 예측을, 예측 효율을 저하시키지 않고 실현하는 것이 가능해진다.
또한, 상기 설명에서는, 움직임 탐색 처리는, 가중 예측을 행하지 않고, 탐색된 움직임 벡터 정보에 대하여 가중 예측 처리를 행하는 예를 설명했지만, 본 발명의 적용 범위는, 이에 한하지 않는다. 예를 들어, 가중 예측을 고려한 움직임 탐색을 행하도록 해도 된다. 또한, 해당 프레임에 있어서, 가중치 부여 예측을 행하는 경우와, 행하지 않은 경우의 각각에 의해 부호화 처리를 행하고, 비용 함수값의 산출을 행하여, 보다 비용 함수값이 작은 쪽에 의해 부호화된 결과를, 복호측으로 보내도록 할 수도 있다.
부호화된 압축 화상은, 소정의 전송로를 거쳐 전송되고, 화상 복호 장치에 의해 복호된다.
[화상 복호 장치의 구성예]
도 13은 본 발명을 적용한 화상 처리 장치로서의 화상 복호 장치의 일 실시 형태의 구성을 도시하고 있다.
화상 복호 장치(101)는 축적 버퍼(111), 가역 복호부(112), 역양자화부(113), 역직교 변환부(114), 연산부(115), 디블록 필터(116), 화면 재배열 버퍼(117), D/A 변환부(118), 프레임 메모리(119), 스위치(120), 인트라 예측부(121), 움직임 예측·보상부(122), 가중치 부여 예측부(123) 및 스위치(124)에 의해 구성되어 있다.
축적 버퍼(111)는 전송되어 온 압축 화상을 축적한다. 가역 복호부(112)는 축적 버퍼(111)로부터 공급된, 도 1의 가역 부호화부(66)에 의해 부호화된 정보를, 가역 부호화부(66)의 부호화 방식에 대응하는 방식으로 복호한다. 역양자화부(113)는 가역 복호부(112)에 의해 복호된 화상을, 도 1의 양자화부(65)의 양자화 방식에 대응하는 방식으로 역양자화한다. 역직교 변환부(114)는, 도 1의 직교 변환부(64)의 직교 변환 방식에 대응하는 방식으로 역양자화부(113)의 출력을 역직교 변환한다.
역직교 변환된 출력은 연산부(115)에 의해 스위치(124)로부터 공급되는 예측 화상과 가산되어 복호된다. 디블록 필터(116)는 복호된 화상의 블록 왜곡을 제거한 후, 프레임 메모리(119)에 공급하고, 축적시킴과 함께, 화면 재배열 버퍼(117)에 출력한다.
화면 재배열 버퍼(117)는, 화상의 재배열을 행한다. 즉, 도 3의 화면 재배열 버퍼(62)에 의해 부호화의 순서를 위해 재배열된 프레임의 차례가, 원래의 표시의 차례대로 재배열된다. D/A 변환부(118)는 화면 재배열 버퍼(117)로부터 공급된 화상을 D/A 변환하고, 도시하지 않은 디스플레이에 출력하고, 표시시킨다.
스위치(120)는 인터 처리되는 화상과 참조되는 화상을 프레임 메모리(119)로부터 판독하고, 움직임 예측·보상부(122)에 출력함과 함께, 인트라 예측에 사용되는 화상을 프레임 메모리(119)로부터 판독하고, 인트라 예측부(121)에 공급한다.
인트라 예측부(121)에는, 헤더 정보를 복호하여 얻어진 인트라 예측 모드를 나타내는 정보가 가역 복호부(112)로부터 공급된다. 인트라 예측부(121)는 이 정보에 기초하여, 예측 화상을 생성하고, 생성한 예측 화상을 스위치(124)에 출력한다.
움직임 예측·보상부(122)에는, 헤더 정보를 복호하여 얻어진 정보 중, 인터 예측 모드 정보, 움직임 벡터 정보, 참조 프레임 정보, 가중치 부여 예측 플래그 정보 등이 가역 복호부(112)로부터 공급된다. 인터 예측 모드 정보는 매크로 블록마다 송신되어 온다. 움직임 벡터 정보나 참조 프레임 정보는 대상 블록마다 송신되어 온다. 가중치 부여 예측 플래그 정보는 슬라이스마다 송신되어 온다.
움직임 예측·보상부(122)는 가역 복호부(112)로부터의 가중치 부여 예측 플래그에 기초하여, 가중치 부여 예측을 행하지 않는 경우, 가역 복호부(112)로부터 공급되는 인터 예측 모드 정보 및 움직임 벡터 정보를 사용하여, 대상 블록에 대한 예측 화상의 화소값을 생성한다. 즉, 움직임 예측·보상부(122)는 가역 복호부(112)로부터의 인터 예측 모드에서, 움직임 벡터를 사용하여, 프레임 메모리(119)로부터의 참조 화상에 보상 처리를 실시하고, 예측 화상을 생성한다. 생성된 예측 화상은 스위치(124)에 출력된다.
움직임 예측·보상부(122)는 가중치 부여 예측을 행하는 경우, 가역 복호부(112)로부터의 움직임 벡터 정보가 가리키는 프레임 메모리(119)로부터의 참조 화상을, 가중치 부여 예측부(123)에 공급한다. 이에 대응하여, 가중치 부여 예측부(123)로부터 예측 화상이 공급되므로, 움직임 예측·보상부(122)는, 그 예측 화상을, 스위치(124)에 출력한다.
또한, 가중치 부여 예측 플래그 정보에는 Explicit Mode인지, Implicit Mode인지의 모드 정보도 포함된다. 움직임 예측·보상부(122)는, 가중치 부여 예측을 행하는 경우, 그것이 Explicit Mode인지, Implicit Mode인지를 나타내는 제어 신호를, 가중치 부여 예측부(123)에 공급한다.
가중치 부여 예측부(123)는 움직임 예측·보상부(122)로부터 Explicit Mode를 나타내는 제어 신호가 입력되면, 가역 복호부(112)로부터의 가중 계수와 오프셋값을 사용하여, 움직임 예측·보상부(122)로부터의 참조 화상에 가중치 부여 예측을 행하고, 예측 화상을 생성한다. 가중치 부여 예측부(123)는, 움직임 예측·보상부(122)로부터 Implicit Mode를 나타내는 제어 신호가 입력되면, 전술한 수학식 10을 사용하여, 가중 계수를 산출하고, 산출한 가중 계수를 사용하여, 움직임 예측·보상부(122)로부터의 참조 화상에 가중치 부여 예측을 행하고, 예측 화상을 생성한다.
생성된 예측 화상은, 움직임 예측·보상부(122)를 거쳐 스위치(124)에 출력된다.
스위치(124)는, 움직임 예측·보상부(122) 또는 인트라 예측부(121)에 의해 생성된 예측 화상을 선택하고, 연산부(115)에 공급한다.
또한, 도 1의 움직임 예측·보상부(75) 및 가중치 부여 예측부(76)에서는, 모든 후보 모드에 대하여 예측 화상의 생성 및 비용 함수값의 산출을 행하고, 모드 판정을 행할 필요가 있다. 이에 반해, 도 13의 움직임 예측·보상부(122) 및 가중치 부여 예측부(123)에서는, 압축 화상의 헤더로부터 해당 블록에 대한 모드 정보 및 움직임 벡터 정보를 수신하고, 이것을 사용한 움직임 보상 처리만 행해진다.
[움직임 예측·보상부 및 가중치 부여 예측부의 구성예]
도 14는 움직임 예측·보상부(122) 및 가중치 부여 예측부(123)의 상세한 구성예를 도시하는 블록도이다. 또한, 도 14에서는 도 13의 스위치(120)가 생략되어 있다.
도 14의 예에 있어서는, 움직임 예측·보상부(122)는 가중치 부여 예측 플래그 버퍼(131), 예측 모드·움직임 벡터 버퍼(132) 및 움직임 보상부(133)에 의해 구성된다.
가중치 부여 예측부(123)는, 가중·오프셋 버퍼(141), 가중 계수 산출부(142), 휘도용 가중치 부여 움직임 보상부(143) 및 색차용 가중치 부여 움직임 보상부(144)에 의해 구성된다.
가중치 부여 예측 플래그 버퍼(131)는, 가역 복호부(112)로부터의 슬라이스 헤더에 포함되어 있는, 가중치 부여 예측 플래그의 정보를 축적하고, 움직임 보상부(133)에 공급한다. 이 가중치 부여 예측 플래그의 정보는, 해당 슬라이스에 대하여 가중치 부여 예측을 행하지 않는 예측을 행할 것인지, Explicit Mode의 가중 예측을 행할 것인지, Implicit Mode의 가중 예측을 행할 것인지에 관한 정보이다.
가중치 부여 예측 플래그 버퍼(131)는, Explicit Mode의 가중 예측을 행하는 경우, 가중·오프셋 버퍼(141)에 제어 신호를 공급하고, Implicit Mode의 가중 예측을 행하는 경우, 가중 계수 산출부(142)에 제어 신호를 공급한다.
예측 모드·움직임 벡터 버퍼(132)는, 가역 복호부(112)로부터의 블록마다의 움직임 벡터 정보와, 매크로 블록마다의 인터 예측 모드 정보를 축적하고, 움직임 보상부(133)에 공급한다.
움직임 보상부(133)는 가중치 부여 예측 플래그 정보에 기초하여, 가중치 부여 예측을 행하지 않는 경우, 예측 모드·움직임 벡터 버퍼(132)로부터의 예측 모드 및 움직임 벡터 정보를 사용하여, 프레임 메모리(119)로부터의 참조 화상에 보상 처리를 실시하고, 예측 화상을 생성한다. 생성한 예측 화상은, 스위치(124)에 출력된다.
움직임 보상부(133)는, 가중치 부여 예측을 행하는 경우, 처리하는 신호(참조 화상)의 색 포맷이, RGB 포맷일 때, 예측 모드·움직임 벡터 버퍼(132)로부터의 예측 모드를 참조하여, 움직임 벡터 정보가 가리키는 참조 화상 중, 휘도 신호 및 색차 신호를 휘도용 가중치 부여 움직임 보상부(143)에 출력한다.
움직임 보상부(133)는, 가중치 부여 예측을 행하는 경우, YCbCr 포맷일 때, 예측 모드·움직임 벡터 버퍼(132)로부터의 예측 모드를 참조하여, 움직임 벡터 정보가 가리키는 참조 화상 중, 휘도 신호를 휘도용 가중치 부여 움직임 보상부(143)에 출력한다. 그리고, 이때, 움직임 보상부(133)는, 색차 신호를 색차용 가중치 부여 움직임 보상부(144)에 출력한다.
가중·오프셋 버퍼(141)는, 가역 복호부(112)로부터의 가중 계수 및 오프셋값을 축적한다. Explicit Mode의 가중 예측을 행하는 경우, 가중치 부여 예측 플래그 버퍼(131)로부터 제어 신호가 온다. 그 제어 신호에 대응하여, 가중·오프셋 버퍼(141)는, 축적하고 있는 휘도용 및 색차용 가중 계수 및 오프셋값을, 각각, 휘도용 가중치 부여 움직임 보상부(143) 및 색차용 가중치 부여 움직임 보상부(144)에 공급한다.
Implicit Mode의 가중 예측을 행하는 경우, 가중치 부여 예측 플래그 버퍼(131)로부터 제어 신호가 온다. 그 제어 신호에 대응하여, 가중 계수 산출부(142)는, 전술한 수학식 10에 의해 축적하고 있는 휘도용 및 색차용 가중 계수를 산출하여 축적하고, 각각, 휘도용 가중치 부여 움직임 보상부(143) 및 색차용 가중치 부여 움직임 보상부(144)에 공급한다.
휘도용 가중치 부여 움직임 보상부(143)는 움직임 보상부(133)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값이 입력되면, 공급되는 가중 계수(및 오프셋값)를 사용하여, 휘도 신호 및 색차 신호(RGB의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 생성된 예측 화상 화소값은, 움직임 보상부(133)에 출력된다.
색차용 가중치 부여 움직임 보상부(144)는, 움직임 보상부(133)로부터, 움직임 벡터 정보가 가리키는 참조 화상 화소값이 입력되면, 공급되는 가중 계수(및 오프셋값)를 사용하여, 색차 신호(YCbCr의 경우)에 대한 가중치 부여 예측 처리를 행하여, 예측 화상 화소값을 생성한다. 생성된 예측 화상 화소값은, 움직임 보상부(133)에 출력된다.
[화상 복호 장치의 복호 처리의 설명]
다음으로, 도 15의 플로우차트를 참조하여, 화상 복호 장치(101)이 실행하는 복호 처리에 대하여 설명한다.
스텝 S131에서, 축적 버퍼(111)는 전송되어 온 화상을 축적한다. 스텝 S132에서, 가역 복호부(112)는 축적 버퍼(111)로부터 공급되는 압축 화상을 복호 한다. 즉, 도 1의 가역 부호화부(66)에 의해 부호화된 I 픽쳐, P 픽쳐 및 B 픽쳐가 복호된다.
이때, 움직임 벡터 정보, 참조 프레임 정보, 예측 모드 정보(인트라 예측 모드, 또는 인터 예측 모드를 나타내는 정보), 가중치 부여 예측 플래그 정보 등도 복호된다. 또한, Explicit Mode의 경우에는, 가중 계수 및 오프셋값도 복호된다.
즉, 예측 모드 정보가 인트라 예측 모드 정보인 경우, 예측 모드 정보는, 인트라 예측부(121)에 공급된다. 예측 모드 정보가 인터 예측 모드 정보인 경우, 예측 모드 정보와 대응하는 움직임 벡터 정보 및 참조 프레임 정보, 가중치 부여 예측 플래그 정보는, 움직임 예측·보상부(122)에 공급된다. Explicit Mode의 경우에는, 가중 계수 및 오프셋값은, 가중치 부여 예측부(123)에 공급된다.
스텝 S133에서, 역양자화부(113)는 가역 복호부(112)에 의해 복호된 변환 계수를, 도 1의 양자화부(65)의 특성에 대응하는 특성에 의해 역양자화한다. 스텝 S134에 있어서 역직교 변환부(114)는 역양자화부(113)에 의해 역양자화된 변환 계수를, 도 1의 직교 변환부(64)의 특성에 대응하는 특성에 의해 역직교 변환한다. 이에 의해 도 1의 직교 변환부(64)의 입력(연산부(63)의 출력)에 대응하는 차분 정보가 복호된 것으로 된다.
스텝 S135에서, 연산부(115)는, 후술하는 스텝 S139의 처리에서 선택되고, 스위치(124)를 거쳐 입력되는 예측 화상을 차분 정보와 가산한다. 이에 의해 원래 화상이 복호된다. 스텝 S136에 있어서 디블록 필터(116)는, 연산부(115)로부터 출력된 화상을 필터링한다. 이에 의해 블록 왜곡이 제거된다. 스텝 S137에 있어서 프레임 메모리(119)는, 필터링된 화상을 기억한다.
스텝 S138에서, 인트라 예측부(121) 또는 움직임 예측·보상부(122)는, 가역 복호부(112)로부터 공급되는 예측 모드 정보에 대응하여, 각각 화상의 예측 처리를 행한다.
즉, 가역 복호부(112)로부터 인트라 예측 모드 정보가 공급된 경우, 인트라 예측부(121)는, 인트라 예측 모드의 인트라 예측 처리를 행한다. 가역 복호부(112)로부터 인터 예측 모드 정보가 공급된 경우, 움직임 예측·보상부(122)는, 가중치 부여 예측 플래그에 기초하여, 가중치 부여 예측, 또는, 가중치 부여 예측 없는 인터 예측 모드의 움직임 예측·보상 처리를 행한다.
스텝 S138에 있어서의 예측 처리의 상세 내용은, 도 16을 참조하여 후술하지만, 이 처리에 의해, 인트라 예측부(121)에 의해 생성된 예측 화상, 또는 움직임 예측·보상부(122)에 의해 생성된 예측 화상이 스위치(124)에 공급된다.
스텝 S139에서, 스위치(124)는 예측 화상을 선택한다. 즉, 인트라 예측부(121)에 의해 생성된 예측 화상, 또는 움직임 예측·보상부(122)에 의해 생성된 예측 화상이 공급된다. 따라서, 공급된 예측 화상이 선택되어 연산부(115)에 공급되고, 전술한 바와 같이, 스텝 S135에 있어서 역직교 변환부(114)의 출력과 가산된다.
스텝 S140에서, 화면 재배열 버퍼(117)는 재배열을 행한다. 즉 화상 부호화 장치(51)의 화면 재배열 버퍼(62)에 의해 부호화를 위해 재배열된 프레임의 순서가, 원래의 표시의 순서로 재배열된다.
스텝 S141에서, D/A 변환부(118)는 화면 재배열 버퍼(117)로부터의 화상을 D/A 변환한다. 이 화상이 도시하지 않은 디스플레이에 출력되고, 화상이 표시된다.
[화상 복호 장치의 예측 처리의 설명]
다음으로, 도 16의 플로우차트를 참조하여, 도 15의 스텝 S138의 예측 처리를 설명한다.
인트라 예측부(121)는 스텝 S171에서, 대상 블록이 인트라 부호화되어 있는지의 여부를 판정한다. 가역 복호부(112)로부터 인트라 예측 모드 정보가 인트라 예측부(121)에 공급되면, 인트라 예측부(121)는 스텝 S171에서, 대상 블록이 인트라 부호화되어 있다고 판정하고, 처리는 스텝 S172로 진행한다.
인트라 예측부(121)는, 스텝 S172에서 인트라 예측 모드 정보를 취득하고, 스텝 S173에서, 인트라 예측을 행한다.
즉, 처리 대상의 화상이 인트라 처리되는 화상인 경우, 필요한 화상이 프레임 메모리(119)로부터 판독되고, 스위치(120)을 거쳐 인트라 예측부(121)에 공급된다. 스텝 S173에서, 인트라 예측부(121)는, 스텝 S172에서 취득한 인트라 예측 모드 정보에 따라서 인트라 예측하고, 예측 화상을 생성한다. 생성한 예측 화상은, 스위치(124)에 출력된다.
한편, 스텝 S171에서, 인트라 부호화되어 있지 않다고 판정된 경우, 처리는, 스텝 S174로 진행한다.
처리 대상의 화상이 인터 처리되는 화상인 경우, 가역 복호부(112)로부터 인터 예측 모드 정보, 참조 프레임 정보, 움직임 벡터 정보가 움직임 예측·보상부(122)에 공급된다.
스텝 S174에서, 움직임 예측·보상부(122)는 예측 모드 정보 등을 취득한다. 즉, 인터 예측 모드 정보, 참조 프레임 정보, 움직임 벡터 정보 및 가중치 부여 예측 플래그 정보가 취득된다. 취득된 움직임 벡터 정보 및 인터 예측 모드 정보는, 예측 모드·움직임 벡터 버퍼(132)에 축적된다. 가중치 부여 예측 플래그 정보는, 슬라이스마다 가중치 부여 예측 플래그 버퍼(131)에 축적된다.
스텝 S175에서, 움직임 예측·보상부(122) 및 가중치 부여 예측부(123)는 인터 예측 처리를 행한다. 이 인터 예측 처리는, 도 17을 참조하여 후술한다. 스텝 S175의 처리에 의해, 인터 예측 화상이 생성되고, 스위치(124)에 출력된다.
[화상 복호 장치의 인터 예측 처리의 설명]
다음으로, 도 17의 플로우차트를 참조하여, 도 16의 스텝 S175에 있어서의 인터 예측 처리에 대해서, 설명한다.
가중치 부여 예측 플래그 버퍼(131)에 축적된 가중치 부여 예측 플래그 정보는, 움직임 보상부(133)에 공급된다.
스텝 S191에서, 움직임 보상부(133)는, 해당 슬라이스에 가중치 부여 예측이 적용되는지의 여부를 판정한다. 스텝 S191에서, 가중치 부여 예측이 적용되지 않는다고 판정된 경우, 처리는, 스텝 S192로 진행한다.
스텝 S192에서, 움직임 보상부(133)는 가중 예측을 행하지 않는, H.264/AVC 방식에 기초하는, 인터 예측 처리를 행한다. 즉, 움직임 보상부(133)는, 예측 모드·움직임 벡터 버퍼(132)로부터의 예측 모드 및 움직임 벡터 정보를 사용하여, 프레임 메모리(119)로부터의 참조 화상에 보상 처리를 실시하고, 예측 화상을 생성한다. 생성한 예측 화상은, 스위치(124)에 출력된다.
스텝 S191에서, 가중치 부여 예측이 적용된다고 판정된 경우, 처리는, 스텝 S193으로 진행한다.
스텝 S193에서, 가중치 부여 예측 플래그 버퍼(131)는, 가중치 부여 예측 플래그 정보를 참조하여, Explicit Mode인지의 여부를 판정한다. 스텝 S193에서, Explicit Mode라고 판정된 경우, 처리는, 스텝 S194로 진행한다.
이 경우, 가중치 부여 예측 플래그 버퍼(131)는, 가중·오프셋 버퍼(141)에 제어 신호를 공급하므로, 스텝 S194에서, 가중·오프셋 버퍼(141)는, 가역 복호부(112)로부터 공급되는 가중 계수 및 오프셋값을 취득하고, 축적한다.
한편, Explicit Mode가 아닌, 즉 Implicit Mode라고 판정된 경우, 스텝 S194를 스킵하고, 처리는, 스텝 S195로 진행한다. 즉, 이 경우, 가중 계수 산출부(142)에 있어서, 수학식 10에 의해 가중 계수가 산출되고, 축적된다.
스텝 S195에서, 움직임 보상부(133)는 생성하는 예측 화상(참조 화상)의 포맷이 YCbCr 포맷인지의 여부를 판정한다. 스텝 S195에서, YCbCr 포맷이라고 판정된 경우, 스텝 S196으로 진행한다.
움직임 보상부(133)는, 스텝 S196에서, 생성하는 예측 화상이 휘도 성분인지의 여부를 판정한다. 스텝 S196에서, 휘도 성분이라고 판정된 경우, 움직임 보상부(133)는, 참조 화상(휘도 성분)을 휘도용 가중치 부여 움직임 보상부(143)에 출력하고, 처리는, 스텝 S197로 진행한다.
또한, 스텝 S195에서, YCbCr 포맷이 아닌, 즉 RGB 포맷이라고 판정된 경우도, 처리는 스텝 S197로 진행한다. 즉, 이 경우, 생성하는 예측 화상이 휘도 성분이나 색차 성분이라도, 휘도용 가중치 부여 움직임 보상부(143)에 출력되고, 스텝 S197의 처리가 행해진다.
스텝 S197에서, 휘도용 가중치 부여 움직임 보상부(143)는, 휘도 신호용 가중치 부여 예측을 행한다. 즉, 휘도용 가중치 부여 움직임 보상부(143)는, 가중·오프셋 버퍼(141) 또는 가중 계수 산출부(142)로부터의 가중 계수(및 오프셋값), 즉 수학식 1 또는 수학식 2를 사용하여, 휘도 신호 또는 색차 신호(RGB의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 즉, 이 경우, H.264/AVC 방식에 기초하는 가중치 부여 예측이 행해진다. 생성된 예측 화상 화소값은, 움직임 보상부(133)에 출력된다.
한편, 스텝 S196에서, 휘도 성분이 아닌, 즉 색차 성분이라고 판정된 경우, 처리는 스텝 S198로 진행한다.
스텝 S198에서, 색차용 가중치 부여 움직임 보상부(144)는, 색차 신호용 가중치 부여 예측을 행한다. 즉, 색차용 가중치 부여 움직임 보상부(144)는 가중·오프셋 버퍼(141) 또는 가중 계수 산출부(142)로부터의 가중 계수(및 오프셋값), 즉 수학식 13 또는 수학식 14를 사용하여, 색차 신호(YCbCr의 경우)에 대한 가중치 부여 예측 처리를 행하고, 예측 화상 화소값을 생성한다. 생성된 예측 화상 화소값은 움직임 보상부(133)에 출력된다.
이상과 같이, 화상 부호화 장치(51) 및 화상 복호 장치(101)에 있어서는, 입력 신호가 YCbCr 포맷인 경우에, 휘도 신호와 색차 신호로 가중 예측의 방법이 전환된다. 예를 들어, 색차 신호의 가중치 부여 예측이, 수학식 13 및 수학식 14에 나타낸 바와 같이, 승산 시에 2n-1을 빼고, 그 후 2n-1을 더하는 것과 같이 행해진다.
이에 의해, 색차 신호의 가중치 부여 예측을, 예측 효율을 저하시키지 않고 실현하는 것이 가능해진다.
또한, 상기 설명에서는, 매크로 블록의 크기가, 16×16 화소인 경우에 대하여 설명했지만, 본 발명은 전술한 비특허문헌 2에 기재된 확장된 매크로 블록 사이즈에 대해서도 적용하는 것이 가능하다.
[확장 매크로 블록 사이즈로의 적용의 설명]
도 18은 비특허문헌 2에서 제안되고 있는 블록 사이즈의 예를 도시하는 도면이다. 비특허문헌 2에서는, 매크로 블록 사이즈가 32×32 화소로 확장되어 있다.
도 18의 상단에는, 좌측으로부터, 32×32 화소, 32×16 화소, 16×32 화소 및 16×16 화소의 블록(파티션)으로 분할된 32×32 화소로 구성되는 매크로 블록이 순서대로 나타내어져 있다. 도 18의 중단에는, 좌측으로부터, 16×16 화소, 16×8 화소, 8×16 화소 및 8×8 화소의 블록으로 분할된 16×16 화소로 구성되는 블록이 순서대로 나타내어져 있다. 또한, 도 18의 하단에는, 좌측으로부터, 8×8 화소, 8×4 화소, 4×8 화소 및 4×4 화소의 블록으로 분할된 8×8 화소의 블록이 순서대로 나타내어져 있다.
즉, 32×32 화소의 매크로 블록은, 도 18의 상단에 도시하는 32×32 화소, 32×16 화소, 16×32 화소 및 16×16 화소의 블록에서의 처리가 가능하다.
상단의 우측에 도시하는 16×16 화소의 블록은, H.264/AVC 방식과 마찬가지로, 중단에 도시하는 16×16 화소, 16×8 화소, 8×16 화소 및 8×8 화소의 블록에서의 처리가 가능하다.
중단의 우측에 도시하는 8×8 화소의 블록은, H.264/AVC 방식과 마찬가지로, 하단에 도시하는 8×8 화소, 8×4 화소, 4×8 화소 및 4×4 화소의 블록에서의 처리가 가능하다.
이들 블록은, 이하의 3계층으로 분류할 수 있다. 즉, 도 18의 상단에 도시하는 32×32 화소, 32×16 화소 및 16×32 화소의 블록을 제1 계층이라 한다. 상단의 우측에 도시하는 16×16 화소의 블록 및 중단에 도시하는 16×16 화소, 16×8 화소 및 8×16 화소의 블록을, 제2 계층이라 한다. 중단의 우측에 도시하는 8×8 화소의 블록 및 하단에 도시하는 8×8 화소, 8×4 화소, 4×8 화소 및 4×4 화소의 블록을, 제3 계층이라 한다.
이러한 계층 구조를 채용함으로써, 비특허문헌 2의 제안에서는, 16×16 화소의 블록 이하에 대해서는, H.264/AVC 방식과 호환성을 유지하면서, 그 수퍼세트로서, 보다 큰 블록이 정의되어 있다.
이상과 같이 제안되는 확장된 매크로 블록 사이즈에도, 본 발명을 적용할 수 있다.
그런데, 현재, H.264/AVC보다 한층 더 부호화 효율의 향상을 목적으로 하여, ITU-T와, ISO/IEC의 공동의 표준화 단체인 JCTVC(Joint Collaboration Team Video Coding)에 의해, HEVC(High Efficiency Video Coding)라 불리는 부호화 방식의 표준화가 진행되고 있다. 2010년 9월 현재, Draft로서, "Test Model under Consideration", (JCTVC-B205)이 발행되어 있다.
HEVC 부호화 방식에 있어서 정해져 있는, Coding Unit에 대하여 설명한다.
Coding Unit(CU)은 Coding Tree Block(CTB)이라고도 불리며, AVC에 있어서의 매크로 블록과 마찬가지의 역할을 하지만, 후자는 16×16 화소의 크기에 고정되어 있는데 반해, 전자의 크기는 고정되어 있지 않고, 각각의 시퀀스에 있어서, 화상 압축 정보 중에서 지정되게 된다.
특히, 최대의 크기를 갖는 CU를, LCU(Largest Coding Unit)라 칭하고, 또한, 최소의 크기를 갖는 CU를 SCU(Smallest Coding Unit)라 칭한다. 화상 압축 정보에 포함되는 시퀀스 파라미터 세트에 있어서, 이들 크기가 지정되게 되지만, 각각 정사각형이고, 2의 멱승으로 나타내는 크기로 한정된다.
도 24에, HEVC 부호화 방식으로 정의되어 있는 Coding Unit의 예를 나타낸다. 도 24의 예에 있어서는, LCU의 크기가 128이며, 최대 계층 심도가 5가 된다. 2N×2N의 크기의 CU는 split_flag의 값이 1일 때, 하나 아래의 계층이 되는 N×N의 크기의 CU로 분할된다.
또한, CU는 인트라 또는 인터 예측의 단위인 Prediction Unit(PU)으로 분할되고, 또한, 직교 변환의 단위인 Transform Unit(TU)으로 분할된다.
Coding Unit은 인트라 또는 인터 예측의 단위인 PU(Prediction Unit)로 더 분할되고, 또한, 직교 변환의 단위인 TU(Transform Unit)로 분할되고, 예측 처리 및 직교 변환 처리가 행해진다. 현재, HEVC 부호화 방식에 있어서는, 4×4 및 8×8 외에, 16×16 및 32×32의 직교 변환을 사용하는 것이 가능하다.
본 명세서에 있어서, 블록, 매크로 블록은 상술한 바와 같은 Coding Unit(CU), Prediction Unit(PU), Transform Unit(TU)의 개념을 포함하고 있고, 크기가 고정된 블록에 한정되지 않는다.
이상에 있어서는, 부호화 방식으로서 H.264/AVC 방식을 기초로 하여 사용하도록 했지만, 본 발명은 이에 한정하지 않고, YCbCr 포맷의 화상 신호를 입력으로 하여, 가중치 부여 예측을 행하는, 그 밖의 부호화 방식/복호 방식에도 적용할 수 있다.
또한, 본 발명은 예를 들어, MPEG, H.26x 등과 같이, 이산 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축된 화상 정보(비트 스트림)를, 위성 방송, 케이블 텔레비전, 인터넷, 또는 휴대 전화기 등의 네트워크 매체를 거쳐 수신할 때에 사용되는 화상 부호화 장치 및 화상 복호 장치에 적용할 수 있다. 또한, 본 발명은 광, 자기 디스크, 및 플래시 메모리와 같은 기억 매체 상에서 처리할 때에 사용되는 화상 부호화 장치 및 화상 복호 장치에 적용할 수 있다. 또한, 본 발명은 그들 화상 부호화 장치 및 화상 복호 장치 등에 포함되는 움직임 예측·보상 장치에도 적용할 수 있다.
상술한 일련의 처리는 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행하는 경우에는, 그 소프트웨어를 구성하는 프로그램이 컴퓨터에 인스톨된다. 여기서, 컴퓨터에는 전용의 하드웨어에 내장되어 있는 컴퓨터나, 각종 프로그램을 인스톨함으로써, 각종 기능을 실행하는 것이 가능한 범용의 퍼스널 컴퓨터 등이 포함된다.
[퍼스널 컴퓨터의 구성예]
도 19는 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터의 하드웨어의 구성예를 도시하는 블록도이다.
컴퓨터에 있어서, CPU(Central Processing Unit)(201), ROM(Read Only Memory)(202), RAM(Random Access Memory)(203)은 버스(204)에 의해 서로 접속되어 있다.
버스(204)에는, 또한, 입출력 인터페이스(205)가 접속되어 있다. 입출력 인터페이스(205)에는, 입력부(206), 출력부(207), 기억부(208), 통신부(209) 및 드라이브(210)가 접속되어 있다.
입력부(206)는 키보드, 마우스, 마이크로폰 등으로 이루어진다. 출력부(207)는 디스플레이, 스피커 등으로 이루어진다. 기억부(208)는 하드디스크나 불휘발성이 메모리 등으로 이루어진다. 통신부(209)는 네트워크 인터페이스 등으로 이루어진다. 드라이브(210)는 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 착탈식 매체(211)를 구동한다.
이상과 같이 구성되는 컴퓨터에서는, CPU(201)가 예를 들어, 기억부(208)에 기억되어 있는 프로그램을 입출력 인터페이스(205) 및 버스(204)를 거쳐 RAM(203)에 로드하여 실행함으로써, 상술한 일련의 처리가 행해진다.
컴퓨터(CPU(201))가 실행하는 프로그램은 예를 들어, 패키지 매체 등으로서의 착탈식 매체(211)에 기록하여 제공할 수 있다. 또한, 프로그램은 근거리 네트워크, 인터넷, 디지털 방송과 같은, 유선 또는 무선의 전송 매체를 거쳐 제공할 수 있다.
컴퓨터에서는, 프로그램은 착탈식 매체(211)를 드라이브(210)에 장착함으로써, 입출력 인터페이스(205)를 거쳐 기억부(208)에 인스톨할 수 있다. 또한, 프로그램은 유선 또는 무선의 전송 매체를 거쳐 통신부(209)에서 수신하고, 기억부(208)에 인스톨할 수 있다. 그 외, 프로그램은 ROM(202)이나 기억부(208)에 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은 본 명세서에서 설명하는 순서를 따라서 시계열로 처리가 행해지는 프로그램이어도 되고, 병렬로, 또는 호출이 행해졌을 때 등의 필요한 타이밍에 처리가 행해지는 프로그램이어도 된다.
본 발명의 실시 형태는 상술한 실시 형태에 한정되는 것이 아니라, 본 발명의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
예를 들어, 상술한 화상 부호화 장치(51)나 화상 복호 장치(101)는 임의의 전자 기기에 적용할 수 있다. 이하에 그 예에 대하여 설명한다.
[텔레비전 수상기의 구성예]
도 20은 본 발명을 적용한 화상 복호 장치를 사용하는 텔레비전 수상기의 주된 구성예를 도시하는 블록도이다.
도 20에 도시하는 텔레비전 수상기(300)는 지상파 튜너(313), 비디오 디코더(315), 영상 신호 처리 회로(318), 그래픽 생성 회로(319), 패널 구동 회로(320) 및 표시 패널(321)을 갖는다.
지상파 튜너(313)는 지상 아날로그 방송의 방송파 신호를, 안테나를 거쳐 수신하고, 복조하고, 영상 신호를 취득하고, 그것을 비디오 디코더(315)에 공급한다. 비디오 디코더(315)는 지상파 튜너(313)로부터 공급된 영상 신호에 대하여 디코드 처리를 실시하고, 얻어진 디지털의 컴포넌트 신호를 영상 신호 처리 회로(318)에 공급한다.
영상 신호 처리 회로(318)는 비디오 디코더(315)로부터 공급된 영상 데이터에 대하여 노이즈 제거 등의 소정의 처리를 실시하고, 얻어진 영상 데이터를 그래픽 생성 회로(319)에 공급한다.
그래픽 생성 회로(319)는 표시 패널(321)에 표시시키는 프로그램의 영상 데이터나, 네트워크를 거쳐 공급되는 어플리케이션에 기초하는 처리에 의한 화상 데이터 등을 생성하고, 생성한 영상 데이터나 화상 데이터를 패널 구동 회로(320)에 공급한다. 또한, 그래픽 생성 회로(319)는 항목의 선택 등에 유저에 의해 이용되는 화면을 표시하기 위한 영상 데이터(그래픽)를 생성하고, 그것을 프로그램의 영상 데이터에 중첩하거나 함으로써 얻어진 영상 데이터를 패널 구동 회로(320)에 공급한다는 처리도 적절히 행한다.
패널 구동 회로(320)는 그래픽 생성 회로(319)로부터 공급된 데이터에 기초하여 표시 패널(321)을 구동하고, 프로그램의 영상이나 상술한 각종 화면을 표시 패널(321)에 표시시킨다.
표시 패널(321)은 LCD(Liquid Crystal Display) 등으로 이루어지고, 패널 구동 회로(320)에 의한 제어에 따라서 프로그램의 영상 등을 표시시킨다.
또한, 텔레비전 수상기(300)는 음성 A/D(Analog/Digital) 변환 회로(314), 음성 신호 처리 회로(322), 에코 캔슬/음성 합성 회로(323), 음성 증폭 회로(324) 및 스피커(325)도 갖는다.
지상파 튜너(313)는 수신한 방송파 신호를 복조함으로써, 영상 신호뿐만 아니라 음성 신호도 취득한다. 지상파 튜너(313)는 취득한 음성 신호를 음성 A/D 변환 회로(314)에 공급한다.
음성 A/D 변환 회로(314)는 지상파 튜너(313)로부터 공급된 음성 신호에 대하여 A/D 변환 처리를 실시하고, 얻어진 디지털의 음성 신호를 음성 신호 처리 회로(322)에 공급한다.
음성 신호 처리 회로(322)는 음성 A/D 변환 회로(314)로부터 공급된 음성 데이터에 대하여 노이즈 제거 등의 소정의 처리를 실시하고, 얻어진 음성 데이터를 에코 캔슬/음성 합성 회로(323)에 공급한다.
에코 캔슬/음성 합성 회로(323)는 음성 신호 처리 회로(322)로부터 공급된 음성 데이터를 음성 증폭 회로(324)에 공급한다.
음성 증폭 회로(324)는 에코 캔슬/음성 합성 회로(323)로부터 공급된 음성 데이터에 대하여 D/A 변환 처리, 증폭 처리를 실시하고, 소정의 음량으로 조정한 후, 음성을 스피커(325)로부터 출력시킨다.
또한, 텔레비전 수상기(300)는 디지털 튜너(316) 및 MPEG 디코더(317)도 갖는다.
디지털 튜너(316)는 디지털 방송(지상 디지털 방송, BS(Broadcasting Satellite)/CS(Communications Satellite) 디지털 방송)의 방송파 신호를, 안테나를 거쳐 수신하고, 복조하고, MPEG-TS(Moving Picture Experts Group-Transport Stream)를 취득하고, 그것을 MPEG 디코더(317)에 공급한다.
MPEG 디코더(317)는 디지털 튜너(316)로부터 공급된 MPEG-TS에 실시되어 있는 스크램블을 해제하고, 재생 대상(시청 대상)이 되어 있는 프로그램의 데이터를 포함하는 스트림을 추출한다. MPEG 디코더(317)는 추출한 스트림을 구성하는 음성 패킷을 디코드하고, 얻어진 음성 데이터를 음성 신호 처리 회로(322)에 공급함과 함께, 스트림을 구성하는 영상 패킷을 디코드하고, 얻어진 영상 데이터를 영상 신호 처리 회로(318)에 공급한다. 또한, MPEG 디코더(317)는 MPEG-TS로부터 추출한 EPG(Electronic Program Guide) 데이터를 도시하지 않은 경로를 거쳐 CPU(332)에 공급한다.
텔레비전 수상기(300)는, 이와 같이 영상 패킷을 디코드하는 MPEG 디코더(317)로서, 전술한 화상 복호 장치(101)를 사용한다. 따라서, MPEG 디코더(317)는 화상 복호 장치(101)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
MPEG 디코더(317)로부터 공급된 영상 데이터는 비디오 디코더(315)로부터 공급된 영상 데이터의 경우와 마찬가지로, 영상 신호 처리 회로(318)에서 소정의 처리가 실시된다. 그리고, 소정의 처리가 실시된 영상 데이터는 그래픽 생성 회로(319)에서, 생성된 영상 데이터 등이 적절히 중첩되어, 패널 구동 회로(320)를 거쳐 표시 패널(321)에 공급되고, 그 화상이 표시된다.
MPEG 디코더(317)로부터 공급된 음성 데이터는 음성 A/D 변환 회로(314)로부터 공급된 음성 데이터의 경우와 마찬가지로, 음성 신호 처리 회로(322)에서 소정의 처리가 실시된다. 그리고, 소정의 처리가 실시된 음성 데이터는 에코 캔슬/음성 합성 회로(323)를 거쳐 음성 증폭 회로(324)에 공급되고, D/A 변환 처리나 증폭 처리가 실시된다. 그 결과, 소정의 음량으로 조정된 음성이 스피커(325)로부터 출력된다.
또한, 텔레비전 수상기(300)는 마이크로폰(326) 및 A/D 변환 회로(327)도 갖는다.
A/D 변환 회로(327)는 음성 회화용의 것으로서 텔레비전 수상기(300)에 설치되는 마이크로폰(326)에 의해 받아들여진 유저의 음성의 신호를 수신한다. A/D 변환 회로(327)는 수신한 음성 신호에 대하여 A/D 변환 처리를 실시하고, 얻어진 디지털의 음성 데이터를 에코 캔슬/음성 합성 회로(323)에 공급한다.
에코 캔슬/음성 합성 회로(323)는 텔레비전 수상기(300)의 유저(유저 A)의 음성의 데이터가 A/D 변환 회로(327)로부터 공급되고 있는 경우, 유저 A의 음성 데이터를 대상으로 하여 에코 캔슬을 행한다. 그리고, 에코 캔슬/음성 합성 회로(323)는 에코 캔슬 후, 다른 음성 데이터와 합성하거나 하여 얻어진 음성의 데이터를 음성 증폭 회로(324)를 거쳐 스피커(325)로부터 출력시킨다.
또한, 텔레비전 수상기(300)는 음성 코덱(328), 내부 버스(329), SDRAM(Synchronous Dynamic Random Access Memory)(330), 플래시 메모리(331), CPU(332), USB(Universal Serial Bus) I/F(333) 및 네트워크 I/F(334)도 갖는다.
A/D 변환 회로(327)는 음성 회화용의 것으로서 텔레비전 수상기(300)에 설치되는 마이크로폰(326)에 의해 받아들여진 유저의 음성의 신호를 수신한다. A/D 변환 회로(327)는 수신한 음성 신호에 대하여 A/D 변환 처리를 실시하고, 얻어진 디지털의 음성 데이터를 음성 코덱(328)에 공급한다.
음성 코덱(328)은 A/D 변환 회로(327)로부터 공급된 음성 데이터를, 네트워크를 경유하여 송신하기 위한 소정의 포맷의 데이터로 변환하고, 내부 버스(329)를 거쳐 네트워크 I/F(334)에 공급한다.
네트워크 I/F(334)는, 네트워크 단자(335)에 장착된 케이블을 거쳐 네트워크에 접속된다. 네트워크 I/F(334)는, 예를 들어, 그 네트워크에 접속되는 다른 장치에 대하여 음성 코덱(328)으로부터 공급된 음성 데이터를 송신한다. 또한, 네트워크 I/F(334)는, 예를 들어, 네트워크를 거쳐 접속되는 다른 장치로부터 송신되는 음성 데이터를, 네트워크 단자(335)를 거쳐 수신하고, 그것을, 내부 버스(329)를 거쳐 음성 코덱(328)에 공급한다.
음성 코덱(328)은 네트워크 I/F(334)로부터 공급된 음성 데이터를 소정의 포맷의 데이터로 변환하고, 그것을 에코 캔슬/음성 합성 회로(323)에 공급한다.
에코 캔슬/음성 합성 회로(323)는 음성 코덱(328)으로부터 공급되는 음성 데이터를 대상으로 하여 에코 캔슬을 행하고, 다른 음성 데이터와 합성하거나 하여 얻어진 음성의 데이터를, 음성 증폭 회로(324)를 거쳐 스피커(325)로부터 출력시킨다.
SDRAM(330)은, CPU(332)가 처리를 행함에 있어서 필요한 각종 데이터를 기억한다.
플래시 메모리(331)는 CPU(332)에 의해 실행되는 프로그램을 기억한다. 플래시 메모리(331)에 기억되어 있는 프로그램은 텔레비전 수상기(300)의 기동 시 등의 소정의 타이밍에 CPU(332)에 의해 판독된다. 플래시 메모리(331)에는, 디지털 방송을 거쳐 취득된 EPG 데이터, 네트워크를 거쳐 소정의 서버로부터 취득된 데이터 등도 기억된다.
예를 들어, 플래시 메모리(331)에는, CPU(332)의 제어에 의해 네트워크를 거쳐 소정의 서버로부터 취득된 콘텐츠 데이터를 포함하는 MPEG-TS가 기억된다. 플래시 메모리(331)는 예를 들어 CPU(332)의 제어에 의해, 그 MPEG-TS를 내부 버스(329)를 거쳐 MPEG 디코더(317)에 공급한다.
MPEG 디코더(317)는 디지털 튜너(316)로부터 공급된 MPEG-TS의 경우와 마찬가지로, 그 MPEG-TS를 처리한다. 이와 같이 텔레비전 수상기(300)는 영상이나 음성 등으로 이루어지는 콘텐츠 데이터를, 네트워크를 거쳐 수신하고, MPEG 디코더(317)를 사용하여 디코드하고, 그 영상을 표시시키거나, 음성을 출력시키거나 할 수 있다.
또한, 텔레비전 수상기(300)는 리모트 컨트롤러(351)로부터 송신되는 적외선 신호를 수광하는 수광부(337)도 갖는다.
수광부(337)는 리모트 컨트롤러(351)로부터의 적외선을 수광하고, 복조하여 얻어진 유저 조작의 내용을 나타내는 제어 코드를 CPU(332)에 출력한다.
CPU(332)는, 플래시 메모리(331)에 기억되어 있는 프로그램을 실행하고, 수광부(337)로부터 공급되는 제어 코드 등에 따라서 텔레비전 수상기(300)의 전체의 동작을 제어한다. CPU(332)와 텔레비전 수상기(300)의 각 부는, 도시하지 않은 경로를 거쳐 접속되어 있다.
USB I/F(333)는, USB 단자(336)에 장착된 USB 케이블을 거쳐 접속되는, 텔레비전 수상기(300)의 외부의 기기 사이에서 데이터의 송수신을 행한다. 네트워크 I/F(334)는, 네트워크 단자(335)에 장착된 케이블을 거쳐 네트워크에 접속하고, 네트워크에 접속되는 각종 장치와 음성 데이터 이외의 데이터의 송수신도 행한다.
텔레비전 수상기(300)는 MPEG 디코더(317)로서 화상 복호 장치(101)를 사용함으로써, 부호화 효율을 향상할 수 있다. 그 결과로서, 텔레비전 수상기(300)는 안테나를 거쳐 수신한 방송파 신호나, 네트워크를 거쳐 취득한 콘텐츠 데이터로부터, 보다 고정밀한 복호 화상을 얻어, 표시할 수 있다.
[휴대 전화기의 구성예]
도 21은, 본 발명을 적용한 화상 부호화 장치 및 화상 복호 장치를 사용하는 휴대 전화기의 주된 구성예를 도시하는 블록도이다.
도 21에 도시하는 휴대 전화기(400)는 각 부를 통괄적으로 제어하도록 이루어진 주제어부(450), 전원 회로부(451), 조작 입력 제어부(452), 화상 인코더(453), 카메라 I/F부(454), LCD 제어부(455), 화상 디코더(456), 다중 분리부(457), 기록 재생부(462), 변복조 회로부(458) 및 음성 코덱(459)을 갖는다. 이들은, 버스(460)를 거쳐 서로 접속되어 있다.
또한, 휴대 전화기(400)는 조작 키(419), CCD(Charge Coupled Devices) 카메라(416), 액정 디스플레이(418), 기억부(423), 송수신 회로부(463), 안테나(414), 마이크로폰(마이크)(421) 및 스피커(417)를 갖는다.
전원 회로부(451)는 유저의 조작에 의해 통화 종료 및 전원 키가 온 상태로 되면, 배터리 팩으로부터 각 부에 대하여 전력을 공급함으로써 휴대 전화기(400)를 동작 가능한 상태로 기동한다.
휴대 전화기(400)는 CPU, ROM 및 RAM 등으로 이루어지는 주제어부(450)의 제어에 기초하여, 음성 통화 모드나 데이터 통신 모드 등의 각종 모드에서, 음성 신호의 송수신, 전자 메일이나 화상 데이터의 송수신, 화상 촬영, 또는 데이터 기록 등의 각종 동작을 행한다.
예를 들어, 음성 통화 모드에서, 휴대 전화기(400)는 마이크로폰(마이크)(421)에서 집음한 음성 신호를 음성 코덱(459)에 의해 디지털 음성 데이터로 변환하고, 이것을 변복조 회로부(458)에서 스펙트럼 확산 처리하고, 송수신 회로부(463)에서 디지털/아날로그 변환 처리 및 주파수 변환 처리한다. 휴대 전화기(400)는 그 변환 처리에 의해 얻어진 송신용 신호를, 안테나(414)를 거쳐 도시하지 않은 기지국으로 송신한다. 기지국으로 전송된 송신용 신호(음성 신호)는 공중 전화 회선망을 거쳐 통화 상대의 휴대 전화기에 공급된다.
또한, 예를 들어, 음성 통화 모드에서, 휴대 전화기(400)는 안테나(414)로 수신한 수신 신호를 송수신 회로부(463)에서 증폭하고, 또한 주파수 변환 처리 및 아날로그/디지털 변환 처리하고, 변복조 회로부(458)에서 스펙트럼 역확산 처리하고, 음성 코덱(459)에 의해 아날로그 음성 신호로 변환한다. 휴대 전화기(400)는 그 변환하여 얻어진 아날로그 음성 신호를 스피커(417)로부터 출력한다.
또한, 예를 들어, 데이터 통신 모드에서 전자 메일을 송신하는 경우, 휴대 전화기(400)는 조작 키(419)의 조작에 의해 입력된 전자 메일의 텍스트 데이터를, 조작 입력 제어부(452)에서 접수한다. 휴대 전화기(400)는 그 텍스트 데이터를 주제어부(450)에서 처리하고, LCD 제어부(455)를 거쳐 화상으로서 액정 디스플레이(418)에 표시시킨다.
또한, 휴대 전화기(400)는 주제어부(450)에서, 조작 입력 제어부(452)가 접수한 텍스트 데이터나 유저 지시 등에 기초하여 전자 메일 데이터를 생성한다. 휴대 전화기(400)는 그 전자 메일 데이터를, 변복조 회로부(458)에서 스펙트럼 확산 처리하고, 송수신 회로부(463)에서 디지털/아날로그 변환 처리 및 주파수 변환 처리한다. 휴대 전화기(400)는 그 변환 처리에 의해 얻어진 송신용 신호를, 안테나(414)를 거쳐 도시하지 않은 기지국으로 송신한다. 기지국으로 전송된 송신용 신호(전자 메일)는 네트워크 및 메일 서버 등을 거쳐 소정의 수신처에 공급된다.
또한, 예를 들어, 데이터 통신 모드에서 전자 메일을 수신하는 경우, 휴대 전화기(400)는 기지국으로부터 송신된 신호를, 안테나(414)를 거쳐 송수신 회로부(463)에서 수신하고, 증폭하고, 또한 주파수 변환 처리 및 아날로그/디지털 변환 처리한다. 휴대 전화기(400)는 그 수신 신호를 변복조 회로부(458)에서 스펙트럼 역확산 처리하여 원래의 전자 메일 데이터를 복원한다. 휴대 전화기(400)는 복원된 전자 메일 데이터를, LCD 제어부(455)를 거쳐 액정 디스플레이(418)에 표시한다.
또한, 휴대 전화기(400)는 수신한 전자 메일 데이터를, 기록 재생부(462)를 거쳐 기억부(423)에 기록하는(기억시키는) 것도 가능하다.
이 기억부(423)는 재기입 가능한 임의의 기억 매체이다. 기억부(423)는 예를 들어, RAM이나 내장형 플래시 메모리 등의 반도체 메모리여도 되고, 하드디스크여도 되고, 자기 디스크, 광자기 디스크, 광 디스크, USB 메모리, 또는 메모리 카드 등의 착탈식 매체여도 된다. 물론, 이들 이외의 것이어도 된다.
또한, 예를 들어, 데이터 통신 모드에서 화상 데이터를 송신하는 경우, 휴대 전화기(400)는 촬상에 의해 CCD 카메라(416)에서 화상 데이터를 생성한다. CCD 카메라(416)는 렌즈나 조리개 등의 광학 디바이스와 광전 변환 소자로서의 CCD를 갖고, 피사체를 촬상하고, 수광한 광의 강도를 전기 신호로 변환하고, 피사체의 화상의 화상 데이터를 생성한다. 그 화상 데이터를, 카메라 I/F부(454)를 거쳐 화상 인코더(453)에서, 예를 들어 MPEG2나 MPEG4 등의 소정의 부호화 방식에 의해 압축 부호화함으로써 부호화 화상 데이터로 변환한다.
휴대 전화기(400)는, 이러한 처리를 행하는 화상 인코더(453)로서, 전술한 화상 부호화 장치(51)를 사용한다. 따라서, 화상 인코더(453)는, 화상 부호화 장치(51)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
또한, 휴대 전화기(400)는 이때 동시에, CCD 카메라(416)에서 촬상 중에 마이크로폰(마이크)(421)에서 집음한 음성을, 음성 코덱(459)에서 아날로그/디지털 변환하고, 또한 부호화한다.
휴대 전화기(400)는 다중 분리부(457)에서, 화상 인코더(453)로부터 공급된 부호화 화상 데이터와, 음성 코덱(459)으로부터 공급된 디지털 음성 데이터를, 소정의 방식으로 다중화한다. 휴대 전화기(400)는 그 결과 얻어지는 다중화 데이터를, 변복조 회로부(458)에서 스펙트럼 확산 처리하고, 송수신 회로부(463)에서 디지털/아날로그 변환 처리 및 주파수 변환 처리한다. 휴대 전화기(400)는 그 변환 처리에 의해 얻어진 송신용 신호를, 안테나(414)를 거쳐 도시하지 않은 기지국으로 송신한다. 기지국으로 전송된 송신용 신호(화상 데이터)는 네트워크 등을 거쳐 통신 상대로 공급된다.
또한, 화상 데이터를 송신하지 않는 경우, 휴대 전화기(400)는 CCD 카메라(416)에서 생성한 화상 데이터를, 화상 인코더(453)를 거치지 않고, LCD 제어부(455)를 거쳐 액정 디스플레이(418)에 표시시킬 수도 있다.
또한, 예를 들어, 데이터 통신 모드에서, 간이 홈페이지 등에 링크된 동화상 파일의 데이터를 수신하는 경우, 휴대 전화기(400)는 기지국으로부터 송신된 신호를, 안테나(414)를 거쳐 송수신 회로부(463)에서 수신하고, 증폭하고, 또한 주파수 변환 처리 및 아날로그/디지털 변환 처리한다. 휴대 전화기(400)는 그 수신 신호를 변복조 회로부(458)에서 스펙트럼 역확산 처리하여 원래의 다중화 데이터를 복원한다. 휴대 전화기(400)는 다중 분리부(457)에서, 그 다중화 데이터를 분리하고, 부호화 화상 데이터와 음성 데이터로 나눈다.
휴대 전화기(400)는 화상 디코더(456)에서, 부호화 화상 데이터를, MPEG2나 MPEG4 등의 소정의 부호화 방식에 대응한 복호 방식으로 디코드함으로써, 재생 동화상 데이터를 생성하고, 이것을, LCD 제어부(455)를 거쳐 액정 디스플레이(418)에 표시시킨다. 이에 의해, 예를 들어, 간이 홈페이지에 링크된 동화상 파일에 포함되는 동화상 데이터가 액정 디스플레이(418)에 표시된다.
휴대 전화기(400)는 이러한 처리를 행하는 화상 디코더(456)로서, 상술한 화상 복호 장치(101)를 사용한다. 따라서, 화상 디코더(456)는 화상 복호 장치(101)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
이때, 휴대 전화기(400)는 동시에, 음성 코덱(459)에서, 디지털의 음성 데이터를 아날로그 음성 신호로 변환하고, 이것을 스피커(417)로부터 출력시킨다. 이에 의해, 예를 들어, 간이 홈페이지에 링크된 동화상 파일에 포함되는 음성 데이터가 재생된다.
또한, 전자 메일의 경우와 마찬가지로, 휴대 전화기(400)는 수신한 간이 홈페이지 등에 링크된 데이터를, 기록 재생부(462)를 거쳐 기억부(423)에 기록하는(기억시키는) 것도 가능하다.
또한, 휴대 전화기(400)는 주제어부(450)에서, 촬상되어 CCD 카메라(416)에서 얻어진 2차원 코드를 해석하고, 2차원 코드에 기록된 정보를 취득할 수 있다.
또한, 휴대 전화기(400)는 적외선 통신부(481)로 적외선에 의해 외부의 기기와 통신할 수 있다.
휴대 전화기(400)는 화상 인코더(453)로서 화상 부호화 장치(51)를 사용함으로써, 부호화 효율을 향상시킬 수 있다. 결과적으로, 휴대 전화기(400)는 부호화 효율이 좋은 부호화 데이터(화상 데이터)를 다른 장치에 제공할 수 있다.
또한, 휴대 전화기(400)는 화상 디코더(456)로서 화상 복호 장치(101)를 사용함으로써, 부호화 효율을 향상시킬 수 있다. 그 결과로서, 휴대 전화기(400)는 예를 들어, 간이 홈페이지에 링크된 동화상 파일로부터, 보다 고정밀한 복호 화상을 얻어, 표시할 수 있다.
또한, 이상에 있어서, 휴대 전화기(400)가 CCD 카메라(416)를 사용하는 것으로 설명했지만, 이 CCD 카메라(416) 대신에 CMOS(Complementary Metal Oxide Semiconductor)를 사용한 이미지 센서(CMOS 이미지 센서)를 사용하도록 해도 된다. 이 경우에도, 휴대 전화기(400)는 CCD 카메라(416)를 사용하는 경우와 마찬가지로, 피사체를 촬상하고, 피사체의 화상의 화상 데이터를 생성할 수 있다.
또한, 이상에 있어서는 휴대 전화기(400)로서 설명했지만, 예를 들어, PDA(Personal Digital Assistants), 스마트폰, UMPC(Ultra Mobile Personal Computer), 넷북, 노트북 컴퓨터 등, 이 휴대 전화기(400)와 마찬가지의 촬상 기능이나 통신 기능을 갖는 장치이면, 어떤 장치라도 휴대 전화기(400)의 경우와 마찬가지로, 화상 부호화 장치(51) 및 화상 복호 장치(101)를 적용할 수 있다.
[하드디스크 레코더의 구성예]
도 22는 본 발명을 적용한 화상 부호화 장치 및 화상 복호 장치를 사용하는 하드디스크 레코더의 주된 구성예를 도시하는 블록도이다.
도 22에 도시하는 하드디스크 레코더(HDD 레코더)(500)는, 튜너에 의해 수신된, 위성이나 지상의 안테나 등으로부터 송신되는 방송파 신호(텔레비전 신호)에 포함되는 방송 프로그램의 오디오 데이터와 비디오 데이터를 내장하는 하드디스크에 보존하고, 그 보존한 데이터를 유저의 지시에 따른 타이밍에 유저에게 제공하는 장치이다.
하드디스크 레코더(500)는 예를 들어, 방송파 신호로부터 오디오 데이터와 비디오 데이터를 추출하고, 그들을 적절히 복호하고, 내장하는 하드디스크에 기억시킬 수 있다. 또한, 하드디스크 레코더(500)는 예를 들어, 네트워크를 거쳐 다른 장치로부터 오디오 데이터나 비디오 데이터를 취득하고, 그들을 적절히 복호하고, 내장하는 하드디스크에 기억시킬 수도 있다.
또한, 하드디스크 레코더(500)는 예를 들어, 내장하는 하드디스크에 기록되어 있는 오디오 데이터나 비디오 데이터를 복호하여 모니터(560)에 공급하고, 모니터(560)의 화면에 그 화상을 표시시킨다. 또한, 하드디스크 레코더(500)는 모니터(560)의 스피커로부터 그 음성을 출력시킬 수 있다.
하드디스크 레코더(500)는 예를 들어, 튜너를 거쳐 취득된 방송파 신호로부터 추출된 오디오 데이터와 비디오 데이터, 또는, 네트워크를 거쳐 다른 장치로부터 취득한 오디오 데이터나 비디오 데이터를 복호하여 모니터(560)에 공급하고, 모니터(560)의 화면에 그 화상을 표시시킨다. 또한, 하드디스크 레코더(500)는 모니터(560)의 스피커로부터 그 음성을 출력시킬 수도 있다.
물론, 이 밖의 동작도 가능하다.
도 22에 도시된 바와 같이, 하드디스크 레코더(500)는 수신부(521), 복조부(522), 디멀티플렉서(523), 오디오 디코더(524), 비디오 디코더(525) 및 레코더 제어부(526)를 갖는다. 하드디스크 레코더(500)는 또한, EPG 데이터 메모리(527), 프로그램 메모리(528), 워크 메모리(529), 디스플레이 컨버터(530), OSD(On Screen Display) 제어부(531), 디스플레이 제어부(532), 기록 재생부(533), D/A 컨버터(534) 및 통신부(535)를 갖는다.
또한, 디스플레이 컨버터(530)는 비디오 인코더(541)를 갖는다. 기록 재생부(533)는 인코더(551) 및 디코더(552)를 갖는다.
수신부(521)는 리모트 컨트롤러(도시하지 않음)로부터의 적외선 신호를 수신하고, 전기 신호로 변환하여 레코더 제어부(526)에 출력한다. 레코더 제어부(526)는 예를 들어, 마이크로프로세서 등에 의해 구성되고, 프로그램 메모리(528)에 기억되어 있는 프로그램에 따라서 각종 처리를 실행한다. 레코더 제어부(526)는 이때 워크 메모리(529)를 필요에 따라서 사용한다.
통신부(535)는 네트워크에 접속되고, 네트워크를 거쳐 다른 장치와의 통신 처리를 행한다. 예를 들어, 통신부(535)는 레코더 제어부(526)에 의해 제어되고, 튜너(도시하지 않음)와 통신하고, 주로 튜너에 대하여 선국 제어 신호를 출력한다.
복조부(522)는 튜너로부터 공급된 신호를, 복조하고, 디멀티플렉서(523)에 출력한다. 디멀티플렉서(523)는 복조부(522)로부터 공급된 데이터를, 오디오 데이터, 비디오 데이터, 및 EPG 데이터로 분리하고, 각각 오디오 디코더(524), 비디오 디코더(525), 또는 레코더 제어부(526)에 출력한다.
오디오 디코더(524)는 입력된 오디오 데이터를, 예를 들어 MPEG 방식으로 디코드하고, 기록 재생부(533)에 출력한다. 비디오 디코더(525)는 입력된 비디오 데이터를, 예를 들어 MPEG 방식으로 디코드하고, 디스플레이 컨버터(530)에 출력한다. 레코더 제어부(526)는 입력된 EPG 데이터를 EPG 데이터 메모리(527)에 공급하고, 기억시킨다.
디스플레이 컨버터(530)는 비디오 디코더(525) 또는 레코더 제어부(526)로부터 공급된 비디오 데이터를, 비디오 인코더(541)에 의해, 예를 들어 NTSC(National Television Standards Committee) 방식의 비디오 데이터에 인코드하고, 기록 재생부(533)에 출력한다. 또한, 디스플레이 컨버터(530)는 비디오 디코더(525) 또는 레코더 제어부(526)로부터 공급되는 비디오 데이터의 화면의 크기를, 모니터(560)의 크기에 대응하는 크기로 변환한다. 디스플레이 컨버터(530)는 화면의 크기가 변환된 비디오 데이터를, 또한, 비디오 인코더(541)에 의해 NTSC 방식의 비디오 데이터로 변환하고, 아날로그 신호로 변환하고, 디스플레이 제어부(532)에 출력한다.
디스플레이 제어부(532)는 레코더 제어부(526)의 제어 하에, OSD(On Screen Display) 제어부(531)가 출력한 OSD 신호를, 디스플레이 컨버터(530)로부터 입력된 비디오 신호에 중첩하고, 모니터(560)의 디스플레이에 출력하고, 표시시킨다.
모니터(560)에는 또한, 오디오 디코더(524)가 출력한 오디오 데이터가, D/A 컨버터(534)에 의해 아날로그 신호로 변환되어 공급되고 있다. 모니터(560)는 이 오디오 신호를 내장하는 스피커로부터 출력한다.
기록 재생부(533)는 비디오 데이터나 오디오 데이터 등을 기록하는 기억 매체로서 하드디스크를 갖는다.
기록 재생부(533)는 예를 들어, 오디오 디코더(524)로부터 공급되는 오디오 데이터를, 인코더(551)에 의해 MPEG 방식으로 인코드한다. 또한, 기록 재생부(533)는 디스플레이 컨버터(530)의 비디오 인코더(541)로부터 공급되는 비디오 데이터를, 인코더(551)에 의해 MPEG 방식으로 인코드한다. 기록 재생부(533)는 그 오디오 데이터의 부호화 데이터와 비디오 데이터의 부호화 데이터를 멀티플렉서에 의해 합성한다. 기록 재생부(533)는 그 합성 데이터를 채널 코딩하여 증폭하고, 그 데이터를, 기록 헤드를 거쳐 하드디스크에 기입한다.
기록 재생부(533)는 재생 헤드를 거쳐 하드디스크에 기록되어 있는 데이터를 재생하고, 증폭하고, 디멀티플렉서에 의해 오디오 데이터와 비디오 데이터로 분리한다. 기록 재생부(533)는 디코더(552)에 의해 오디오 데이터 및 비디오 데이터를 MPEG 방식으로 디코드한다. 기록 재생부(533)는 복호한 오디오 데이터를 D/A 변환하고, 모니터(560)의 스피커에 출력한다. 또한, 기록 재생부(533)는 복호한 비디오 데이터를 D/A 변환하고, 모니터(560)의 디스플레이에 출력한다.
레코더 제어부(526)는 수신부(521)를 거쳐 수신되는 리모트 컨트롤러로부터의 적외선 신호에 의해 나타나는 유저 지시에 기초하여, EPG 데이터 메모리(527)로부터 최신의 EPG 데이터를 판독하고, 그것을 OSD 제어부(531)에 공급한다. OSD 제어부(531)는 입력된 EPG 데이터에 대응하는 화상 데이터를 발생하고, 디스플레이 제어부(532)에 출력한다. 디스플레이 제어부(532)는 OSD 제어부(531)로부터 입력된 비디오 데이터를 모니터(560)의 디스플레이에 출력하고, 표시시킨다. 이에 의해, 모니터(560)의 디스플레이에는, EPG(전자 프로그램 가이드)가 표시된다.
또한, 하드디스크 레코더(500)는 인터넷 등의 네트워크를 거쳐 다른 장치로부터 공급되는 비디오 데이터, 오디오 데이터, 또는 EPG 데이터 등의 각종 데이터를 취득할 수 있다.
통신부(535)는 레코더 제어부(526)에 제어되고, 네트워크를 거쳐 다른 장치로부터 송신되는 비디오 데이터, 오디오 데이터, 및 EPG 데이터 등의 부호화 데이터를 취득하고, 그것을 레코더 제어부(526)에 공급한다. 레코더 제어부(526)는 예를 들어, 취득한 비디오 데이터나 오디오 데이터의 부호화 데이터를 기록 재생부(533)에 공급하고, 하드디스크에 기억시킨다. 이때, 레코더 제어부(526) 및 기록 재생부(533)가 필요에 따라 재인코드 등의 처리를 행하도록 해도 된다.
또한, 레코더 제어부(526)는 취득한 비디오 데이터나 오디오 데이터의 부호화 데이터를 복호하고, 얻어지는 비디오 데이터를 디스플레이 컨버터(530)에 공급한다. 디스플레이 컨버터(530)는 비디오 디코더(525)로부터 공급되는 비디오 데이터와 마찬가지로, 레코더 제어부(526)로부터 공급되는 비디오 데이터를 처리하고, 디스플레이 제어부(532)를 거쳐 모니터(560)에 공급하고, 그 화상을 표시시킨다.
또한, 이 화상 표시에 맞춰서, 레코더 제어부(526)가 복호한 오디오 데이터를, D/A 컨버터(534)를 거쳐 모니터(560)에 공급하고, 그 음성을 스피커로부터 출력시키도록 해도 된다.
또한, 레코더 제어부(526)는, 취득한 EPG 데이터의 부호화 데이터를 복호하고, 복호한 EPG 데이터를 EPG 데이터 메모리(527)에 공급한다.
이상과 같은 하드디스크 레코더(500)는, 비디오 디코더(525), 디코더(552) 및 레코더 제어부(526)에 내장되는 디코더로서 화상 복호 장치(101)를 사용한다. 따라서, 비디오 디코더(525), 디코더(552) 및 레코더 제어부(526)에 내장되는 디코더는, 화상 복호 장치(101)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
따라서, 하드디스크 레코더(500)는, 정밀도가 높은 예측 화상을 생성할 수 있다. 그 결과로서, 하드디스크 레코더(500)는, 예를 들어 튜너를 거쳐 수신된 비디오 데이터의 부호화 데이터나, 기록 재생부(533)의 하드디스크로부터 판독된 비디오 데이터의 부호화 데이터나, 네트워크를 거쳐 취득한 비디오 데이터의 부호화 데이터로부터, 보다 고정밀한 복호 화상을 얻어, 모니터(560)에 표시시킬 수 있다.
또한, 하드디스크 레코더(500)는, 인코더(551)로서 화상 부호화 장치(51)를 사용한다. 따라서, 인코더(551)는, 화상 부호화 장치(51)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
따라서, 하드디스크 레코더(500)는 예를 들어, 하드디스크에 기록하는 부호화 데이터의 부호화 효율을 향상시킬 수 있다. 그 결과로서, 하드디스크 레코더(500)는 하드디스크의 기억 영역을 보다 효율적으로 사용할 수 있다.
또한, 이상에 있어서는, 비디오 데이터나 오디오 데이터를 하드디스크에 기록하는 하드디스크 레코더(500)에 대하여 설명했지만, 물론, 기록 매체는 어떤 것이든 좋다. 예를 들어 플래시 메모리, 광 디스크, 또는 비디오 테이프 등, 하드디스크 이외의 기록 매체를 적용하는 레코더라도, 전술한 하드디스크 레코더(500)의 경우와 마찬가지로, 화상 부호화 장치(51) 및 화상 복호 장치(101)를 적용할 수 있다.
[카메라의 구성예]
도 23은 본 발명을 적용한 화상 복호 장치 및 화상 부호화 장치를 사용하는 카메라의 주된 구성예를 도시하는 블록도이다.
도 23에 도시되는 카메라(600)는 피사체를 촬상하고, 피사체의 화상을 LCD(616)에 표시시키거나, 그것을 화상 데이터로 하여, 기록 매체(633)에 기록하거나 한다.
렌즈 블록(611)은 광(즉, 피사체의 영상)을 CCD/CMOS(612)에 입사시킨다. CCD/CMOS(612)는, CCD 또는 CMOS를 사용한 이미지 센서로서, 수광한 광의 강도를 전기 신호로 변환하고, 카메라 신호 처리부(613)에 공급한다.
카메라 신호 처리부(613)는 CCD/CMOS(612)로부터 공급된 전기 신호를, Y, Cr, Cb의 색차 신호로 변환하고, 화상 신호 처리부(614)에 공급한다. 화상 신호 처리부(614)는 컨트롤러(621)의 제어 하에, 카메라 신호 처리부(613)로부터 공급된 화상 신호에 대하여 소정의 화상 처리를 실시하거나, 그 화상 신호를 인코더(641)로 예를 들어 MPEG 방식에 의해 부호화하거나 한다. 화상 신호 처리부(614)는 화상 신호를 부호화하여 생성한 부호화 데이터를, 디코더(615)에 공급한다. 또한, 화상 신호 처리부(614)는 온 스크린 디스플레이(OSD)(620)에서 생성된 표시용 데이터를 취득하고, 그것을 디코더(615)에 공급한다.
이상의 처리에 있어서, 카메라 신호 처리부(613)는, 버스(617)를 거쳐 접속되는 DRAM(Dynamic Random Access Memory)(618)을 적절히 이용하고, 필요에 따라서 화상 데이터나, 그 화상 데이터가 부호화된 부호화 데이터 등을 그 DRAM(618)에 유지시킨다.
디코더(615)는 화상 신호 처리부(614)로부터 공급된 부호화 데이터를 복호하고, 얻어진 화상 데이터(복호 화상 데이터)를 LCD(616)에 공급한다. 또한, 디코더(615)는, 화상 신호 처리부(614)로부터 공급된 표시용 데이터를 LCD(616)에 공급한다. LCD(616)는 디코더(615)로부터 공급된 복호 화상 데이터의 화상과 표시용 데이터의 화상을 적절히 합성하고, 그 합성 화상을 표시한다.
온 스크린 디스플레이(620)는, 컨트롤러(621)의 제어 하에, 기호, 문자, 또는 도형으로 이루어지는 메뉴 화면이나 아이콘 등의 표시용 데이터를, 버스(617)를 거쳐 화상 신호 처리부(614)에 출력한다.
컨트롤러(621)는, 유저가 조작부(622)를 사용하여 명령한 내용을 나타내는 신호에 기초하여, 각종 처리를 실행함과 함께, 버스(617)를 거쳐 화상 신호 처리부(614), DRAM(618), 외부 인터페이스(619), 온 스크린 디스플레이(620) 및 매체 드라이브(623) 등을 제어한다. FLASH ROM(624)에는, 컨트롤러(621)가 각종 처리를 실행함에 있어서 필요한 프로그램이나 데이터 등이 저장된다.
예를 들어, 컨트롤러(621)는 화상 신호 처리부(614)나 디코더(615)를 대신하여, DRAM(618)에 기억되어 있는 화상 데이터를 부호화하거나, DRAM(618)에 기억되어 있는 부호화 데이터를 복호하거나 할 수 있다. 이때, 컨트롤러(621)는 화상 신호 처리부(614)나 디코더(615)의 부호화·복호 방식과 마찬가지의 방식에 의해 부호화·복호 처리를 행하도록 해도 되고, 화상 신호 처리부(614)나 디코더(615)가 대응하고 있지 않은 방식에 의해 부호화·복호 처리를 행하도록 해도 된다.
또한, 예를 들어 조작부(622)로부터 화상 인쇄의 개시가 지시된 경우, 컨트롤러(621)는, DRAM(618)으로부터 화상 데이터를 판독하고, 그것을, 버스(617)를 거쳐 외부 인터페이스(619)에 접속되는 프린터(634)에 공급하여 인쇄시킨다.
또한, 예를 들어 조작부(622)로부터 화상 기록이 지시된 경우, 컨트롤러(621)는, DRAM(618)으로부터 부호화 데이터를 판독하고, 그것을, 버스(617)를 거쳐 매체 드라이브(623)에 장착되는 기록 매체(633)에 공급하여 기억시킨다.
기록 매체(633)는, 예를 들어 자기 디스크, 광 자기 디스크, 광 디스크, 또는 반도체 메모리 등의, 판독 기입 가능한 임의의 착탈식 매체이다. 기록 매체(633)는, 물론, 착탈식 매체로서의 종류도 임의이며, 테이프 디바이스여도 되고, 디스크여도 되고, 메모리 카드여도 된다. 물론, 비접촉 IC 카드 등이어도 된다.
또한, 매체 드라이브(623)와 기록 매체(633)를 일체화하고, 예를 들어 내장형 하드디스크 드라이브나 SSD(Solid State Drive) 등과 같이, 비가반성의 기억 매체에 의해 구성되도록 해도 된다.
외부 인터페이스(619)는, 예를 들어 USB 입출력 단자 등으로 구성되고, 화상의 인쇄를 행하는 경우에, 프린터(634)와 접속된다. 또한, 외부 인터페이스(619)에는, 필요에 따라서 드라이브(631)가 접속되고, 자기 디스크, 광 디스크, 또는 광 자기 디스크 등의 착탈식 매체(632)가 적절히 장착되고, 이들로부터 판독된 컴퓨터 프로그램이, 필요에 따라서, FLASH ROM(624)에 인스톨된다.
또한, 외부 인터페이스(619)는, LAN이나 인터넷 등의 소정의 네트워크에 접속되는 네트워크 인터페이스를 갖는다. 컨트롤러(621)는, 예를 들어 조작부(622)로부터의 지시에 따라서, DRAM(618)으로부터 부호화 데이터를 판독하고, 그것을 외부 인터페이스(619)로부터, 네트워크를 거쳐 접속되는 다른 장치에 공급시킬 수 있다. 또한, 컨트롤러(621)는, 네트워크를 거쳐 다른 장치로부터 공급되는 부호화 데이터나 화상 데이터를, 외부 인터페이스(619)를 거쳐 취득하고, 그것을 DRAM(618)에 유지시키거나, 화상 신호 처리부(614)에 공급하거나 할 수 있다.
이상과 같은 카메라(600)는, 디코더(615)로서 화상 복호 장치(101)를 사용한다. 따라서, 디코더(615)는, 화상 복호 장치(101)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
따라서, 카메라(600)는, 정밀도가 높은 예측 화상을 생성할 수 있다. 그 결과로서, 카메라(600)는, 예를 들어 CCD/CMOS(612)에 있어서 생성된 화상 데이터나, DRAM(618) 또는 기록 매체(633)로부터 판독된 비디오 데이터의 부호화 데이터나, 네트워크를 거쳐 취득한 비디오 데이터의 부호화 데이터로부터, 보다 고정밀한 복호 화상을 얻어, LCD(616)에 표시시킬 수 있다.
또한, 카메라(600)는, 인코더(641)로서 화상 부호화 장치(51)를 사용한다. 따라서, 인코더(641)는, 화상 부호화 장치(51)의 경우와 마찬가지로, 색차 신호에 대한 가중치 부여 예측에 있어서의 예측 효율을 향상시킬 수 있다.
따라서, 카메라(600)는, 예를 들어 하드디스크에 기록하는 부호화 데이터의 부호화 효율을 향상시킬 수 있다. 그 결과로서, 카메라(600)는 DRAM(618)이나 기록 매체(633)의 기억 영역을 보다 효율적으로 사용할 수 있다.
또한, 컨트롤러(621)가 행하는 복호 처리에 화상 복호 장치(101)의 복호 방법을 적용하도록 해도 된다. 마찬가지로, 컨트롤러(621)가 행하는 부호화 처리에 화상 부호화 장치(51)의 부호화 방법을 적용하도록 해도 된다.
또한, 카메라(600)가 촬상하는 화상 데이터는 동화상이어도 되고, 정지 화상 이어도 된다.
물론, 화상 부호화 장치(51) 및 화상 복호 장치(101)는, 전술한 장치 이외의 장치나 시스템에도 적용 가능하다.
51 : 화상 부호화 장치
66 : 가역 부호화부
74 : 인트라 예측부
75 : 움직임 예측·보상부
76 : 가중치 부여 예측부
81 : 움직임 탐색부
82 : 움직임 보상부
83 : 비용 함수 산출부
84 : 모드 판정부
91 : 색 포맷 식별부
92 : 가중 예측 제어부
93 : 색 성분 식별부
94 : 휘도용 가중·오프셋 산출부
95 : 색차용 가중·오프셋 산출부
96 : 휘도용 가중치 부여 움직임 보상부
97 : 색차용 가중치 부여 움직임 보상부
101 : 화상 복호 장치
112 : 가역 복호부
121 : 인트라 예측부
122 : 움직임 예측·보상부
123 : 가중치 부여 예측부
131 : 가중치 부여 예측 플래그 버퍼
132 : 예측 모드·움직임 벡터 버퍼
133 : 움직임 보상부
141 : 가중·오프셋 버퍼
142 : 가중 계수 산출부
143 : 휘도용 가중치 부여 움직임 보상부
144 : 색차용 가중치 부여 움직임 보상부

Claims (15)

  1. 화상의 부호화 대상인 블록의 움직임 벡터를 탐색하는 움직임 탐색 수단과,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 움직임 탐색 수단에 의해 탐색된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 가중치 부여 예측 수단을 구비하는 화상 처리 장치.
  2. 제1항에 있어서,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 색차 성분에 대하여 가중 계수 및 오프셋을 산출하는 계수 산출 수단을 더 구비하고,
    상기 가중치 부여 예측 수단은, 상기 계수 산출 수단에 의해 산출된 상기 가중 계수 및 오프셋과, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대해서는, 상기 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 화상 처리 장치.
  3. 제2항에 있어서,
    상기 가중치 부여 예측 수단은, 상기 색차 성분에 대해서는, 상기 화상의 입력 비트 정밀도와 픽쳐 타입에 따라서 가중치 부여 예측을 행하는 화상 처리 장치.
  4. 제3항에 있어서,
    상기 가중치 부여 예측 수단은, P 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0를 상기 참조 화상 화소값, W0 및 D를 각각 가중 예측을 위한 가중 계수 및 오프셋으로 하면,
    Figure pct00015

    과 같이 가중치 부여 예측을 행하는 화상 처리 장치.
  5. 제3항에 있어서,
    상기 가중치 부여 예측 수단은, B 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0 및 Y1을 각각 List0 및 List1의 상기 참조 화상 화소값, W0, W1, 및 D를 각각 가중 예측을 위한 List0 및 List1에 대한 가중 계수, 및 오프셋으로 하면,
    Figure pct00016

    과 같이 가중치 부여 예측을 행하는 화상 처리 장치.
  6. 제3항에 있어서,
    상기 화상의 색 포맷이 RGB 포맷인 경우, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대하여 상기 휘도 성분에 대한 것과 동일한 가중치 부여 예측을 행하는 화상 처리 장치.
  7. 화상 처리 장치의 움직임 탐색 수단이,
    화상의 부호화 대상인 블록의 움직임 벡터를 탐색하고,
    상기 화상 처리 장치의 가중치 부여 예측 수단이,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 탐색된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 화상 처리 방법.
  8. 부호화되어 있는 화상의 복호 대상인 블록의 움직임 벡터를 복호하는 복호 수단과,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 복호 수단에 의해 복호된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 가중치 부여 예측 수단을 구비하는 화상 처리 장치.
  9. 제8항에 있어서,
    상기 가중치 부여 예측 수단은, 상기 색차 성분에 대해서는, 상기 화상의 입력 비트 정밀도와 픽쳐 타입에 따라서 가중치 부여 예측을 행하는 화상 처리 장치.
  10. 제9항에 있어서,
    상기 가중치 부여 예측 수단은, P 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0를 상기 참조 화상 화소값, W0 및 D를 각각 가중 예측을 위한 가중 계수 및 오프셋으로 하면,
    Figure pct00017

    과 같이 가중치 부여 예측을 행하는 화상 처리 장치.
  11. 제9항에 있어서,
    상기 가중치 부여 예측 수단은, B 픽쳐의 경우, 상기 색차 성분에 대해서는, 입력이 n비트로 나타내어지는 비디오라고 해서, Y0 및 Y1을 각각 List0 및 List1의 상기 참조 화상 화소값, W0, W1, 및 D를 각각 가중 예측을 위한 List0 및 List1에 대한 가중 계수, 및 오프셋으로 하면,
    Figure pct00018

    와 같이 가중치 부여 예측을 행하는 화상 처리 장치.
  12. 제9항에 있어서,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 색차 성분에 대하여 가중 계수를 산출하는 계수 산출 수단을 더 구비하고,
    상기 가중치 부여 예측 수단은, 상기 계수 산출 수단에 의해 산출된 상기 가중 계수와, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대해서는, 상기 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 화상 처리 장치.
  13. 제9항에 있어서,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 상기 복호 수단은, 상기 색차 성분에 대한 상기 가중 계수 및 오프셋을 복호하고,
    상기 가중치 부여 예측 수단은, 상기 복호 수단에 의해 복호된 상기 가중 계수 및 오프셋과, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대해서는, 상기 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 화상 처리 장치.
  14. 제9항에 있어서,
    상기 화상의 색 포맷이 RGB 포맷인 경우, 상기 참조 화상 화소값을 사용하여, 상기 색차 성분에 대하여 상기 휘도 성분에 대한 것과 동일한 가중치 부여 예측을 행하는 화상 처리 장치.
  15. 화상 처리 장치의 복호 수단이,
    부호화되어 있는 화상의 복호 대상인 블록의 움직임 벡터를 복호하고,
    상기 화상 처리 장치의 가중치 부여 예측 수단이,
    상기 화상의 색 포맷이 YCbCr 포맷인 경우, 복호된 움직임 벡터가 가리키는 참조 화상 화소값을 사용하여, 색차 성분에 대해서는, 휘도 성분에 대해서와는 다른 가중치 부여 예측을 행하는 화상 처리 장치.
KR20127018240A 2010-01-22 2011-01-14 화상 처리 장치 및 방법 KR20120123326A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010012515A JP2011151683A (ja) 2010-01-22 2010-01-22 画像処理装置および方法
JPJP-P-2010-012515 2010-01-22
PCT/JP2011/050494 WO2011089973A1 (ja) 2010-01-22 2011-01-14 画像処理装置および方法

Publications (1)

Publication Number Publication Date
KR20120123326A true KR20120123326A (ko) 2012-11-08

Family

ID=44306776

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20127018240A KR20120123326A (ko) 2010-01-22 2011-01-14 화상 처리 장치 및 방법

Country Status (5)

Country Link
US (1) US20120288006A1 (ko)
JP (1) JP2011151683A (ko)
KR (1) KR20120123326A (ko)
CN (1) CN102714735A (ko)
WO (1) WO2011089973A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101418096B1 (ko) * 2012-01-20 2014-07-16 에스케이 텔레콤주식회사 가중치예측을 이용한 영상 부호화/복호화 방법 및 장치
CN105791957A (zh) * 2013-05-15 2016-07-20 孔涛 使用hevc视频解码的超高清数字电视接收机
CN106060647A (zh) * 2013-05-15 2016-10-26 蔡留凤 采用字幕处理模块的超高清数字电视接收机的工作方法
KR101456973B1 (ko) * 2014-01-24 2014-11-07 에스케이텔레콤 주식회사 가중치예측을 이용한 영상 부호화/복호화 방법 및 장치
RU2017110786A (ru) 2014-10-03 2018-11-06 Нек Корпорейшн Устройство видеокодирования, устройство видеокодирования, способ видеокодирования, способ видеокодирования и программа
MX2021007465A (es) * 2018-12-21 2021-08-05 Beijing Dajia Internet Information Tech Co Ltd Metodos y aparatos de codificacion de video para derivar vectores de movimiento afines para componentes croma.
CN111683247A (zh) * 2019-03-11 2020-09-18 上海天荷电子信息有限公司 多权重可减少分量数的分量间自预测数据压缩方法和装置
CN114303370B (zh) * 2019-09-01 2023-11-14 北京字节跳动网络技术有限公司 视频编解码中预测权重的对准
CN114556926A (zh) 2019-10-10 2022-05-27 北京字节跳动网络技术有限公司 几何分割模式中的运动矢量处理
CN110930962B (zh) * 2019-11-26 2020-12-11 浪潮集团有限公司 一种细微亮度变化放大显示方法及电路
CN112203086B (zh) * 2020-09-30 2023-10-17 字节跳动(香港)有限公司 图像处理方法、装置、终端和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08228351A (ja) * 1995-02-20 1996-09-03 Nippon Telegr & Teleph Corp <Ntt> 動画像の動き補償予測符号化方法
US7542510B2 (en) * 2002-11-20 2009-06-02 Panasonic Corporation Moving picture predicting method, moving image encoding method and device, and moving image decoding method and device
JP2007067731A (ja) * 2005-08-30 2007-03-15 Sanyo Electric Co Ltd 符号化方法
JP2007081518A (ja) * 2005-09-12 2007-03-29 Victor Co Of Japan Ltd 動画像符号化装置および動画像符号化方法
JP5224459B2 (ja) * 2006-02-02 2013-07-03 トムソン ライセンシング 動き補償予測のための適応重み選択を行う方法および装置
WO2008004940A1 (en) * 2006-07-07 2008-01-10 Telefonaktiebolaget Lm Ericsson (Publ) Video data management
GB2444992A (en) * 2006-12-21 2008-06-25 Tandberg Television Asa Video encoding using picture division and weighting by luminance difference data

Also Published As

Publication number Publication date
WO2011089973A1 (ja) 2011-07-28
US20120288006A1 (en) 2012-11-15
JP2011151683A (ja) 2011-08-04
CN102714735A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
JP6057140B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
JP5234368B2 (ja) 画像処理装置および方法
WO2010101064A1 (ja) 画像処理装置および方法
WO2011024685A1 (ja) 画像処理装置および方法
WO2010095559A1 (ja) 画像処理装置および方法
KR20120123326A (ko) 화상 처리 장치 및 방법
WO2010095560A1 (ja) 画像処理装置および方法
WO2010035731A1 (ja) 画像処理装置および方法
WO2010035734A1 (ja) 画像処理装置および方法
WO2011086964A1 (ja) 画像処理装置および方法、並びにプログラム
WO2010035732A1 (ja) 画像処理装置および方法
US20120288004A1 (en) Image processing apparatus and image processing method
KR20110133554A (ko) 화상 처리 장치 및 방법
WO2010035735A1 (ja) 画像処理装置および方法
WO2012005194A1 (ja) 画像処理装置および方法
WO2011125625A1 (ja) 画像処理装置および方法
JP6268556B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
WO2012077530A1 (ja) 画像処理装置および方法
JP2013150347A (ja) 画像処理装置および方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid