KR101187550B1 - 입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법 - Google Patents

입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법 Download PDF

Info

Publication number
KR101187550B1
KR101187550B1 KR1020117022011A KR20117022011A KR101187550B1 KR 101187550 B1 KR101187550 B1 KR 101187550B1 KR 1020117022011 A KR1020117022011 A KR 1020117022011A KR 20117022011 A KR20117022011 A KR 20117022011A KR 101187550 B1 KR101187550 B1 KR 101187550B1
Authority
KR
South Korea
Prior art keywords
video
bits
digital video
delta
header
Prior art date
Application number
KR1020117022011A
Other languages
English (en)
Other versions
KR20110111544A (ko
Inventor
마누엘 라파엘 구티에레즈 노벨로
Original Assignee
티디비전 코포레이션 에스.에이. 데 씨.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 티디비전 코포레이션 에스.에이. 데 씨.브이. filed Critical 티디비전 코포레이션 에스.에이. 데 씨.브이.
Publication of KR20110111544A publication Critical patent/KR20110111544A/ko
Application granted granted Critical
Publication of KR101187550B1 publication Critical patent/KR101187550B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

디지털 비디오 스트림으로부터 3차원 이미지들을 얻기 위해서, 현재의 MPEG2 코더들에 특정 변형들이 만들어지고; 코딩 프로세스의 상이한 부분에서의 소프트웨어와 하드웨어 변화들이 이루어진다.
실제로, 비디오 데이터 스트림의 구조 및 비디오 시퀀스(video_sequence)는 비트 레벨에서 TDVision® 기술 이미지 형태를 식별하기 위해 필요한 플래그를 포함하도록 변형된다.
소프트웨어에 관해서,변형들이 이하의 프로세스 즉, 비디오 시퀀스 헤더(video_sequence header),식별 플래그 변형,데이터 필드 변형, 및 이미지 필드 변형에서 이루어진다.
하드웨어에 관해서, 전자적 비교가 좌우측 채널들의 이미지들 간에 이루어지고, 그 차이가 B형 이미지로서 처리되고, 즉 에러 교정이 수행되고, 그 결과들은 TDVision® 기술 식별자를 갖는 임시 버퍼에 저장된다.
정보가 코딩될 때,DSP가 MPEG2-호환성 압축 비디오 스트림을 만들어 내기 위해서 예측,비교,양자화, 및 DCT 기능 적용 프로세스들을 실행하기 위해 사용된다.

Description

입체적 3D-비디오 이미지 디지털 코딩 시스템 및 방법{METHOD AND SYSTEM FOR DIGITAL CODING 3D STEREOSCOPIC VIDEO IMAGES}
본 발명은 3DVisorTM 장치에서 입체적 비디오 이미지 디스플레이, 특히 표준화된 압축 기술들을 사용하여 3차원의 정보 저장을 허용하는 디지털 데이터 압축 시스템에 의한 비디오 이미지 코딩 방법에 관한 것이다.
현재, 데이터 압축 기술들은 이미지 또는 일련의 이미지들의 표현에서 비트 소모를 감소시키기 위해 사용된다.표준화 작업들은 국제 표준 기구(International Standardization Organization)의 전문가들의 그룹에 의해 수행되었다.현재,이 방법들은 보통 JPEG(Joint Photographic Expert Group)와 MPEG(Moving Pictures Expert Group)로서 알려져 있다.
이 기술들의 공통적인 특징은 이미지 블록들이 블록들에 적절한 변환을 적용하므로써 처리된다는 것인데, 이것은 보통 이산 여현 변환(Discrete Cosine Transform;DCT)으로서 알려져 있다.형성된 블록들은 양자화 처리에 제공되고,그 때 가변 길이 코드로 코딩된다.
가변 길이 코드는 가역 처리인데, 이는 가변 길이 코드로 코딩된 것의 정확한 재구성을 허용한다.
디지털 비디오 디스플레이는 30 내지 75 Hz의 주파수로 연속해서 표시되거나 표현되는 특정 수의 이미지 프레임(30 내지 96 fps)들을 포함한다.각 이미지 프레임은 특별한 시스템의 디스플레이 해상도에 따라,픽셀 어레이에 의해 형성된 이미지이다.예로서,VHS 시스템은 320개의 컬럼들과 480개의 로우들의 디스플레이 해상도를 갖고,NTSC 시스템은 720개의 컬럼들과 486개의 로우들의 디스플레이 해상도를 갖고,그리고 고해상도 텔레비전 시스템(HDTV)은 1360개의 컬럼들과 1020개의 로우들의 디스플레이 해상도를 갖는다.저해상도, 즉 320개의 컬럼 X 480개의 로우 VHS 포맷의 디지털화 형태를 기준으로, 2시간의 긴 영화는 100 기가바이트의 디지털 비디오 정보와 같을 수 있다.비교시에, 종래의 콤팩트 광 디스크는 대략 0.6 기가바이트의 용량을 갖고, 자기 하드 디스크는 1 내지 2 기가바이트 용량을 가지며, 현재의 콤팩트 광 디스크들은 8 기가바이트 내지 그 이상의 용량을 갖는다.
이처럼 큰 정보량의 저장과 전달 한계들에 대응하여,몇몇 표준 압축 프로세스들이 확립되었다.이들 비디오 압축 기술들은 프레임간 픽셀들의 표현에 근거하는 프레임 단위(frame-by-frame) 압축을 제공하기 위해 일시적 공간 상관 관계로 인용되는 연속 이미지 프레임들 간의 유사한 특징들을 사용한다.
우리들이 영화관과 TV 스크린들에서 보는 모든 이미지들은 완전한 이미지(정적인 이미지, 사진과 같은)들을 고속으로 제공하는 원리에 근거한다.이들이 30 프레임/초의 속도(30 fps)로 빠르고 연속적인 방법으로 제공될 때 그들을 우리는 인간의 눈의 잔상 때문에 활동성 있는 이미지로서 지각한다.
연속적인 방법으로 표현될 이미지들을 분류하고 비디오 신호들을 형성하기 위해서, 각 이미지는 로우들로 나눠질 필요가 있는데, 여기서 각 라인은 차례대로 화소 또는 픽셀로 나눠지고, 각 픽셀은 2개의 관련된 값,즉 루마(luma) 및 크로마(chroma)를 갖는다. 루마는 각 포인트에서 광 세기를 나타내고, 반면에 3 바이트에 의해 표현될 수 있는 규정된 컬러 공간(RGB)의 기능으로서 컬러를 나타낸다.
이미지들은 수평-수직 래스터, 상하 및 좌우로 그리고 주기적으로 스크린 상에 표시된다.디스플레이의 라인 수와 주파수는 NTSC,PAL 또는 SECAM 같이,포맷의 기능으로서 바뀔 수 있다.
이론적으로 각 루마,크로마 U와 크로마 V 픽셀에 대해 값을 할당하는 것이 가능하나, 이것은 4 바이트(하나는 크로마를 위한 것과 3개는 컬러를 위한 것)를 나타내고, NTSC 480 로우 x 720 컬럼 포맷 및 초당 대략 30 프레임으로, 4 x 480 x 720 x 30, 대략 초당 40 메가바이트 메모리가 생기는데, 이는 가용 대역폭 때문에 저장과 전송이 어렵다. 현재는, 1:4 픽셀로 크로마 데이터들을 줄이고, 즉 각 4개의 픽셀 당 컬러 샘플을 취하고,분실된 3개에 대해 동일한 정보를 복제하는데, 인간은 그 차이를 인지하지 못하며; 그 포맷은 다음과 같다:
4: 4:4(4 x 4 = 16 픽셀 그룹에서 4개의 루마 샘플과 4개의 크로마 샘플).
4: 2:2(4 x 2 = 8 픽셀 그룹에서 4개의 루마 샘플과 2개의 크로마 샘플).
4: 1:1(4 x 1 = 4 픽셀 그룹에서 4개의 루마 샘플과 1개의 크로마 샘플).
4: 2:0 MPEG1의 (4 x 2 = 8 픽셀 그룹에서 수평 픽셀들 간의 2개의 크로마 샘플과,8개의 루마 샘플).
4: 2:0 MPEG1의 (4 x 2 = 8 픽셀 그룹에서 수직 픽셀들 간의 2개의 크로마 샘플과,8개의 루마 샘플).
정보가 이러한 방식으로 감소될 때에도, 4: 2: 0 품질에서 NTSC 포맷으로 정보의 1/2을 저장하는데 필요한 필수 디지털 정보량은 15 메가바이트이거나, 2시간짜리 파일을 위해서는 108 기가바이트가 된다.
몇가지 방법들이 2차원 비디오 시퀀스로부터 3차원 화면 재구성을 위해 존재한다.최근의 기술 발전에 비추어서,그리고 장래에 관해서,MPEG4 표준은 매체를 코딩하는 시간-공간 관련 그래픽스를 제공하려고 하는데, 이는 입체적인 이미지, 디자인과 공학 응용 제조에 중요한 도구가 된다.화면의 기하학 모델이 재구성되는 경우에 가상의 공간이 만들어진다.예를 들면,세실 듀포(Cecile Dufour)에게 2003년 12월 9일에 특허된 USP No. 6,661,914호가 있는데, 여기서 새로운 3차원의 재구성 방법이 기술되는데, 화면 연속이 간단한 카메라로 일어나고, 이미지의 윤곽들이 재구성되며, 각 뷰(view)에서의 숨겨진 부분의 깊이가 나중에 투영되고 정제된 프로세스에 제출된다.
이미지 처리를 위해,많은 가치있는 공헌들이 있는데, 예를 들면, 2003년 10월 21일에 이토가와(Itokawa)에게 특허된 USP No. 6,636,644호는 MPEG4를 사용하는 이미징 프로세스를 인용하고 있는데, 여기서는 이미지 경계에 걸쳐 확장되는 크로마 값 이미지가 추출되고, 더 큰 효율이 코딩시에 이뤄지며, 자연적 컬러 생성이 이미지의 윤곽에서 이뤄질 수 있다.
2003년 10월 14일에 클레이호스트(Kleihorst)에게 특허된 USP No. 6,633,676호 같은 몇몇 방법 및 장치들이 비디오 신호를 코딩하기 위해 존재하는데, 이 방법은 카메라 시스템에서 코더 검출기에 적용되고, 비디오 신호는 보상된 모션 (I.B.P.)으로 코딩되며, 고해상도 이미지가 생성되고,이 이미지는 이전의 것들의 보간(interpolation)이며, 요약하면 더 큰 해당 영역들이 비디오 신호에서 결정되는데, 이는 더 작은 메모리를 함께 점유하게 된다.
이미지 압축 코딩은 효율적인 방식으로 디지털 이미지들을 저장하거나 전송하기 위해 본질적으로 사용되는데, 압축된 디지털 이미지들을 코딩하는 방법은 JPEG와 MPEG 같은 공통의 표준들의 지배적인 기술에서와 같이 DCT를 사용한다. 2002년 2월 5일에 분(Boon)에게 특허된 USP No. 6,345,123호는 통상의 DCT 방법으로 계수들을 변형하므로써 디지털 이미지 코딩의 방법을 기술하고 있고,상기 계수의 양자화 처리를 적용하여 미리 쓰여진 양자화 스케일에서 그들을 변형하고, 그리고 마침내 가변 길이 코딩 프로세스가 양자화되고 변형된 계수들에 적용되어, 이들을 가변 길이 코드 테이블에 비교하게 된다.
이미지는 코딩되기 위해 복수의 작은 영역들로 나눠지고, 이 작은 영역들은 서로 인접하며, 샘플은 영역으로부터 취해지고 다음 이미지 영역의 환경이 예측된다. 이 예측적인 코딩 방법은 2000년 11월 4일에 분(Boon) 등에게 특허된 USP No. 6,148,109호에서 사용되는데, 작은 영역들 간의 차이의 생성된 이미지 데이터가 코딩되고 추출된다.
2000년 8월 1일에 무라카미(Murakami) 등에게 특허된 USP No. 6,097,759호는 필드 코딩 이미지를 위한 바이-블록(by-block) 코딩 시스템을 기술한다.블록 패턴들은 1개의 개별 블록 필드와 1개의 논-인터레이스 블록을 포함하고; 또한 코딩 시스템은 보상된 이동 예측 신호를 생성하기 위해 홀수 및 짝수 필드 이동을 조사하고, 따라서 고효율 코딩이 제공된다.
카타다(Katata)에게 특허된 USP No. 5,978,515; 5,963,257; 5,815,601호는 기술하기 위해 사용된 데이터량을 늘리지도 않고, 다른 영역에 비해 선택된 영역의 이미지 품질을 개량하는 방식으로 이미지 데이터를 코딩하기 위한 이미지 코더를 인용하고 있다.
1996년 11월 26일에 기슬(Gisle)에게 특허된 USP No. 5,579,413호는 양자화된 이미지 블록에서 데이터 신호를 변환하고 이를 가변 길이 코딩 데이터 신호에서 변형하기 위한 방법을 기술하는데, 여기서 각 이벤트는 3차원의 양으로서 표현된다.
더 적은 공간에서 같은 내용의 저장을 허용하는 데이터 압축 시스템을 사용해야 하는 필요성이 대두되어, 전문가 그룹은 정보를 압축하고 이미지를 표시하는 방법을 만드는데 전념하였지만; 구현 세부들을 참조하지 않고,모든 소프트웨어와 하드웨어 개발자들의 목적은 MPEG와 호환가능하게 주어진 프로세스를 수행하는 새로운 형태를 만드는 것이다.현재,MPEG2는 세계적인 표준이고,텔레비전과 비디오 및 오디오 관련 회사들에 의해 널리 사용된다.
오디오와 비디오는 요소의 패키지로 패키징되고(PES), 상기 오디오와 비디오 패키지는 MPEG2 데이터 스트림을 만들기 위해 함께 혼용된다.각 패키지에는 재생 시간에 오디오 및 비디오 동기화를 위한 시간 식별(시간 스탬프)이 주어지는데, 예를 들면,3개의 비디오 프레임마다 1개의 오디오 프레임이 관련된다.
MPEG는 시스템의 스트림들에서 비디오와 오디오를 혼용하는 2개의 상이한 방법들을 가진다:
위성 시스템들 같은,전송 스트림은 더 큰 에러 가능성이 있는 시스템들에서 사용되는데, 이는 간섭에 민감하다.각 패키지는 길이가 188 바이트이고,갭들을 인지하고,가능한 에러들을 수리하는 식별 헤더에서 시작한다.여러 가지 오디오와 비디오 프로그램들은 한 개의 전송 스트림에서 전송 스트림을 통해 전송될 수 있고; 헤더 때문에,그들은 독립적으로 그리고 개별적으로 해독될 수 있고 많은 프로그램들로 통합될 수 있다.
프로그램 스트림은 DVD 플레이에서와 같이, 더욱 작은 에러 가능성을 갖는 시스템들에서 사용된다.이 경우,패키지들은 가변 길이와 실질적으로 전송 스트림에서 사용되는 패키지들보다 큰 사이즈를 갖는다.주된 특징으로서,프로그램 스트림은 한 개의 프로그램 내용만을 허용한다.
MPEG2 표준 하의 비디오 시스템은 혼용된 형태와 단계적 형태의 비디오 이미지들의 코딩을 허용한다.
즉,단계적 비디오 체계는 전체 프레임(프레임 픽처, fp)내에 저장되고, 혼용된 비디오 체계 내에서,이는 2가지 방식, 즉 전체 프레임 이미지(프레임 픽처)에 의해 또는 필드 이미지(필드 픽처)에 의해 저장될 수 있다.
압축 체계에는 3개의 MPEG2 포맷 이미지들이 존재한다:
인트라코딩된(intracoded) (I), 그들의 정보는 이미지 자신의 내부 데이터들의 함수로 코딩된다.
예측-코딩된 (P), 그 정보는 다른 미래의 시간 포인트에 있는 데이터에만 의존한다.
양방향 예측 코딩된 (B), 그 정보는 과거와 미래에 위치하는 데이터에 의존한다.
순번대로,3개의 압축 형태들이 있는데, 이들은 상기 패키지들,예를 들면 시간 예측,압축과 공간 압축에 적용된다.
제시간의 예측 압축은 제시간의 2개의 다른 프레임을 인용하지만, 이는 모션이 관련되어 있고, 프레임들 간의 이미지가 거의 변하지 않는다는 장점을 갖는다.
공간의 압축은,예를 들어, 루마를 위한 1 바이트 그리고 컬러를 위한 3 바이트를 갖는 100 x 100의 픽셀 이미지 내에, 1개의 동일한 프레임 내에 있는 (인트라코딩된) 정보를 꽉 채우는데, 만일 이러한 정보를 저장하는 것이 요구되다면 프레임당 40 킬로바이트가 필요하고; 반면에 이러한 이미지가 완전히 화이트이면, 그것은 컬러: 255R,255G,255B,Xstart=0,Ystart=0,Xend=99,Yend=99로서 표현되고, 이것은 이 전체의 영역이 화이트임을 나타내고; 40 킬로바이트를 사용하는 대신에,단지 7 또는 8이 사용된다.따라서, MPEG 압축이 이뤄지고; 처리 스텝들은 복잡하게 되며,현재의 발명의 범위를 벗어난다.
(I)형 이미지들은 완비되어 있고, 이들은 이전 또는 이후의 이미지 어느 것도 인용하지 않으므로, 압축은 시간 예측에서 사용되지 않고,그 대신 자신의 공간 기능만으로서의 역할을 한다.
(P)형 이미지들은 그들 자신을 코딩하기 위해 참조 이미지들에 기초하므로, 그들은 시간 예측 압축,그리고 공간 압축도 사용한다.이들 이미지들은 (I)형 이미지 또는 다른(P)형 이미지들을 인용할 수 있지만, 1개의 이미지 참조 이미지만을 사용한다.
(B)형 이미지들은 재구성되기 위해서 2개의 이전 및 이후 참조들을 요구하는데, 이러한 형태의 이미지들은 최고의 압축 색인을 가진다.(B)형 이미지를 얻기 위한 참조는 (P)또는 (I)형만 있을 뿐, 결코(B)형은 아니다.
코딩과 디코딩 시퀀스들은 다르다.
정보 볼륨을 감소시키기 위해서, 완전한 이미지는 소위 매크로블록(macroblock)으로 불리는 유닛의 전체 프레임으로 나눠지고; 각 매크로블록은 16 픽셀 x 16 픽셀의 분할에 의해 포함되며; 이는 상하 및 좌우로 순서가 정해지고 명명되어, 스크린 상에 매크로블록 매트릭스 어레이를 만들고,매크로블록들은 순서가 정해진 연속적 방법, 즉 0,1,2,3,...n으로 정보 스트림 내에 보내어진다.
(I)형 이미지를 가지고 있는 매크로블록들은 공간 압축에서만 완비되어 있고; (P)형 이미지들은, 제한없이 인트라코딩된 매크로블록 (인터레이스된 매크로블록)일 가능성으로, 이전의 이미지들을 인용하기 위해서 (P)형 매크로블록들을 포함할 수 있다.
(B)형 이미지들은 또한 인트라코딩된(인터레이스된)형태의 매크로블록들에 의해 형성될 수 있는데, 이들은 이전 이미지, 이후 이미지 또는 둘다를 인용한다.
순번대로,매크로블록들은 블록들로 나눠지고, 1개의 블록은 8 x 8 데이터 또는 샘플 매트릭스이고; 크로마 포맷이 분류되는 형태 때문에, 4:4:4 포맷은 1개의 루마 샘플 Y,1개의 크로마 샘플 Cr,1개의 크로마 샘플 Cb를 필요로 하고, 그러므로 하나의 4:4:4 포맷 매크로블록은 매크로블록당 12개의 블록을 필요로 하며, 4:2:0 포맷에서는 매크로블록당 6개의 블록들이 필요하다.
연속적인 매크로블록들의 세트는 슬라이스(slice)를 표현하고; 슬라이스 내에는 소정 수의 매크로블록들이 있으며, 이들은 매크로블록과 동일한 방식으로 싱글 로우에 속해야 하며, 슬라이스들은 좌우 및 상하로 명명된다. 슬라이스들은 코딩된 이미지가 각 픽셀마다 샘플들을 필요로 하지는 않는 것처럼, 모든 이미지를 커버할 필요는 없다.
몇몇 MPEG 프로필은 견고한 슬라이스 구조를 필요로 하는데, 여기서 이미지는 완전히 충족되어야 한다.적절한 하드웨어와 소프트웨어 알고리즘 조합의 사용은 MPEG 이미지 압축을 허용한다.
코딩된 데이터들은 블록-특정 정보,매크로블록,필드,프레임,이미지 및 MPEG2 포맷 비디오를 가진 바이트들이다.
정보는 블록에 의해 그룹화되어야 하고, 정보 코딩, 예를 들면(VLC)로부터 얻어진 결과들은 선형 비트-바이트 스트림이다.
VLC(가변 길이 디코더)가 압축 알고리즘인 경우에, 가장 빈번한 패턴들은 더 짧은 코드들로 대체되고, 그다지 빈번하게 일어나지 않는 것들은 더 긴 코드들로 대체된다.이 정보의 압축된 버전은 더 작은 공간을 점유하고,네트워크에 의해 더 빨리 전송될 수 있다.그러나,그것은 쉽게 편집 가능한 포맷이 아니고, 룩-업 테이블을 사용하여 감압(decompression)을 필요로 한다.
역 스캔,정보는 블록들에 의해 그룹화되어야 하고, VLC에 의해 정보를 코딩할 때 얻어진 것들은 선형 스트림이다.블록들은 8 x 8 데이터 매트릭스들이고, 따라서 정방형의 8 x 8 매트릭스들에서 선형 정보를 변환하는 것이 필요하다. 이것은 단계적 이미지 또는 인터레이스된 이미지인 지에 따라, 내림 순서 지그재그 방식, 즉 둘다 시퀀스 형태로 상하 및 좌우로 만들어진다.
역 양자화는 단지 각 데이터 값에 인수를 곱하여 간단히 구성된다. 코딩될 때, 블록들의 대부분의 데이터는 인간의 눈이 지각할 수 없는 정보를 제거하기 위해 양자화되고,양자화는 더 큰 MPEG2 스트림 변환을 얻기 위해 허용하며, 그것은 또한 디코딩 프로세스에서 역 프로세스(역 양자화)를 실행하는 것이 요구된다.
MPEG 비디오 시퀀스 구조:이것은 MPEG2 포맷에서 사용되는 최대 구조이고,이하의 포맷을 가진다:
비디오 시퀀스 (Video_Sequence)
시퀀스 헤더 (Sequence_Header)
시퀀스 확장 (Sequence_Extension)
사용자 데이터(0) 및 확장 (Extension_and_User_Data(0))
이미지 그룹 헤더 (Group_of_Picture_Header)
사용자 데이터 (1) 및 확장(Extension_and_User_Data(1))
이미지 헤더(Picture_Header)
코딩된 이미지 확장(Picture_Coding_Extension)
사용자 데이터 (2) 및 확장(Extension_and_User_Data(2))
이미지 데이터(Picture_Data)
슬라이스 (Slice)
매크로블록(Macroblock)
모션 벡터(Motion_Vectors)
코딩된 블록 패턴(Coded_Block_Pattern)
블록 (Block)
최종 시퀀스 코드(Sequence_end_Code)
비디오 시퀀스는 이들 구조들로 이루어지고, 비디오 시퀀스는 MPEG1와 MPEG2 포맷에 적용되는데, 각 버전을 차등화하기 위해서는 시퀀스 헤더 직후 시퀀스 확장이 존재하고, 시퀀스 확장이 헤더를 따르지 않으면 스트림이 MPEG1 포맷 비디오 스트림임이 검증되어야 한다.
본 발명의 목적은 입체적인 3D-이미지 디지털 코딩 방법 및 시스템을 제공하는 것인데, 이 시스템은 3Dvisors®에서 전송,수신 및 디스플레이를 위해 코딩된 데이터들을 제공한다.
본 발명의 다른 목적은 비디오 데이터 스트림 비디오 시퀀스(video_sequence) 구조들이 변형되고 식별 플래그들이 비트 레벨에서 포함되는 코딩 체계를 제공하는 것이다.
본 발명의 또 다른 목적은 비디오 시퀀스(video_sequence), 식별 플래그, 데이터 필드 및 이미지 필드가 변형되는 방식으로 3D-이미지 디지털 코딩 소프트웨어 프로세스를 제공하는 것이다.
본 발명의 또 다른 목적은 좌우 채널들 간의 전자 비교가 이루어지고, 이미지들 간의 차이의 에러 교정이 이루어지며, 처리된 이미지가 TDVision® 기술 식별자를 갖는 비디오 시퀀스(video_sequence) 내에 저장되는 방식으로 3D-이미지 디지털 코딩 하드웨어 프로세스를 제공하는 것이다.
본 발명의 또 다른 목적은 DSP의 입력 버퍼 메모리가 2배로 되고, 2개의 독립적인 비디오 신호들의 동시 입력이 가능하며, DSP가 2개의 비디오 신호들의 입력 버퍼들을 비교할 수 있게 되는 방식으로 3D-이미지 디지털 코딩 하드웨어 프로세스를 제공하는 것이다.
전술한 목적을 달성하기 위해 본 발명의 제1 양태에서는 입체 디지털 비디오를 인코딩하기 위한 시스템을 제공하되, 상기 입체 디지털 비디오를 인코팅하기 위한 시스템은,
하나 또는 복수의 입력 비디오 신호로부터 제1 안 이미지(first eye images)와 제2 안 이미지를 수신하는 수신기;
상기 제1 안 이미지와 상기 제2 안 이미지 사이의 차이 이미지(difference images)를 계산하는 프로세서;
상기 하나 또는 복수의 출력 비디오 스트림으로 상기 제1 안 이미지와 상기 차이 이미지를 출력하는 인코더 - 상기 하나 또는 복수의 출력 비디오 스트림은 헤더, 제1 안 이미지 및 차이 이미지를 포함하고, 상기 헤더는 상기 하나 또는 복수의 출력 비디오 스트림 내에 차이 이미지가 존재하는지의 여부를 디코더에 지시하는 데이터를 포함하는 것을 특징으로 한다.
또한 본 발명의 제2 양태에서는,
하나 또는 복수의 입력 비디오 신호로부터 제1 안 이미지 및 제2 안 이미지를 수신하도록 구성된 하나 또는 복수의 버퍼;
상기 제1 안 이미지와 상기 제2 안 이미지 사이의 차이로부터 차이 이미지를 계산하기 위한 제1 소프트웨어;
상기 제1 안 이미지와 상기 차이 이미지를 하나 또는 복수의 출력 비디오 스트림에 저장하는 제2 소프트웨어 - 상기 하나 또는 복수의 출력 비디오 스트림은 헤더, 제1 안 이미지 및 차이 이미지를 포함하고, 상기 헤더는 상기 하나 또는 복수의 출력 비디오 스트림 내에 차이 이미지가 존재하는지의 여부를 디코더에 지시하는 데이터를 포함하는 것을 특징으로 하는 입체 비디오 인코딩 시스템을 제공한다.
본 발명에 따르면, 전술한 해결하고자 하는 과제에 기재된 목적을 달성할 수 있다.
도 1은 입체적 3D-비디오 이미지 코딩을 위한 하드웨어와 소프트웨어 변경들을 도시한 도.
도 2는 MPEG2-4 호환가능 입체적 3D-비디오 이미지를 위한 컴파일 프로세스를 도시한 도.
도 3은 MPEG2-4 호환가능 입체적 3D-비디오 이미지의 컴파일을 위한 소프트웨어 포맷을 도시한 도.
도 4는 MPEG2-4 호환가능 입체적 3D-비디오 이미지의 컴파일을 위한 하드웨어 포맷을 도시한 도.
도 5는 본 발명의 코더가 속하는 기술 가지의 맵을 도시하는데; 즉, 입체적 3D-이미지 처리, 코딩, 디코딩, 케이블 및 위성을 통한 전송, 그리고 DVD,HDTV 및 3DVisors® 디스플레이를 도시한 도.
디지털 비디오 스트림으로부터 3차원 이미지를 얻는 목적에 따르면, 코딩 프로세스의 서로 다른 부분들에서 하드웨어와 소프트웨어를 변경하므로써 변형이 현재의 MPEG2 코더들에 행해진다. 도 1에 도시된 바와 같이, MPEG2-4 호환가능 TDVision® 코더(1)는 소프트웨어(3)및 하드웨어(4) 변경을 통하여 달성된 자신의 코딩 프로세스(2)를 가진다.
도 2에서, 본 발명의 코더 오브젝트의 컴파일 프로세스가 도시되고, 실제로는,이미지(10)가 취해져 모션 보상과 에러 검출 프로세스(11)에 제출되고; 이산 여현 변환 기능(discrete cosine transform function)은 주파수 매개 변수(12)를 바꾸기 위해 적용되고, 그 다음 양자화 매트릭스(13)는 표준화 프로세스를 수행하기 위해 적용되며, 로우 변환 프로세스(14)에 대한 매트릭스가 적용되는데, 여기에서는 가변 길이 코딩(15)을 수행하기 위한 가능성이 존재하고, 그리고 마침내,코딩된 데이터(16)를 가진 비디오 시퀀스가 얻어진다.이러한 컴파일 프로세스를 수행하기 위해, 포맷(30, 도 3) 또는,MPEG2 호환가능 3D-이미지 컴파일 방법이 수반되어야 하며, 실제로는, 도 3에서 도시된 바와 같이, 비디오 시퀀스(video_sequence(31))는 시퀀스 헤더(sequence_header(32)), 사용자 데이터(user_data(33)), 시퀀스 스케일러블 확장(sequence_scalable_extension(34)), 픽처 헤더(picture_header(35)), 픽처 코딩 확장(picture_coding_extension(36)) 및 픽처 임시 스케일러블 확장(picture_temporal_scalable_extension(37)) 구조 내에서 변형되어야 하고, 따라서 TDVision® 입체 카메라로 취해진 입체적 3D-디지털 이미지에 적합한 컴파일 포맷을 얻는다.
비디오 데이터 스트림의 구조 및 비디오 시퀀스(video_sequence)는 비트 레벨에서 TDVision® 기술 코딩 이미지 형태를 식별하기 위해 필요한 플래그들을 포함하도록 변형되어야 한다.
변형은 다음 코딩 스테이지, 즉 MPEG2(소프트웨어)에서 이중 이미지를 코딩할 때; 하드웨어에 의해 이미지를 코딩할 때,이루어진다.
소프트웨어:
비디오 시퀀스 헤더(video_sequence headers)들이 변형된다.
식별 플래그들이 식별된다.
데이터 필드들이 변형된다.
이미지 필드들이 변형된다.
하드웨어:
전자 비교는 좌우의 채널들 사이에서 이루어진다.
차이는 B형 이미지(에러 정정)로서 처리된다.
그 다음, TDVision® 식별자와 함께 저장된다.
변경이 상보적 버퍼에 적용된다.
결과들은 절약되고,2차 버퍼에 저장된다.
실제로,DSP 버퍼의 입력 메모리는 2배로 되고; 입체적 TDVision® 카메라로부터의 입체적인 좌-우 기존 신호에 대응하는 2개의 독립적 비디오 신호들의 동시 입력이 허용되며; DSP는 양쪽 비디오 신호들을 위한 입력 버퍼들을 비교하는 것이 가능하게 된다.
하드웨어 코딩 프로세스는 단일 비디오 입력 채널의 함수로서 보통의 MPEG2 방식으로 수행되고, 양쪽 신호(좌우)들이 취해지고 전자적으로 비교되며, 좌우의 신호들 간의 비교의 차이가 얻어지고, 상기 차이는 임시 버퍼에 저장되며, 에러 정정은 왼쪽 신호에 관해서 루마(LUMA)와 크로마(CHROMA)에서 계산되고; DCT(이산 여현 변환) 함수가 적용되며, 정보는 B형 블록에 저장된다:
a) 사용자 데이터 식별 구조(USER_DATA()(SW) identification structure) 내부
b) 픽처 데이터 3D 구조(PICTURE_DATA3D() structure) 내부
다음 프레임에서 계속된다.
하드웨어는 도 4에서 블록도로 도시되고, 실제로는, 왼쪽 신호(41)및 오른쪽 신호(42)가 취해지고, 둘 다의 신호들은 임시 버퍼(43)에 저장되며, 좌우 신호들 간의 차이가 비교되고, 차이의 에러가 계산되고,그리고 정보는 저장되며(45), 정확한 이미지는 코딩되고(46), 코딩은 "I", "B" 또는 "P"형 이미지로서 수행되고(47), 마침내 비디오 시퀀스(video_sequence)(48) 내에 저장된다.
DSP에 의해 취급될 메모리를 이중으로 하고,최대 8개의 출력 버퍼들을 배치할 수 있는 가능성을 가지는 것이 필수적인데, 그것은 TDVision®의 3Dvisors® 같은 장치에 입체적인 이미지의 이전 및 동시 표현을 허용한다.
실제로,텍사스 인스트루먼츠 TMS320C62X DSP의 프로그래밍 API을 호출할 때 2개의 채널들이 초기화되어야 한다.
MPEG2VDEC_create (const IMPEG2VDEC_fxns*fxns, const MEPG2VDEC_Params* params).
여기서, IMPEG2VDEC_fxns y MEPG2VDEC_Params은 예를 들면 다음과 같은 각 비디오 채널을 위해 동작 매개 변수들을 정의하고 있는 포인터 구조들이다:
3DLhandle = MPEG2VDEC_create(fxns3DLEFT,Params3DLEFT).
3DRhandle = MPEG2VDEC_create(fxns3DRIGHT,Params3DRIGHT).
이에 의해, 2개의 비디오 채널들이 디코딩되게 하고, 2개의 비디오 핸들러를 얻게 되는데, 하나는 좌우 입체적 채널을 위한 것이다.
2중 디스플레이 출력 버퍼들이 필요하고,그리고 소프트웨어에 의해,2개의 버퍼들 중 어느 쪽이 AP 기능을 호출하는 것에 의해 출력을 표시해야 하느냐가 정의될 것이다:
즉, MPEG2VDEC_APPLY(3DRhandle, inputR1, inputR2, inputR3, 3doutright_pb, 3doutright_fb).
MPEG2VDEC_APPLY(3DLhandle, inputL1, inputL2, inputL3, 3doutleft_pb, 3doutleft_fb).
여기서, 3DLhandle은 DSP의 생성 기능에 의해 복귀된 핸들에 대한 포인터이고, input1 매개 변수는 FUNC_DECODE_FRAME 또는 FUNC_START_PARA 주소이며, input2는 외부 입력 버퍼 주소에 대한 포인터이고,그리고 input3는 외부 입력 버퍼 크기의 치수다.
3doutleft_pb는 매개 변수 버퍼의 주소이고,3doutleft_fb는 디코딩된 이미지가 저장될 곳인 출력 버퍼의 처음이다.
타임코드(timecode)와 타임스탬프(timestamp)는 연속적이고,동기화된 방식으로 최종적인 장치에 출력하기 위해 사용된다.
소프트웨어와 하드웨어 프로세스들의 통합은 DSP로서 알려진 장치들에 의해 수행되는데, 이는 대부분의 하드웨어 프로세스들을 실행한다. 이들 DSP는 제조업자들에 의해 제공된 C 및 복합형의 어셈블리 언어에 의해 프로그램된다. 각 DSP는 자신의 API를 가지는데, 이는 DSP에 위치하고 소프트웨어에 의해 호출된 기능 리스트 또는 절차 호출들로 이루어져 있다.
이러한 참조 정보로 인해,MPEG2 포맷-호환가능 3D-이미지 코딩을 위한 본 출원이 만들어졌다.
실제로,비디오 시퀀스의 처음에,시퀀스 헤더와 시퀀스 확장이 항상 나타난다.시퀀스 확장의 반복은 첫 번째와 동일해야 한다.이에 반하여,시퀀스 헤더 반복들은 첫 번째 발생에 비해 약간만 변하고, 양자화 매트릭스를 정의하는 부분만이 변경되어야 한다. 시퀀스 반복은 비디오 스트림에 랜덤 액세스를 허용하고, 즉,디코더가 비디오 스트림의 중간에서 재생을 시작하면, 이는 작업을 가능케 하고, 그것은 비디오 스트림에서 다음의 이미지들을 디코딩할 수 있게 이전의 시퀀스 헤더와 시퀀스 확장을 검색할 뿐이어야 한다.이는 또한, 프로그램이 이미 시작되었을 때에 작동된 위성 디코더 같이,처음부터 시작될 수 없는 비디오 스트림들에 대해 일어난다.
즉,시퀀스 헤더가 비디오 스트림 위에 더 높은 정보 레벨을 제공하고, 명확성을 위해 각각에 대응하고 있는 비트들의 수가 또한 지시되고, 최상위 비트들은 시퀀스 확장(Sequence_Extension)구조들 내에 위치하며, 이는 이하의 구조들에 의해 형성된다:
Figure 112011073392819-pat00001
Figure 112011073392819-pat00002
Figure 112011073392819-pat00003
Figure 112011073392819-pat00004
확장 및 사용자 데이터 (i)
이것은 다른 구조들을 저장하기 위한 컨테이너이고,자신의 데이터들을 가지지 않으며,본질적으로 일련의 extension_data(1) 및 user_data()구조이고, 몇몇 경우에서는 이 구조들은 완전하게 비어 있을 수 있다.
Extension_data (i)
이러한 구조는 단순한 구조 확장을 포함한다.내포된 확장 구조 형태는 (i)의 값에 의존하는데, 이는 1 또는 2의 값을 가질 수 있다.만일 이것이 "0"과 같으면,data_extension은 sequence_extension을 따르게 되고, extension_data(i)는 1개의 sequence_display_extension 또는 1개의 sequence_scalable_extension 양쪽을 포함할 수 있다: .
만일, i = 2이면,구조는 picture_coding_extension을 따르는데, 이는 quant_matrix_extension(), copyright_extension(), picture_display_extension(), picture_spatial_scalable_extension() 또는 1개의picture_temporal_scalable_extension를 포함할 수 있다.이러한 구조는 항상 0x000001B5에서 시작한다.
User _ data
user_data 구조는 비디오 시퀀스(video_sequence)내에 저장될 어플리케이션에 특정한 데이터들을 허용한다.MPEG2 규정은 이러한 함수의 포맷 또는 사용자 데이터의 포맷을 정의하지 않는다.구조는 user_data_start_code = 0x000001B5에서 시작하고,데이터 스트림(스트림)내에서 다음 개시 코드까지 이어지는 데이터 (user_data)의 임의의 수를 포함한다.유일한 조건은 그것이 개시 코드로서 해석될 수 있었던 것처럼, 23개 이상의 연속 제로들을 갖지 않는다는 것이다.
Sequence_display_extension()
이 구조는 디코딩 프로세스에 사용되지 않는 정보, 코딩된 내용을 인용하는 정보를 제공하는데, 이는 디코딩된 비디오를 바르게 디스플레이하는 데 유용하다.
Figure 112011073392819-pat00005
Figure 112011073392819-pat00006
Figure 112011073392819-pat00007
Sequence _ scalable _ extension
이 구조는 모든 스케일러블 비디오 스트림에 존재해야 하는데, 이는 기본계층과 하나 이상의 보완계층들을 포함하고 있다.다른 형태의 MPEG2 스케일러빌러티(scalability)가 존재하되, 주된 층을 위한 스케일러빌러티의 예는 확장 층이 추가 데이터를 갖는 동안 그것이 비디오 내용의 표준의 정의를 포함한다는 것인데, 이는 한계를 증가시킨다.
Figure 112011073392819-pat00008
Group_of_pictures_header()
이 구조는 이미지 그룹의 개시를 마크한다.
Figure 112011073392819-pat00009
Figure 112011073392819-pat00010
Figure 112011073392819-pat00011
Figure 112011073392819-pat00012
Figure 112011073392819-pat00013
Figure 112011073392819-pat00014
Picture_temporal_scalable_extension()
2개의 공간 해상도 스트림은 임시 스케일러빌러티를 갖는 경우에 존재하고, 하부층은 비디오 프레임들의 더 작은 인덱스 버전을 제공하며,반면에 상부층은 동일한 비디오의 프레임들의 더 큰 인덱스 버전을 끌어내기 위해 사용될 수 있다. 임시 스케일러빌러티는 낮은 품질,저비용 또는 자유 디코더들에 의해 사용될 수 있는 반면, 초당 더 큰 프레임들은 비용을 위해 사용된다.
Figure 112011073392819-pat00015
Picture_spatial_scalable_extension()
이미지 공간 스케일러빌러티의 경우, 보완계층은 데이터를 포함하는데, 이는 기본계층의 양호한 해상도를 허용하여, 재구성될 수 있게 한다. 보완계층이 모션 보상을 위한 참조로서 기본계층의 함수로서 사용될 때,하부층은 보완계층의 더 큰 해상도를 얻기 위해 확대되고 오프셋되어야 한다.
Figure 112011073392819-pat00016
Figure 112011073392819-pat00017
이는 단순한 구조이고,자체 내에 필드를 갖지 않는다.
Slice()
동일한 수직 위치의 하나 이상의 매크로블록 상의 정보를 포함.
Figure 112011073392819-pat00018
이러한 MPEG2 호환가능 코딩 프로세스는 현재 도 5의 입체적인 카메라(52)로 취해진 3D-디지털 이미지들을 코딩하기 위해 사용되는데, 이는 컴파일러(51)을 통해 패스되고, 그 다음에 신호가 PC(50), 즉 DVD(53)에서 그것을 표시하기 위해 얻어질 수 있고; 디코더(54)의 신호가 코딩될 때, 이미지가 케이블(56), 위성(57), 고해상도 텔레비전(59)(HDTV)을 통해, 또는 3Dvisors® 디바이스(59) 등 내에서, 표시될 이미지를 위해 디코더(55) 내에 보내질 수 있다. 따라서, 이미지는 다음의 상부에 표시될 수 있다:
DVD (Digital Versatile Disks)
DTV (Digital Television)
HDTV (High Definition Television)
CABLE (DVB Digital Video Broadcast)
SATELLITE (DSS Digital Satellite Systems); 그리고 그것은 소프트웨어와 하드웨어 프로세스 통합이다.
하드웨어에 관해서,대부분의 프로세스는 DSP(디지털 신호 프로세서)로서 알려진 장치들로 실행된다.즉,1개의 모토로라 모델과 1개의 텍사스 인스트루먼츠(TMS320C62X) 모델이다.
이들 DSP는 해당 제조업자에 의해 제공된 C 언어 및 어셈블리 언어들로부터의 복합형의 언어들에 의해 프로그램된다. 각 DSP는 자신의 API를 가지는데, 이는 소프트웨어에 의해 호출될 DSP에 위치하는 함수 리스트 또는 절차 호출들로 구성된다.이러한 참조 정보로부터,3D-이미지들은 코딩되는데, 이는 MPEG2 포맷과 그리고 그들 자신의 코딩 알고리즘과 호환성을 가진다.정보가 코딩될 때,DSP는 MPEG2 압축 비디오 스트림을 형성하기 위해 예측, 비교,양자화 및 DCT 함수 응용 처리할 수 있게 된다.
발명의 특별한 구체화들이 도시되고 기술하게 되었지만,본 발명의 범위를 벗어나지 않는 한도에서 본 분야의 숙련자들에게는 다양하게 변형 또는 변화될 수 있는 것들은 명백할 것이다. 모든 그러한 변형들과 변화들은 본 발명의 범위내에서 다음의 청구범위에 의해 커버된다.

Claims (21)

  1. 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템에 있어서,
    하나 또는 복수의 입력 비디오 신호로부터 제1 안 이미지(first eye images)와 제2 안 이미지를 수신하는 수신기;
    상기 제1 안 이미지와 상기 제2 안 이미지 사이의 차이에 대응하는 델타를 계산하는 프로세서로서, 상기 프로세서는 상기 델타를 B 타입 또는 P 타입의 이미지 프레임으로서 계산하도록 구성된 프로세서;
    제1 세트의 비트와 제2 세트의 비트를 선택하고 선택된 세트의 비트를 헤더에 저장하고 2차원 디지털 비디오 또는 입체 디지털 비디오를 생성하는 인코더를 포함하고,
    상기 제1 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재하지 않음을 알려주고,
    상기 제2 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재함을 알려주는 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  2. 제1항에 있어서,
    상기 인코더는 델타가 하나 또는 복수의 비디오 스트림 내에 존재하지 않음을 알려주는 제1 세트의 비트를 선택하고 2차원 디지털 비디오를 출력하도록 구성된 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  3. 제1항에 있어서,
    상기 인코더는 델타가 하나 또는 복수의 비디오 스트림 내에 존재함을 알려주는 제2 세트의 비트를 선택하고 입체 디지털 비디오를 출력하도록 구성된 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  4. 제1항에 있어서,
    상기 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템은 케이블 시스템, 고해상도 텔레비전 시스템, 위성 텔레비전 시스템, 광 디스크 시스템, DVD 시스템 또는 디지털 텔레비전 시스템 중 하나 또는 복수의 일부분인 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  5. 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템에 있어서,
    하나 또는 복수의 입력 비디오 신호로부터 제1 안 이미지(first eye images)와 제2 안 이미지를 수신하는 수신기;
    상기 제1 안 이미지와 상기 제2 안 이미지 사이의 차이에 대응하는 델타를 계산하는 프로세서;
    제1 세트의 비트와 제2 세트의 비트를 선택하고 선택된 세트의 비트를 헤더에 저장하고 2차원 디지털 비디오 또는 입체 디지털 비디오를 생성하는 인코더로서, 상기 인코더는 델타 상에서 에러 교정(error correction)을 더 수행하는 인코더;
    를 포함하고,
    상기 제1 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재하지 않음을 알려주고,
    상기 제2 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재함을 알려주는 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  6. 제1항에 있어서,
    상기 수신기는 입체 디지털 비디오를 촬영하는 카메라를 포함하는 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  7. 삭제
  8. 제1항에 있어서,
    상기 인코더는 상기 델타를 델타 전용의 델타 구조에 저장하는 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  9. 제1항에 있어서,
    하나 또는 복수의 비디오 스트림은 복수의 비디오 스트림을 포함하는 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  10. 제1항에 있어서,
    하나 또는 복수의 비디오 스트림은 MPEG 호환 비디오 스트림인 것을 특징으로 하는 2차원 및 입체 디지털 비디오를 인코딩하기 위한 시스템.
  11. 제1항에 있어서,
    상기 인코더는 헤더 및 제1 안 이미지를 제1 비디오 스트림에 저장하고, 델타를 미리 정해진 데이터 구조에 저장하도록 구성된 것을 특징으로 하는 2차원 디지털 비디오 및 입체 비디오를 인코딩하기 위한 시스템.
  12. 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법에 있어서,
    하나 또는 복수의 입력 비디오 신호로부터 제1 안 이미지 및 제2 안 이미지를 수신하는 단계;
    상기 제1 안 이미지와 상기 제2 안 이미지 사이의 차이를 결정하여 델타를 계산하는 단계 - 여기서 상기 델타는 B 타입 또는 P 타입의 이미지 프레임으로서 계산됨 - ;
    헤더에 저장될 제1 세트의 비트와 제2 세트의 비트를 선택하는 단계 - 여기서, 상기 제1 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재하지 않음을 알려주고, 상기 제2 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재함을 알려줌 - ;
    상기 헤더 내에 선택된 세트의 비트를 저장하는 단계;
    선택된 세트의 비트에 기반하여 2차원 디지털 비디오 또는 입체 디지털 비디오를 인코딩하는 단계를 포함하는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  13. 제12항에 있어서,
    하나 또는 복수의 비디오 스트림 내에 델타가 존재하지 않음을 알려주는 제1 세트의 비트를 선택하고 2차원 디지털 비디오를 출력하는 단계를 더 포함하는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  14. 제12항에 있어서,
    하나 또는 복수의 비디오 스트림 내에 델타가 존재함을 알려주는 제2 세트의 비트를 선택하고 입체 디지털 비디오를 출력하는 단계를 더 포함하는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  15. 제12항에 있어서,
    상기 헤더는, 상기 제1 세트의 비트가 선택되고 헤더에 저장된 경우 2차원 디지털 비디오를 출력하도록 구성된 디코더에 의해 판독되도록 구성되고, 상기 제2 세트의 비트가 선택되고 헤더에 저장된 경우 입체 디지털 비디오를 출력하도록 구성된 디코더에 의해 판독되도록 구성된 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  16. 제12항에 있어서,
    상기 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법은, 케이블 시스템, 고해상도 텔레비전 시스템, 위성 텔레비전 시스템, 광 디스크 시스템, DVD 시스템 또는 디지털 텔레비전 시스템의 적어도 일부분으로서 수행되는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  17. 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법에 있어서,
    하나 또는 복수의 입력 비디오 신호로부터 제1 안 이미지 및 제2 안 이미지를 수신하는 단계;
    상기 제1 안 이미지와 상기 제2 안 이미지 사이의 차이를 결정하여 델타를 계산하는 단계 - 델타 상에서 에러 교정을 수행하는 단계를 포함함;
    헤더에 저장될 제1 세트의 비트와 제2 세트의 비트를 선택하는 단계 - 여기서, 상기 제1 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재하지 않음을 알려주고, 상기 제2 세트의 비트는 상기 헤더를 판독하는 디코더에게 하나 또는 복수의 비디오 스트림 내에 델타가 존재함을 알려줌 - ;
    상기 헤더 내에 선택된 세트의 비트를 저장하는 단계;
    선택된 세트의 비트에 기반하여 2차원 디지털 비디오 또는 입체 디지털 비디오를 인코딩하는 단계를 포함하는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  18. 제12항에 있어서,
    상기 델타는 델타 전용의 데이터 구조에 저장되는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  19. 제12항에 있어서,
    하나 또는 복수의 MPEG 호환 비디오 스트림으로 인코딩된 디지털 비디오를 출력하는 단계를 더 포함하는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
  20. 삭제
  21. 제12항에 있어서,
    상기 헤더 및 제1 안 이미지는 제1 비디오 스트림에 저장되고, 상기 델타는 미리 정해진 데이터 구조에 저장되는 것을 특징으로 하는 2차원 디지털 비디오 및 입체 디지털 비디오를 인코딩하기 위한 방법.
KR1020117022011A 2004-02-27 2004-02-27 입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법 KR101187550B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/MX2004/000011 WO2005083636A1 (es) 2004-02-27 2004-02-27 Método y sistema de codificación digital de imágenes de video 3d estereoscópicas

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020067020050A Division KR20070011340A (ko) 2006-09-27 2004-02-27 입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20110111544A KR20110111544A (ko) 2011-10-11
KR101187550B1 true KR101187550B1 (ko) 2012-10-04

Family

ID=34910115

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117022011A KR101187550B1 (ko) 2004-02-27 2004-02-27 입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법

Country Status (7)

Country Link
US (4) US20070041442A1 (ko)
EP (2) EP1727091A1 (ko)
JP (1) JP2007525906A (ko)
KR (1) KR101187550B1 (ko)
CN (1) CN1926576A (ko)
CA (1) CA2557533A1 (ko)
WO (1) WO2005083636A1 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1727090A1 (en) 2004-02-27 2006-11-29 Tdvision Corporation S.A. DE C.V. Method and system for digital decoding 3d stereoscopic video images
JP5587552B2 (ja) * 2005-10-19 2014-09-10 トムソン ライセンシング スケーラブル映像符号化を用いた多視点映像符号化
BRPI0709194A2 (pt) 2006-03-29 2011-06-28 Thomson Licensing métodos e aparelhos para uso em um sistema de codificação de vìdeo multivista
RU2443074C2 (ru) * 2006-07-06 2012-02-20 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
EP2001235B1 (en) * 2007-06-08 2013-05-22 Samsung Electronics Co., Ltd. MPEG-4 format extension for recording stereoscopic or synthetic 3D video data with related metadata
MY162861A (en) 2007-09-24 2017-07-31 Koninl Philips Electronics Nv Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal
KR101591085B1 (ko) * 2008-05-19 2016-02-02 삼성전자주식회사 영상 파일 생성 및 재생 장치 및 방법
BRPI0911016B1 (pt) 2008-07-24 2021-01-05 Koninklijke Philips N.V. método de provisão de um sinal de imagem tridimensional, sistema de provisão de sinal de imagem tridimensional, sinal que contém uma imagem tridimensional, mídia de armazenamento, método de renderização de uma imagem tridimensional, sistema de renderização de imagem tridimensional para renderizar uma imagem tridimensional
JP4469419B1 (ja) * 2008-09-30 2010-05-26 パナソニック株式会社 3d映像が記録された記録媒体、3d映像を再生する再生装置、およびシステムlsi
EP2197217A1 (en) 2008-12-15 2010-06-16 Koninklijke Philips Electronics N.V. Image based 3D video format
US8773505B2 (en) * 2009-04-27 2014-07-08 Lg Electronics Inc. Broadcast receiver and 3D video data processing method thereof
EP2425626A2 (en) 2009-05-01 2012-03-07 Thomson Licensing Inter-layer dependency information for 3dv
US8539535B2 (en) * 2009-11-30 2013-09-17 Time Warner Cable Enterprises Llc Methods and apparatus for supporting VOD requests in a system with hierarchical content stores
JP5515729B2 (ja) * 2009-12-24 2014-06-11 ソニー株式会社 カメラアダプタ装置及びカメラ制御方法
JP5413184B2 (ja) * 2009-12-24 2014-02-12 ソニー株式会社 カメラシステム及びカメラ制御方法
US8542241B2 (en) * 2010-04-29 2013-09-24 Acer Incorporated Stereoscopic content auto-judging mechanism
TWI419547B (zh) * 2010-04-30 2013-12-11 Acer Inc 立體內容自動判別機構
JP5549476B2 (ja) * 2010-08-24 2014-07-16 ソニー株式会社 画像処理装置と画像処理方法
WO2012036903A1 (en) 2010-09-14 2012-03-22 Thomson Licensing Compression methods and apparatus for occlusion data
TWI438759B (zh) * 2010-10-29 2014-05-21 Au Optronics Corp 立體影像之顯示方法及相關顯示系統
CN102196291A (zh) * 2011-05-20 2011-09-21 四川长虹电器股份有限公司 一种双目立体视频编码方法
US9615126B2 (en) * 2011-06-24 2017-04-04 Google Technology Holdings LLC Intelligent buffering of media streams delivered over internet
US20140160241A1 (en) * 2011-07-08 2014-06-12 Kangying Cai System and method for encoding and decoding a bitstream for a 3d model having repetitive structure
US10178400B2 (en) * 2012-11-21 2019-01-08 Dolby International Ab Signaling scalability information in a parameter set
EP2923488B1 (en) * 2012-11-21 2021-05-26 Dolby International AB Signaling scalability information in a parameter set
US10349069B2 (en) * 2012-12-11 2019-07-09 Sony Interactive Entertainment Inc. Software hardware hybrid video encoder
CN105874792B (zh) * 2014-01-02 2020-03-03 Vid拓展公司 用于混合的交错和递进内容的可伸缩视频编码的方法
US10204274B2 (en) * 2016-06-29 2019-02-12 Cellular South, Inc. Video to data
US10547846B2 (en) * 2017-04-17 2020-01-28 Intel Corporation Encoding 3D rendered images by tagging objects
US11107268B2 (en) * 2018-09-07 2021-08-31 Cognex Corporation Methods and apparatus for efficient data processing of initial correspondence assignments for three-dimensional reconstruction of an object
CN109600601A (zh) * 2018-11-23 2019-04-09 维沃移动通信有限公司 一种存储3d图像的方法及终端设备

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2279413A (en) * 1938-02-24 1942-04-14 Read Balfour Internal combustion engine
US5821989A (en) * 1990-06-11 1998-10-13 Vrex, Inc. Stereoscopic 3-D viewing system and glasses having electrooptical shutters controlled by control signals produced using horizontal pulse detection within the vertical synchronization pulse period of computer generated video signals
JP2586260B2 (ja) 1991-10-22 1997-02-26 三菱電機株式会社 適応的ブロッキング画像符号化装置
NO175080B (no) 1992-03-11 1994-05-16 Teledirektoratets Forskningsav Fremgangsmåte for koding av bildedata
JP3086396B2 (ja) 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
US5619256A (en) * 1995-05-26 1997-04-08 Lucent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing disparity and motion compensated predictions
US5612735A (en) * 1995-05-26 1997-03-18 Luncent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing two disparity estimates
US6023301A (en) 1995-07-14 2000-02-08 Sharp Kabushiki Kaisha Video coding device and video decoding device
US6055012A (en) * 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
CN100361536C (zh) * 1996-05-28 2008-01-09 松下电器产业株式会社 图像预测编码/解码装置和方法以及记录媒体
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US5652616A (en) * 1996-08-06 1997-07-29 General Instrument Corporation Of Delaware Optimal disparity estimation for stereoscopic video coding
JP2001502504A (ja) * 1996-10-11 2001-02-20 サーノフ コーポレイション 立体視ビデオを符号化及び複号する装置及び方法
US5886736A (en) * 1996-10-24 1999-03-23 General Instrument Corporation Synchronization of a stereoscopic video sequence
EP1100272B1 (en) 1996-11-06 2003-04-02 Matsushita Electric Industrial Co., Ltd. Image decoding method using variable length codes
KR100273110B1 (ko) * 1997-02-26 2000-12-01 윤종용 엠펙 시스템 디코더 및 이 디코더의 데이터 처리 방법
MY129665A (en) * 1997-04-09 2007-04-30 Matsushita Electric Ind Co Ltd Image predictive decoding method, image predictive decoding apparatus, image predictive coding method, image predictive coding apparatus, and data storage media
JP3191922B2 (ja) * 1997-07-10 2001-07-23 松下電器産業株式会社 画像復号化方法
DE69811050T2 (de) 1997-07-29 2003-11-06 Koninkl Philips Electronics Nv Rekonstruktionsverfahren, Vorrichtung und Dekodierungssystem für dreidimensionalen Szenen.
JPH1169346A (ja) * 1997-08-18 1999-03-09 Sony Corp 送信装置、受信装置、伝送装置、並びに送信方法、受信方法、伝送方法
US6043838A (en) * 1997-11-07 2000-03-28 General Instrument Corporation View offset estimation for stereoscopic video coding
US6151362A (en) * 1998-10-30 2000-11-21 Motorola, Inc. Joint rate control for stereoscopic video coding
EP1006482A3 (en) 1998-12-01 2005-08-10 Canon Kabushiki Kaisha Encoding separately image object and its boundary
US6658056B1 (en) * 1999-03-30 2003-12-02 Sony Corporation Digital video decoding, buffering and frame-rate converting method and apparatus
JP2003501902A (ja) 1999-05-27 2003-01-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号の符号化
KR100334722B1 (ko) * 1999-06-05 2002-05-04 강호석 Mpeg 데이터를 이용한 입체영상생성방법 및 그 장치
FR2800551B1 (fr) * 1999-11-03 2002-01-04 St Microelectronics Sa Decodeur mpeg utilisant une memoire partagee
US6678424B1 (en) * 1999-11-11 2004-01-13 Tektronix, Inc. Real time human vision system behavioral modeling
US20020009137A1 (en) * 2000-02-01 2002-01-24 Nelson John E. Three-dimensional video broadcasting system
US6833676B2 (en) * 2000-03-09 2004-12-21 Advanced Lighting Technologies, Inc. Solid lamp fill material and method of dosing HID lamps
WO2001076257A1 (en) * 2000-03-31 2001-10-11 Koninklijke Philips Electronics N.V. Encoding of two correlated sequences of data
US7277121B2 (en) * 2001-08-29 2007-10-02 Sanyo Electric Co., Ltd. Stereoscopic image processing and display system
KR100397511B1 (ko) * 2001-11-21 2003-09-13 한국전자통신연구원 양안식/다시점 3차원 동영상 처리 시스템 및 그 방법
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
JPWO2003092304A1 (ja) * 2002-04-25 2005-09-08 シャープ株式会社 画像データ生成装置、画像データ再生装置、および画像データ記録媒体
JP4154569B2 (ja) * 2002-07-10 2008-09-24 日本電気株式会社 画像圧縮伸長装置
KR100475060B1 (ko) * 2002-08-07 2005-03-10 한국전자통신연구원 다시점 3차원 동영상에 대한 사용자 요구가 반영된 다중화장치 및 방법
AU2002952873A0 (en) * 2002-11-25 2002-12-12 Dynamic Digital Depth Research Pty Ltd Image encoding system
KR100751422B1 (ko) * 2002-12-27 2007-08-23 한국전자통신연구원 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치
JP2004287857A (ja) * 2003-03-20 2004-10-14 Sanyo Electric Co Ltd プログラム、記録媒体、サーバ装置および画像フィルタ
WO2004093467A1 (ja) * 2003-04-17 2004-10-28 Sharp Kabushiki Kaisha 3次元画像作成装置、3次元画像再生装置、3次元画像処理装置、3次元画像処理プログラムおよびそのプログラムを記録した記録媒体
EP1727090A1 (en) * 2004-02-27 2006-11-29 Tdvision Corporation S.A. DE C.V. Method and system for digital decoding 3d stereoscopic video images
US20080017360A1 (en) * 2006-07-20 2008-01-24 International Business Machines Corporation Heat exchanger with angled secondary fins extending from primary fins

Also Published As

Publication number Publication date
US20170070723A1 (en) 2017-03-09
US20190058865A1 (en) 2019-02-21
US20070041442A1 (en) 2007-02-22
KR20110111544A (ko) 2011-10-11
CN1926576A (zh) 2007-03-07
US20100271463A1 (en) 2010-10-28
EP2538676A3 (en) 2014-01-08
EP2538676A2 (en) 2012-12-26
CA2557533A1 (en) 2005-09-09
WO2005083636A1 (es) 2005-09-09
EP1727091A1 (en) 2006-11-29
JP2007525906A (ja) 2007-09-06

Similar Documents

Publication Publication Date Title
KR101187550B1 (ko) 입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법
KR101177663B1 (ko) 입체적 3d-비디오 이미지 디지털 디코딩 시스템 및 방법
RU2511595C2 (ru) Устройство декодирования сигнала изображения, способ декодирования сигнала изображения, устройство кодирования сигнала изображения, способ кодирования изображения и программа
EP1161097B1 (en) MPEG decoder
US7227589B1 (en) Method and apparatus for video decoding on a multiprocessor system
KR20010095106A (ko) 화상 인코딩 장치 및 방법, 비디오 카메라, 화상 기록장치, 및 화상 전송 장치
EP2077670A1 (en) Transcoder, transcoding method, decoder, and decoding method
JP4906197B2 (ja) 復号装置および方法、並びに記録媒体
KR20070011340A (ko) 입체적 3d-비디오 이미지 디지털 코딩 시스템 및 방법
JP2002502159A (ja) 高性能テレビジョン信号の符号化および復号化の方法と装置
JP5228077B2 (ja) 立体3dビデオイメージディジタルデコーディングのシステムおよび方法
JP5227439B2 (ja) 立体3dビデオイメージディジタルコーディングのシステムおよび方法
JPH10145788A (ja) 映像再生装置
JP2003179826A (ja) 画像再生表示装置
KR20070011341A (ko) 입체적 3d-비디오 이미지 디지털 디코딩 시스템 및 방법
CN101917616A (zh) 用于数字编码3d立体视频图像的方法和系统
MXPA06009733A (es) Metodo y sistema de codificacion digital de imagenes de video 3d estereoscopicas.
LGGGGGG C ZIT źd d': http:% pic. gc. ca-Ottawa-Hull KlA 0C9-http://cipo. gc. ca () PI
US20050201458A1 (en) Image encoding system and method
MXPA06009734A (es) Metodo y sistema de decodificacion digital de imagenes de video 3d estereoscopicas.

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150827

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160831

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180903

Year of fee payment: 7