KR101858212B1 - 역 텔레시네 필터 - Google Patents

역 텔레시네 필터 Download PDF

Info

Publication number
KR101858212B1
KR101858212B1 KR1020167023349A KR20167023349A KR101858212B1 KR 101858212 B1 KR101858212 B1 KR 101858212B1 KR 1020167023349 A KR1020167023349 A KR 1020167023349A KR 20167023349 A KR20167023349 A KR 20167023349A KR 101858212 B1 KR101858212 B1 KR 101858212B1
Authority
KR
South Korea
Prior art keywords
fields
field
delete delete
pair
video
Prior art date
Application number
KR1020167023349A
Other languages
English (en)
Other versions
KR20160114121A (ko
Inventor
유리 레즈니크
에두아르도 아스분
Original Assignee
인터디지탈 패튼 홀딩스, 인크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터디지탈 패튼 홀딩스, 인크 filed Critical 인터디지탈 패튼 홀딩스, 인크
Publication of KR20160114121A publication Critical patent/KR20160114121A/ko
Application granted granted Critical
Publication of KR101858212B1 publication Critical patent/KR101858212B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0112Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards corresponding to a cinematograph film standard
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0112Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards corresponding to a cinematograph film standard
    • H04N7/0115Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards corresponding to a cinematograph film standard with details on the detection of a particular field or frame pattern in the incoming video signal, e.g. 3:2 pull-down pattern

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

오리지널 프로그레시브(progressive) 비디오의 정확한 재구축을 산출시키기 위해 인코딩된 비디오 시퀀스의 역 텔레시네 변환을 수행하기 위한 시스템들, 방법들, 및 수단들이 개시된다. 비디오 필터링 방법은 일련의 필드들을 포함한 복수의 프레임들을 수신하는 단계 - 상기 일련의 필드들의 적어도 하나의 필드는 과잉(superfluous) 필드임 -; 각각의 필드를 적어도 하나의 시간적으로 인접해 있는 필드(1002, 1004, 1006, 1008)에 비교하여 서로 최대로 유사한 필드들의 쌍을 결정하는 단계 - 이러한 필드들의 쌍은 과잉 필드를 포함함 -; 필드들의 쌍 중 어느 것이 각각의 시간적으로 인접해 있는 필드(필드들의 쌍의 나머지 다른쪽 필드는 아님)와 최소로 유사한지를 결정하는 단계; 해당 필드를 과잉 필드로서 지정하는 단계; 및 결정된 과잉 필드 없이 복수의 프레임들을 재구축하는 단계를 포함할 수 있다.

Description

역 텔레시네 필터{INVERSE TELECINE FILTER}
본 출원은 2014년 2월 10일에 출원된 미국 가특허 출원 제61/938,100호의 우선권을 청구하며, 이 가특허 출원의 내용은 참조로서 본 명세서내에 병합된다.
텔레시네는 필름을 비디오로 변환시키기 위해 이용되는 기술을 말한다. 필름 제재는 초당 24개 프레임(24 fps)으로 기록될 수 있는 반면에, NTSC(National Television System Committee) 비디오는 초당 59.94 Hz 수직 스캐닝 주파수 또는 59.94개 필드(field)들로 기록될 수 있고, 인터레이싱된 필드(interlaced field)의 29.97 Hz 프레임율로 디스플레이될 수 있다.
비디오를 필터링하기 위한 시스템, 방법, 및 수단이 개시된다. 복수의 프레임들이 복수의 필드들로 변환될 수 있다. 필드는 짝수 패리티(even parity)를 가질 수 있다. 필드는 홀수 패리티(odd parity)를 가질 수 있다. 일련의 필드들은 적어도 하나의 과잉(superfluous) 필드를 포함할 수 있다(예컨대, 일련의 짝수 패리티 필드들은 적어도 하나의 과잉 필드를 포함할 수 있고, 일련의 홀수 패리티 필드들은 적어도 하나의 과잉 필드를 포함할 수 있다). 각각의 필드를 (동일 패리티에 있거나 또는 반대 패리티에 있는) 적어도 하나의 시간적으로(temporally) 인접해 있는 필드에 비교하는 것은 서로가 최대로 유사한 필드들의 쌍을 결정할 수 있다. 이러한 필드들의 쌍은 과잉 필드를 포함할 수 있다. 과잉 필드는 각각의 시간적으로 인접해 있는 필드(예컨대, 필드들의 쌍의 다른쪽 필드가 아닌 필드, 동일 패리티의 시간적으로 인접해 있는 필드일 수 있음)와 최소로 유사한 필드들의 쌍의 필드일 수 있다. 과잉 필드는 과잉 필드로서 지정될 수 있다. 복수의 프레임들이 (예컨대, 결정된 과잉 필드 없이 복수의 필드들로부터) 재구축될 수 있다.
비디오 필터링을 포함한 방법, 서버, 필터, 및 디스플레이는 복수의 필드들을 포함한 비디오 시퀀스(예컨대, 인코딩된 비디오 시퀀스)를 수신하고 디코딩하는 것을 포함할 수 있다. 복수의 필드들의 필드는 짝수 패리티 필드와 홀수 패리티 필드 중 하나일 수 있다. 복수의 필드들의 필드는 과잉 필드(예컨대, 텔레시네의 결과로서의 반복 필드 또는 용장성(redundant) 필드)를 포함할 수 있다. 각각의 필드를 동일 패리티의 적어도 하나의 시간적으로 인접해 있는 필드에 비교하는 것은 서로 최대로 유사한 필드들의 쌍을 결정할 수 있다. 필드들의 쌍은 과잉 필드를 포함한다(예컨대, 필드 쌍 내의 필드들 중 하나의 필드는 과잉 필드이다). 필드들의 쌍 중 어느 것이 과잉 필드인지는, 필드들의 쌍 중 어느 것이 (예컨대, 동일 패리티의) 각각의 시간적으로 인접해 있는 필드(필드들의 쌍의 나머지 다른쪽 필드는 아님)와 최소로 유사한지를 결정함으로써 결정될 수 있다. 비디오 시퀀스는 결정된 과잉 필드없이 재구축될 수 있다. 비디오 시퀀스는 결정된 과잉 필드없이 재인코딩될 수 있다.
도 1a는 하나 이상의 개시된 실시예들이 구현될 수 있는 예시적인 통신 시스템의 시스템도이다.
도 1b는 도 1a에서 도시된 통신 시스템내에서 이용될 수 있는 예시적인 무선 송수신 유닛(WTRU)의 시스템도이다.
도 1c는 도 1a에서 도시된 통신 시스템 내에서 이용될 수 있는 예시적인 코어 네트워크와 예시적인 무선 액세스 네트워크의 시스템도이다.
도 1d는 도 1a에서 도시된 통신 시스템 내에서 이용될 수 있는 다른 예시적인 코어 네트워크 및 다른 예시적인 무선 액세스 네트워크의 시스템도이다.
도 1e는 도 1a에서 도시된 통신 시스템 내에서 이용될 수 있는 다른 예시적인 코어 네트워크 및 다른 예시적인 무선 액세스 네트워크의 시스템도이다.
도 2는 인터레이싱된 비디오(예컨대, 필드들)와 필름(예컨대, 프레임)간의 예시적인 관계의 도면이다.
도 3은 2:3 풀다운(pulldown)의 예시의 도면이다.
도 4는 2:3 풀다운의 예시의 도면이다.
도 5는 2:3 풀다운의 예시의 도면이다.
도 6은 필드 제거에 의한 역 텔레시네의 예시의 도면이다.
도 7은 필드 평균화를 이용한 역 텔레시네의 예시의 도면이다.
도 8은 시각적 아티팩트(artifact)들을 재구축된 필드들에 도입시키는 예시적인 비디오 인코딩 및 디코딩 프로세스의 도면이다.
도 9는 2:3 풀다운 패턴을 식별하는 방법의 예시의 도면이다.
도 10은 반복 필드들 중 어느 필드가 보유될 수 있는지를 결정하는 방법의 예시의 도면이다.
도 11은 종래 기술의 역 텔레시네, 여기서 설명된 역 텔레시네, 및 사후 필터링(fc = 0.5)을 갖는 것으로서 여기서 설명된 역 텔레시네의 예시의 도면이다.
도 12는 종래 기술의 역 텔레시네, 여기서 설명된 역 텔레시네, 및 사후 필터링(fc = 0.5)을 갖는 것으로서 여기서 설명된 역 텔레시네의 예시의 도면이다.
도 13은 종래 기술의 역 텔레시네, 여기서 설명된 역 텔레시네, 및 사후 필터링(fc = 0.5)을 갖는 것으로서 여기서 설명된 역 텔레시네의 예시의 도면이다.
이제부터는 다양한 도면들을 참조하여 예시적인 실시예들의 상세한 설명을 기술할 것이다. 본 설명은 가능할 수 있는 구현예들의 상세한 예시를 제공하지만, 본 상세한 설명은 예시에 불과할 뿐이지, 본 응용의 범위를 어떠한 식으로든지 한정시키려고자 한 것은 아님을 유념해야 한다.
도 1a는 하나 이상의 개시된 실시예들이 구현될 수 있는 예시적인 통신 시스템(100)의 도면이다. 통신 시스템(100)은 음성, 데이터, 비디오, 메시징, 브로드캐스트 등과 같은 콘텐츠를 다중 무선 사용자들에게 제공하는 다중 액세스 시스템일 수 있다. 통신 시스템(100)은 다중 무선 사용자들이 무선 대역폭을 비롯한 시스템 자원들의 공유를 통해 이러한 콘텐츠에 액세스할 수 있도록 해줄 수 있다. 예를 들어, 통신 시스템(100)은 코드 분할 다중 액세스(code division multiple access; CDMA), 시분할 다중 액세스(time division multiple access; TDMA), 주파수 분할 다중 액세스(frequency division multiple access; FDMA), 직교 FDMA(Orthogonal FDMA; OFDMA), 단일 캐리어 FDMA(Single-Carrier FDMA; SC-FDMA) 등과 같은 하나 이상의 채널 액세스 방법들을 이용할 수 있다.
도 1a에서 도시된 바와 같이, 통신 시스템(100)은 무선 송수신 유닛(WTRU)들(102a, 102b, 102c 및/또는 102d)(이것들을 WTRU(102)라고 통칭하거나 또는 총칭한다), 무선 액세스 네트워크(radio access network; RAN)(103/104/105), 코어 네트워크(106/107/109), 공중 전화 교환망(public switched telephone network; PSTN)(108), 인터넷(110), 및 기타 네트워크들(112)을 포함할 수 있지만, 개시된 실시예들은 임의의 갯수의 WTRU, 기지국, 네트워크, 및/또는 네트워크 엘리먼트를 구상할 수 있다는 것을 알 것이다. WTRU들(102a, 102b, 102c, 102d) 각각은 무선 환경에서 동작하거나 및/또는 통신하도록 구성된 임의의 유형의 디바이스일 수 있다. 예로서, WTRU들(102a, 102b, 102c, 102d)은 무선 신호들을 송신하거나 및/또는 수신하도록 구성될 수 있으며, 사용자 장비(UE), 이동국, 고정 가입자 유닛 또는 이동 가입자 유닛, 페이저, 셀룰러 전화기, 개인 휴대 정보 단말기(PDA), 스마트폰, 랩탑, 넷북, 개인 컴퓨터, 무선 센서, 가전 전자제품 등을 포함할 수 있다.
통신 시스템(100)은 또한 기지국(114a)과 기지국(114b)을 포함할 수 있다. 기지국들(114a, 114b) 각각은 코어 네트워크(106/107/109), 인터넷(110), 및/또는 네트워크(112)와 같은, 하나 이상의 통신 네트워크들에 대한 액세스를 용이하게 해주기 위해 WTRU들(102a, 102b, 102c, 102d) 중 적어도 하나의 WTRU와 무선방식으로 인터페이싱하도록 구성된 임의의 유형의 디바이스일 수 있다. 예로서, 기지국들(114a, 114b)은 기지국 트랜스시버(base transceiver station; BTS), 노드 B, e노드 B, 홈 노드 B, 홈 e노드 B, 싸이트 제어기, 액세스 포인트(access point; AP), 무선 라우터 등일 수 있다. 기지국들(114a, 114b)은 각각 단일 엘리먼트로서 도시되었지만, 기지국들(114a, 114b)은 임의의 개수의 상호연결된 기지국들 및/또는 네트워크 엘리먼트들을 포함할 수 있다는 것을 이해할 것이다.
기지국(114a)은 기지국 제어기(base station controller; BSC), 무선 네트워크 제어기(radio network controller; RNC), 중계 노드 등과 같은, 네트워크 엘리먼트들 및/또는 다른 기지국들(미도시)을 또한 포함할 수 있는 RAN(103/104/105)의 일부일 수 있다. 기지국(114a) 및/또는 기지국(114b)은 셀(미도시)이라고 칭해질 수 있는 특정한 지리학적 영역 내에서 무선 신호들을 송신 및/또는 수신하도록 구성될 수 있다. 셀은 셀 섹터들로 더 분할될 수 있다. 예를 들어, 기지국(114a)과 연관된 셀은 세 개의 섹터들로 분할될 수 있다. 따라서, 하나의 실시예에서, 기지국(114a)은 세 개의 트랜스시버들, 예컨대, 셀의 각 섹터 마다 하나씩의 트랜스시버들을 포함할 수 있다. 또 다른 실시예에서, 기지국(114a)은 다중 입력 다중 출력(multiple-input multiple output; MIMO) 기술을 이용할 수 있고, 이에 따라, 셀의 각 섹터 마다 다수의 트랜스시버들을 이용할 수 있다.
기지국들(114a, 114b)은 임의의 적절한 무선 통신 링크(예컨대, 무선 주파수(radio frequency; RF), 마이크로파, 적외선(infrared; IR), 자외선(ultraviolet; UV), 가시광 등)일 수 있는 무선 인터페이스(115/116/117)를 통해 하나 이상의 WTRU들(102a, 102b, 102c, 102d)과 통신할 수 있다. 무선 인터페이스(115/116/117)는 임의의 적절한 무선 액세스 기술(radio access technology; RAT)을 이용하여 구축될 수 있다.
보다 구체적으로, 위에서 언급한 바와 같이, 통신 시스템(100)은 다중 액세스 시스템일 수 있으며, CDMA, TDMA, FDMA, OFDMA, SC-FDMA, 등과 같은 하나 이상의 채널 액세스 방식들을 이용할 수 있다. 예를 들어, RAN(103/104/105)에서의 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 광대역 CDMA(wideband CDMA; WCDMA)를 이용하여 무선 인터페이스(115/116/117)를 구축할 수 있는 유니버셜 이동 원격통신 시스템(Universal Mobile Telecommunications System; UMTS) 지상 무선 액세스(Terrestrial Radio Access)(UTRA)와 같은 무선 기술을 구현할 수 있다. WCDMA는 고속 패킷 액세스(High-Speed Packet Access; HSPA) 및/또는 진화형 HSPA(Evolved HSPA; HSPA+)와 같은 통신 프로토콜들을 포함할 수 있다. HSPA는 고속 다운링크 패킷 액세스(High Speed Downlink Packet Access; HSDPA) 및/또는 고속 업링크 패킷 액세스(High Speed Uplink Packet Access; HSUPA)를 포함할 수 있다.
다른 실시예에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 롱 텀 에볼루션(Long Term Evolution; LTE) 및/또는 LTE 어드밴스드(LTE-Advanced; LTE-A)를 이용하여 무선 인터페이스(115/116/117)를 구축할 수 있는 진화된 UMTS 지상 무선 액세스(Evolved UMTS Terrestrial Radio Access; E-UTRA)와 같은 무선 기술을 구현할 수 있다.
다른 실시예들에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 IEEE 802.16(예컨대, WiMAX(Worldwide Interoperability for Microwave Access)), CDMA2000, CDMA2000 1X, CDMA2000 EV-DO, IS-2000(Interim Standard 2000), IS-95(Interim Standard 95), IS-856(Interim Standard 856), GSM(Global System for Mobile communications), EDGE(Enhanced Data rates for GSM Evolution), GSM EDGE(GERAN), 등과 같은 무선 기술들을 구현할 수 있다.
도 1a에서의 기지국(114b)은 예컨대 무선 라우터, 홈 노드 B, 홈 e노드 B, 또는 액세스 포인트일 수 있으며, 회사, 가정, 차량, 캠퍼스 등의 장소와 같은 국지적 영역에서의 무선 연결을 용이하게 하기 위해 임의의 적절한 RAT을 이용할 수 있다. 하나의 실시예에서, 기지국(114b) 및 WTRU들(102c, 102d)은 IEEE 802.11와 같은 무선 기술을 구현하여 무선 근거리 네트워크(wireless local area network; WLAN)를 구축할 수 있다. 또 다른 실시예에서, 기지국(114b) 및 WTRU들(102c, 102d)은 IEEE 802.15와 같은 무선 기술을 구현하여 무선 개인 영역 네트워크(wireless personal area network; WPAN)를 구축할 수 있다. 또 다른 실시예에서, 기지국(114b) 및 WTRU들(102c, 102d)은 셀룰러 기반 RAT(예컨대, WCDMA, CDMA2000, GSM, LTE, LTE-A 등)을 이용하여 피코셀 또는 펨토셀을 구축할 수 있다. 도 1a에서 도시된 바와 같이, 기지국(114b)은 인터넷(110)에 대한 직접 연결을 가질 수 있다. 이에 따라, 기지국(114b)은 코어 네트워크(106/107/109)를 통해 인터넷(110)에 액세스할 필요가 없을 수 있다.
RAN(103/104/105)은 코어 네트워크(106/107/109)와 통신할 수 있으며, 코어 네트워크(106/107/109)는 음성, 데이터, 애플리케이션, 및/또는 VoIP(voice over internet protocol) 서비스들을 WTRU들(102a, 102b, 102c, 102d) 중 하나 이상의 WTRU에게 제공하도록 구성된 임의의 유형의 네트워크일 수 있다. 예를 들어, 코어 네트워크(106/107/109)는 콜 제어, 빌링 서비스, 이동 위치 기반 서비스, 선납제 콜링, 인터넷 접속, 비디오 배포 등을 제공할 수 있으며, 및/또는 사용자 인증과 같은 상위레벨 보안 기능을 수행할 수 있다. 도 1a에서는 도시되지 않았지만, RAN(103/104/105) 및/또는 코어 네트워크(106/107/109)는 RAN(103/104/105)과 동일한 RAT을 이용하거나 또는 상이한 RAT을 이용하는 다른 RAN들과 직접적 또는 간접적으로 통신할 수 있다는 것을 이해할 것이다. 예를 들어, 코어 네트워크(106/107/109)는, E-UTRA 무선 기술을 이용하는 중일 수 있는 RAN(103/104/105)에 접속하는 것에 더하여, 또한 GSM 무선 기술을 이용하는 또 다른 RAN(미도시)과 통신할 수도 있다.
코어 네트워크(106/107/109)는 또한 WTRU들(102a, 102b, 102c, 102d)이 PSTN(108), 인터넷(110), 및/또는 다른 네트워크들(112)에 액세스하기 위한 게이트웨이로서 역할을 할 수 있다. PSTN(108)은 POTS(plain old telephone service)를 제공하는 회선 교환형 전화망을 포함할 수 있다. 인터넷(110)은 송신 제어 프로토콜(transmission control protocol; TCP)/인터넷 프로토콜(internet protocol; IP) 슈트에서의, TCP, 사용자 데이터그램 프로토콜(user datagram protocol; UDP) 및 IP와 같은, 일반적인 통신 프로토콜들을 이용하는 상호연결된 컴퓨터 네트워크 및 디바이스의 글로벌 시스템을 포함할 수 있다. 네트워크(112)는 다른 서비스 제공자들에 의해 소유되거나 및/또는 동작되는 유선 또는 무선 통신 네트워크들을 포함할 수 있다. 예를 들어, 네트워크(112)는 RAN(103/104/105)과 동일한 RAT 또는 상이한 RAT을 이용할 수 있는, 하나 이상의 RAN들에 접속된 또 다른 코어 네트워크를 포함할 수 있다.
통신 시스템(100) 내의 WTRU들(102a, 102b, 102c, 102d) 중 몇몇 또는 그 전부는 멀티 모드 능력들을 포함할 수 있는데, 즉 WTRU들(102a, 102b, 102c, 102d)은 상이한 무선 링크들을 통한 상이한 무선 네트워크들과의 통신을 위한 다중 트랜스시버들을 포함할 수 있다. 예를 들어, 도 1a에서 도시된 WTRU(102c)는 셀룰러 기반 무선 기술을 이용할 수 있는 기지국(114a)과 통신하며, IEEE 802 무선 기술을 이용할 수 있는 기지국(114b)과 통신하도록 구성될 수 있다.
도 1b는 예시적인 WTRU(102)의 시스템도이다. 도 1b에서 도시된 바와 같이, WTRU(102)는 프로세서(118), 트랜스시버(120), 송신/수신 엘리먼트(122), 스피커/마이크로폰(124), 키패드(126), 디스플레이/터치패드(128), 탈착불가능형 메모리(130), 탈착가능형 메모리(132), 전원(134), 글로벌 위치확인 시스템(global positioning system; GPS) 칩셋(136), 및 다른 주변장치들(138)을 포함할 수 있다. WTRU(102)는 실시예와 일관성을 유지하면서 전술한 엘리먼트들의 임의의 서브조합을 포함할 수 있다는 것을 이해할 것이다. 또한, 실시예들은 기지국들(114a, 114b), 및/또는 비제한적인 예시로서, 여러가지 중에서도, 기지국 트랜스시버(BTS), 노드 B, 싸이트 제어기, 액세스 포인트(AP), 홈 노드 B, 진화형 홈 노드 B(eNodeB), 홈 진화형 노드 B(HeNB), 홈 진화형 노드 B 게이트웨이, 및 프록시 노드와 같이, 기지국들(114a, 114b)을 나타낼 수 있는 노드들이 도 1b에서 도시되고 여기서 설명된 엘리먼트들의 일부분 또는 그 전부를 포함할 수 있다는 것을 구상할 수 있다.
프로세서(118)는 범용 프로세서, 특수 목적용 프로세서, 통상의 프로세서, 디지털 신호 프로세서(digital signal processor; DSP), 복수개의 마이크로프로세서, DSP 코어와 연계된 하나 이상의 마이크로프로세서, 제어기, 마이크로제어기, 응용 특정 집적 회로(Application Specific Integrated Circuit; ASIC), 필드 프로그램가능 게이트 어레이(Field Programmable Gate Array; FPGA) 회로, 임의의 다른 유형의 집적 회로(integrated circuit; IC), 상태 머신 등일 수 있다. 프로세서(118)는 신호 코딩, 데이터 프로세싱, 전력 제어, 입력/출력 프로세싱, 및/또는 WTRU(102)가 무선 환경에서 동작할 수 있도록 해주는 임의의 다른 기능을 수행할 수 있다. 프로세서(118)는 송신/수신 엘리먼트(122)에 결합될 수 있는 트랜스시버(120)에 결합될 수 있다. 도 1b는 프로세서(118)와 트랜스시버(120)를 개별적인 컴포넌트들로서 도시하지만, 프로세서(118)와 트랜스시버(120)는 전자 패키지 또는 칩내에서 합체될 수 있다는 것을 이해할 것이다.
송신/수신 엘리먼트(122)는 무선 인터페이스(115/116/117)를 통해 기지국(예컨대, 기지국(114a))에 신호를 송신하거나, 또는 기지국으로부터 신호를 수신하도록 구성될 수 있다. 예를 들어, 하나의 실시예에서, 송신/수신 엘리먼트(122)는 RF 신호를 송신 및/또는 수신하도록 구성된 안테나일 수 있다. 또 다른 실시예에서, 송신/수신 엘리먼트(122)는 예컨대 IR, UV, 또는 가시광 신호를 송신 및/또는 수신하도록 구성된 발광기/검출기일 수 있다. 또 다른 실시예에서, 송신/수신 엘리먼트(122)는 RF와 광 신호 모두를 송신 및 수신하도록 구성될 수 있다. 송신/수신 엘리먼트(122)는 임의의 조합의 무선 신호들을 송신 및/또는 수신하도록 구성될 수 있다는 것을 알 것이다.
또한, 도 1b에서는 송신/수신 엘리먼트(122)가 단일 엘리먼트로서 도시되지만, WTRU(102)는 임의의 갯수의 송신/수신 엘리먼트(122)를 포함할 수 있다. 보다 구체적으로, WTRU(102)는 MIMO 기술을 이용할 수 있다. 따라서, 하나의 실시예에서, WTRU(102)는 무선 인터페이스(115/116/117)를 통해 무선 신호를 송신 및 수신하기 위한 두 개 이상의 송신/수신 엘리먼트(122)(예컨대, 다중 안테나)를 포함할 수 있다.
트랜스시버(120)는 송신/수신 엘리먼트(122)에 의해 송신될 신호를 변조시키고 송신/수신 엘리먼트(122)에 의해 수신되는 신호를 복조시키도록 구성될 수 있다. 상기와 같이, WTRU(102)는 멀티 모드 능력들을 가질 수 있다. 따라서, 트랜스시버(120)는 WTRU(102)가 예컨대 UTRA 및 IEEE 802.11와 같은, 다중 RAT들을 통해 통신할 수 있도록 해주기 위한 다중 트랜스시버들을 포함할 수 있다.
WTRU(102)의 프로세서(118)는 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)(예컨대, 액정 디스플레이(liquid crystal display; LCD) 디스플레이 유닛 또는 유기 발광 다이오드(organic light emitting diode; OLED) 디스플레이 유닛)에 결합될 수 있고, 이들로부터 사용자 입력 데이터를 수신할 수 있다. 프로세서(118)는 또한 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)에 사용자 데이터를 출력할 수 있다. 또한, 프로세서(118)는 탈착불가능형 메모리(130) 및/또는 탈착가능형 메모리(132)와 같은, 임의의 유형의 적절한 메모리로부터의 정보에 액세스하고, 이러한 메모리에 데이터를 저장할 수 있다. 탈착불가능형 메모리(130)는 랜덤 액세스 메모리(random-access memory; RAM), 판독 전용 메모리(read-only memory; ROM), 하드 디스크, 또는 임의의 다른 유형의 메모리 저장 디바이스를 포함할 수 있다. 탈착식 메모리(132)는 가입자 식별 모듈 (subscriber identity module; SIM) 카드, 메모리 스틱, 보안 디지털(secure digital; SD) 메모리 카드 등을 포함할 수 있다. 다른 실시예들에서, 프로세서(118)는 서버 또는 가정 컴퓨터(미도시)상에서와 같이, WTRU(102)상에서 물리적으로 위치하지 않는 메모리로부터의 정보에 액세스하고, 이러한 메모리에 데이터를 저장할 수 있다.
프로세서(118)는 전원(134)으로부터 전력을 수신할 수 있고, WTRU(102) 내의 다른 컴포넌트들에게 이 전력을 분배하고 및/또는 제어하도록 구성될 수 있다. 전원(134)은 WTRU(102)에게 전력을 공급해주기 위한 임의의 적절한 디바이스일 수 있다. 예를 들어, 전원(134)은 하나 이상의 건식 셀 배터리들(예컨대, 니켈 카드뮴(NiCd), 니켈 아연(NiZn), 니켈 금속 하이드라이드(NiMH), 리튬 이온(Li-ion) 등), 태양 전지, 연료 전지 등을 포함할 수 있다.
프로세서(118)는 또한 GPS 칩셋(136)에 결합될 수 있으며, 이 GPS 칩셋(136)은 WTRU(102)의 현재 위치에 관한 위치 정보(예컨대, 경도 및 위도)를 제공하도록 구성될 수 있다. GPS 칩셋(136)으로부터의 정보에 더하여, 또는 이를 대신하여, WTRU(102)는 무선 인터페이스(115/116/117)를 통해 기지국(예컨대, 기지국들(114a, 114b))으로부터 위치 정보를 수신하고, 및/또는 근처에 있는 두 개 이상의 기지국들로부터 신호들이 수신되는 타이밍에 기초하여 자신의 위치를 결정할 수 있다. WTRU(102)는 실시예와 일관성을 유지하면서 임의의 적절한 위치 결정 방법을 통해 위치 정보를 획득할 수 있는 것을 이해할 것이다.
프로세서(118)는 또한 다른 주변장치들(138)에 결합될 수 있으며, 이 주변장치들(138)은 추가적인 특징들, 기능 및/또는 유선 또는 무선 연결을 제공하는 하나 이상의 소프트웨어 및/또는 하드웨어 모듈들을 포함할 수 있다. 예를 들어, 주변장치들(138)은 가속도계, e콤파스, 위성 트랜스시버, 디지털 카메라(사진 또는 비디오용), 범용 직렬 버스(USB) 포트, 진동 디바이스, 텔레비젼 트랜스시버, 핸즈프리 헤드셋, 블루투스® 모듈, 주파수 변조(FM) 무선 유닛, 디지털 뮤직 플레이어, 미디어 플레이어, 비디오 게임 플레이어 모듈, 인터넷 브라우저 등을 포함할 수 있다.
도 1c는 실시예에 따른 RAN(103) 및 코어 네트워크(106)의 시스템도이다. 상기와 같이, RAN(103)은 무선 인터페이스(115)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 UTRA 무선 기술을 이용할 수 있다. RAN(103)은 또한 코어 네트워크(106)와 통신할 수 있다. 도 1c에서 도시된 바와 같이, RAN(103)은 무선 인터페이스(115)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위한 하나 이상의 트랜스시버들을 각각 포함할 수 있는 노드 B들(140a, 140b, 140c)을 포함할 수 있다. 노드 B들(140a, 140b, 140c)은 각각 RAN(103) 내의 특정 셀(미도시)과 연계될 수 있다. RAN(103)은 또한 RNC들(142a, 142b)을 포함할 수 있다. RAN(103)은 실시예와 일관성을 유지하면서 임의의 갯수의 노드 B들을 포함할 수 있다는 것을 이해할 것이다.
도 1c에서 도시된 바와 같이, 노드 B들(140a, 140b)은 RNC(142a)와 통신할 수 있다. 추가적으로, 노드 B(140c)는 RNC(142b)와 통신할 수 있다. 노드 B들(140a, 140b, 140c)은 Iub 인터페이스를 통해 각각의 RNC들(142a, 142b)과 통신할 수 있다. RNC들(142a, 142b)은 Iur 인터페이스를 통해 서로 통신할 수 있다. RNC들(142a, 142b) 각각은 자신과 접속되어 있는 각각의 노드 B들(140a, 140b, 140c)을 제어하도록 구성될 수 있다. 또한, RNC들(142a, 142b) 각각은 외부 루프 전력 제어, 로드 제어, 승인 제어, 패킷 스케쥴링, 핸드오버 제어, 매크로다이버시티, 보안 기능, 데이터 암호화 등과 같은, 다른 기능을 수행하거나 또는 지원하도록 구성될 수 있다.
도 1c에서 도시된 코어 네트워크(106)는 미디어 게이트웨이(media gateway; MGW)(144), 이동 스위칭 센터(mobile switching center; MSC)(146), 서빙 GPRS 지원 노드(serving GPRS support node; SGSN)(148), 및/또는 게이트웨이 GPRS 지원 노드(gateway GPRS support node; GGSN)(150)를 포함할 수 있다. 전술한 엘리먼트들 각각은 코어 네트워크(106)의 일부로서 도시되었지만, 이들 엘리먼트들 중 임의의 엘리먼트들은 코어 네트워크 오퍼레이터 이외의 다른 엔티티에 의해 소유되고 및/또는 동작될 수 있다는 것을 알 것이다.
RAN(103)에서의 RNC(142a)는 IuCS 인터페이스를 통해 코어 네트워크(106)에서의 MSC(146)에 접속될 수 있다. MSC(146)는 MGW(144)에 접속될 수 있다. MSC(146)와 MGW(144)는 WTRU들(102a, 102b, 102c) 및 전통적인 지상선 통신 디바이스들간의 통신을 원활하게 해주기 위해 WTRU들(102a, 102b, 102c)에게 PSTN(108)과 같은 회로 교환망에 대한 액세스를 제공할 수 있다.
RAN(103)에서의 RNC(142a)는 또한 IuPS 인터페이스를 통해 코어 네트워크(106)에서의 SGSN(148)에 접속될 수 있다. SGSN(148)은 GGSN(150)에 접속될 수 있다. SGSN(148)과 GGSN(150)은 WTRU들(102a, 102b, 102c)과 IP 인에이블드 디바이스들간의 통신을 원활하게 해주기 위해 WTRU들(102a, 102b, 102c)에게 인터넷(110)과 같은 패킷 교환망에 대한 액세스를 제공할 수 있다.
상기와 같이, 코어 네트워크(106)는 또한 다른 서비스 제공자들에 의해 소유되고 및/또는 동작되는 다른 유선 또는 무선 네트워크들을 포함할 수 있는 네트워크들(112)에 접속될 수 있다.
도 1d는 실시예에 따른 RAN(104) 및 코어 네트워크(107)의 시스템도이다. 상기와 같이, RAN(104)은 무선 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 E-UTRA 무선 기술을 이용할 수 있다. RAN(104)은 또한 코어 네트워크(107)와 통신할 수 있다.
RAN(104)은 e노드 B들(160a, 160b, 160c)을 포함할 수 있지만, RAN(104)은 실시예와 일관성을 유지하면서 임의의 개수의 e노드 B들을 포함할 수 있다는 것을 이해할 것이다. e노드 B들(160a, 160b, 160c)은 무선 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위한 하나 이상의 트랜스시버들을 각각 포함할 수 있다. 하나의 실시예에서, e노드 B들(160a, 160b, 160c)은 MIMO 기술을 구현할 수 있다. 따라서, 예컨대 e노드 B(160a)는 WTRU(102a)에게 무선 신호를 송신하고, WTRU(102a)로부터 무선 신호를 수신하기 위해 다중 안테나를 이용할 수 있다.
e노드 B들(160a, 160b, 160c) 각각은 특정 셀(미도시)과 연계될 수 있고, 무선 자원 관리 결정, 핸드오버 결정, 업링크 및/또는 다운링크에서의 사용자들의 스케쥴링 등을 처리하도록 구성될 수 있다. 도 1d에서 도시된 바와 같이, e노드 B들(160a, 160b, 160c)은 X2 인터페이스를 통해 서로 통신할 수 있다.
도 1d에서 도시된 코어 네트워크(107)는 이동성 관리 게이트웨이(mobility management gateway; MME)(162), 서빙 게이트웨이(164), 및 패킷 데이터 네트워크(packet data network; PDN) 게이트웨이(166)를 포함할 수 있다. 전술한 엘리먼트들 각각은 코어 네트워크(107)의 일부로서 도시되었지만, 이들 엘리먼트들 중 임의의 엘리먼트들은 코어 네트워크 오퍼레이터 이외의 다른 엔티티에 의해 소유되고 및/또는 동작될 수 있다는 것을 알 것이다.
MME(162)는 S1 인터페이스를 통해 RAN(104)에서의 e노드 B들(160a, 160b, 160c) 각각에 접속될 수 있고, 제어 노드로서 기능을 할 수 있다. 예를 들어, MME(162)는 WTRU들(102a, 102b, 102c)의 사용자들을 인증하는 것, 베어러 활성화/활성화해제, WTRU들(102a, 102b, 102c)의 초기 접속 동안 특정한 서빙 게이트웨이를 선택하는 것 등을 담당할 수 있다. MME(162)는 또한 GSM 또는 WCDMA와 같은 다른 무선 기술들을 이용하는 다른 RAN들(미도시)과 RAN(104)간의 스위칭을 위한 제어 평면 기능을 제공할 수 있다.
서빙 게이트웨이(164)는 S1 인터페이스를 통해 RAN(104)에서의 e노드 B들(160a, 160b, 160c) 각각에 접속될 수 있다. 일반적으로 서빙 게이트웨이(164)는 WTRU들(102a, 102b, 102c)에게/이로부터 사용자 데이터 패킷들을 라우팅 및 발송할 수 있다. 서빙 게이트웨이(164)는 또한 e노드 B간 핸드오버들 동안의 사용자 평면들을 앵커링하는 것, 다운링크 데이터가 WTRU들(102a, 102b, 102c)에 대해 이용가능할 때 페이징을 트리거링하는 것, WTRU들(102a, 102b, 102c)의 컨텍스트들을 관리하고 저장하는 것 등과 같은 다른 기능들을 수행할 수 있다.
서빙 게이트웨이(164)는 또한 PDN 게이트웨이(166)에 연결될 수 있으며, 이 PDN 게이트웨이(166)는 WTRU들(102a, 102b, 102c)과 IP 인에이블드 디바이스들간의 통신을 원활하게 해주기 위해 WTRU들(102a, 102b, 102c)에게 인터넷(110)과 같은 패킷 교환망에 대한 액세스를 제공해줄 수 있다.
코어 네트워크(107)는 다른 네트워크들과의 통신을 원활하게 할 수 있다. 예를 들어, 코어 네트워크(107)는 WTRU들(102a, 102b, 102c)과 종래의 지상선 통신 디바이스들간의 통신을 원활하게 해주기 위해 WTRU들(102a, 102b, 102c)에게 PSTN(108)과 같은 회로 교환망에 대한 액세스를 제공해줄 수 있다. 예를 들어, 코어 네트워크(107)는 코어 네트워크(107)와 PSTN(108)간의 인터페이스로서 역할을 하는 IP 게이트웨이(예컨대, IP 멀티미디어 서브시스템(IP multimedia subsystem; IMS) 서버)를 포함할 수 있거나, 또는 이 IP 게이트웨이와 통신할 수 있다. 또한, 코어 네트워크(107)는 다른 서비스 제공자들에 의해 소유되고 및/또는 동작되는 다른 유선 또는 무선 네트워크들을 포함할 수 있는 네트워크들(112)에 대한 액세스를 WTRU들(102a, 102b, 102c)에게 제공해줄 수 있다.
도 1e는 실시예에 따른 RAN(105) 및 코어 네트워크(109)의 시스템도이다. RAN(105)은 무선 인터페이스(117)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 IEEE 802.16 무선 기술을 이용하는 액세스 서비스 네트워크(access service network; ASN)일 수 있다. 아래에서 보다 자세히 설명하겠지만, WTRU들(102a, 102b, 102c), RAN(105), 및 코어 네트워크(109)의 상이한 기능 엔티티들간의 통신 링크들은 기준점들로서 정의될 수 있다.
도 1e에서 도시된 바와 같이, RAN(105)은 기지국들(180a, 180b, 180c), 및 ASN 게이트웨이(182)를 포함할 수 있지만, RAN(105)은 실시예와 일관성을 유지하면서 임의의 갯수의 기지국들 및 ASN 게이트웨이들을 포함할 수 있다는 것을 이해할 것이다. 기지국들(180a, 180b, 180c)은 각각 RAN(105)에서의 특정 셀(미도시)과 연계될 수 있으며, 이들 각각은 무선 인터페이스(117)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위한 하나 이상의 트랜스시버들을 포함할 수 있다. 하나의 실시예에서, 기지국들(180a, 180b, 180c)은 MIMO 기술을 구현할 수 있다. 따라서, 예컨대 기지국(180a)은 WTRU(102a)에게 무선 신호를 송신하고, WTRU(102a)로부터 무선 신호를 수신하기 위해 다중 안테나를 이용할 수 있다. 기지국들(180a, 180b, 180c)은 또한 핸드오프 트리거링, 터널 구축, 무선 자원 관리, 트래픽 분류, 서비스 품질(quality of service; QoS) 정책 강화 등과 같은, 이동성 관리 기능들을 제공할 수 있다. ASN 게이트웨이(182)는 트래픽 집성점(aggregation point)으로서 기능을 할 수 있고, 페이징, 가입자 프로필의 캐싱(caching), 코어 네트워크(109)로의 라우팅 등을 담당할 수 있다.
WTRU들(102a, 102b, 102c)과 RAN(105) 사이의 무선 인터페이스(117)는 IEEE 802.16 규격을 구현하는 R1 기준점으로서 정의될 수 있다. 또한, WTRU들(102a, 102b, 102c) 각각은 코어 네트워크(109)와의 논리적 인터페이스(미도시)를 구축할 수 있다. WTRU들(102a, 102b, 102c)과 코어 네트워크(109) 사이의 논리적 인터페이스는 R2 기준점으로서 정의될 수 있고, 이것은 인증, 권한부여, IP 호스트 구성 관리, 및/또는 이동성 관리를 위하여 이용될 수 있다.
기지국들(180a, 180b, 180c)들 각각 사이의 통신 링크는 WTRU 핸드오버 및 기지국들간의 데이터의 전송을 원활하게 해주는 프로토콜들을 포함한 R8 기준점으로서 정의될 수 있다. 기지국들(180a, 180b, 180c)과 ASN 게이트웨이(182) 사이의 통신 링크는 R6 기준점으로서 정의될 수 있다. R6 기준점은 각각의 WTRU(102a, 102b, 102c)와 연계된 이동성 이벤트들에 기초하여 이동성 관리를 원활하게 해주기 위한 프로토콜들을 포함할 수 있다.
도 1e에서 도시된 바와 같이, RAN(105)은 코어 네트워크(109)와 접속될 수 있다. RAN(105)과 코어 네트워크(109) 사이의 통신 링크는 예컨대 데이터 전송 및 이동성 관리 능력들을 원활하게 해주기 위한 프로토콜들을 포함한 R3 기준점으로서 정의될 수 있다. 코어 네트워크(109)는 모바일 IP 홈 에이전트(mobile IP home agent; MIP-HA)(184), 인증/권한/계정(authentication, authorization, accounting; AAA) 서버(186), 및 게이트웨이(188)를 포함할 수 있다. 전술한 엘리먼트들 각각은 코어 네트워크(109)의 일부로서 도시되었지만, 이들 엘리먼트들 중 임의의 엘리먼트들은 코어 네트워크 오퍼레이터 이외의 다른 엔티티에 의해 소유되고 및/또는 동작될 수 있다는 것을 알 것이다.
MIP-HA는 IP 어드레스 관리를 담당할 수 있고, WTRU들(102a, 102b, 102c)이 상이한 ASN들 및/또는 상이한 코어 네트워크들간을 로밍할 수 있도록 해줄 수 있다. MIP-HA(184)는 WTRU들(102a, 102b, 102c)과 IP 인에이블드 디바이스들간의 통신을 원활하게 해주기 위해 WTRU들(102a, 102b, 102c)에게 인터넷(110)과 같은 패킷 교환망에 대한 액세스를 제공할 수 있다. AAA 서버(186)는 사용자 인증을 담당할 수 있고 사용자 서비스들을 지원하는 것을 담당할 수 있다. 게이트웨이(188)는 다른 네트워크들과의 상호 연동(interworking)을 원활하게 해줄 수 있다. 예를 들어, 게이트웨이(188)는 WTRU들(102a, 102b, 102c)과 종래의 지상선 통신 디바이스들간의 통신을 원활하게 해주기 위해 WTRU들(102a, 102b, 102c)에게 PSTN(108)과 같은 회로 교환망에 대한 액세스를 제공해줄 수 있다. 또한, 게이트웨이(188)는 다른 서비스 제공자들에 의해 소유되고 및/또는 동작되는 다른 유선 또는 무선 네트워크들을 포함할 수 있는 네트워크들(112)에 대한 액세스를 WTRU들(102a, 102b, 102c)에게 제공해줄 수 있다.
비록 도 1e에서는 도시되지 않았지만, RAN(105)은 다른 ASN들에 접속될 수 있고 코어 네트워크(109)는 다른 코어 네트워크들에 접속될 수 있다는 것을 알 것이다. RAN(105)과 다른 ASN들간의 통신 링크는 R4 기준점으로서 정의될 수 있고, 이 기준점은 RAN(105)과 다른 ASN들간의 WTRU들(102a, 102b, 102c)의 이동성을 조정하기 위한 프로토콜들을 포함할 수 있다. 코어 네트워크(109)와 다른 코어 네트워크들간의 통신 링크는 R5 기준점으로서 정의될 수 있고, 이 기준점은 홈 코어 네트워크들과 방문 코어 네트워크들간의 상호 연동을 원활하게 해주기 위한 프로토콜들을 포함할 수 있다.
여기서 설명된 하나 이상의 실시예들은 비디오 프로세싱 시스템, 비디오 디스플레이 시스템, 및/또는 비디오 압축 시스템에서 이용될 수 있다.
도 2를 참조하면, 역 텔레시네 필터가 제공될 수 있다. 역 텔레시네 필터는 오리지널 프로그레시브(progressive) 비디오의 정확한 재구축을 가능하게 해줄 수 있는, 인코딩된 비디오의 역 텔레시네 변환을 수행하기 위해 이용될 수 있다. 코딩 아티팩트에 의해 덜 영향받을 수 있는 이러한 필드들의 버전들과 더불어, 텔레시네처리된 비디오 내에서의 반복 필드들(예컨대, 반복 쌍의 하나의 필드는 용장성이거나 또는 과잉 필드이다)의 존재가 식별될 수 있다.
도 2는 인터레이싱된 비디오 A0 및 A1(예컨대, 하나 이상의 필드들)와 필름 A(예컨대, 하나 이상의 프레임들)간의 예시적인 관계의 도면(200)이다. 인터레이싱이란 최상단에서부터 바닥까지 순차적으로 번호가 매겨지고 두 개의 세트들, 즉, 짝수번호 라인들(예컨대, 최상단, 짝수, 및/또는 0 필드로서 칭해질 수 있음)과 홀수번호 라인들(예컨대, 바닥, 홀수, 및/또는 1 필드로서 칭해질 수 있음)로 파티션화된 라인들(예컨대, 필름 프레임 내에서의 픽셀들의 행(row)들)을 가리킬 수 있다. 비디오 프레임의 두 개의 필드들은, 예컨대, 도 2에서 도시된 바와 같이, 두 개의 상이한 시간들에서 디스플레이될 수 있다. 도 2에서 도시된 바와 같이, 최상단(예컨대, 짝수) 필드 A0가 바닥(예컨대, 홀수) 필드 A1에 앞서 랜더링될 수 있으나, 이와 반대 순서로 랜더링될 수도 있다. tff(top-field-first) 패턴 및/또는 bff(bottom-field-first) 패턴이 이용될 수 있다.
필름이 비디오 포맷(예컨대, NTSC 비디오)로 이전되면, 텔레시네로서 칭해질 수 있는 변환 기술이 이용될 수 있다. 텔레시네 기술들의 하나 이상의 변형들, 예를 들어, 2:3 풀다운 또는 3:2 풀다운 기술이 이용될 수 있다.
도 3은 2:3 풀다운 기술의 예시의 도면(300)이다. 2:3 풀다운 텔레시네는 필름을 대략 0.1% 만큼 초당 23.976개 프레임(23.976 fps)으로 늦출 수 있다. 2:3 풀다운 기술은 필름의 네 개의 프로그레시브 프레임들(A, B, C, D)을 29.97 Hz의 다섯 개의 인터레이싱된 비디오 프레임들(301~305)로 분배시킬 수 있다. 다섯 개의 인터레이싱된 비디오 프레임들 각각은 두 개의 비디오 필드들(예컨대, 최상단, 짝수, 및/또는 0 필드와, 바닥, 홀수, 및/또는 1 필드)을 포함할 수 있다. 이것은 열 개의 비디오 필드들(예컨대, 짝수 필드 A0, B0, B0, C0, D0와 홀수 필드 A1, B1, C1, D1, D1)을 산출시킬 수 있다. 네 개의 필름 프레임들은 다섯 개의 최상단 필드들과 다섯 개의 바닥 필드들로 파티션화되므로, 필드들 중 하나 이상(예컨대, 두 개)의 필드가 반복될 수 있다. 필드가 반복될 때, 필드 쌍 중의 하나의 필드는 과잉(예컨대, 용장성)이 된다는 것이 이해된다. 예를 들어, 도 3에서는 B0과 D1이 반복될 수 있다. 이러한 경우, 반복 필드(예컨대, 최상단, 짝수, 및/또는 0 필드) 쌍(B0과 B0) 중 하나의 필드는 과잉(예컨대, 용장성)이 된다. 반복 필드(예컨대, 바닥, 홀수, 및/또는 1 필드) 쌍(D1과 D1) 중 하나의 필드는 과잉(예컨대, 용장성)이 된다.
도 4는 2:3 풀다운의 예시의 도면(400)이다. 2:3 풀다운 텔레시네는 필름을 대략 0.1% 만큼 초당 23.976개 프레임(23.976 fps)으로 늦출 수 있다. 2:3 풀다운 기술은 필름의 네 개의 프로그레시브 프레임들(A, B, C, D)을 29.97 Hz의 다섯 개의 인터레이싱된 비디오 프레임들(401~405)로 분배시킬 수 있다. 다섯 개의 인터레이싱된 비디오 프레임들 각각은 두 개의 비디오 필드들(예컨대, 최상단, 짝수, 및/또는 0 필드와, 바닥, 홀수, 및/또는 1 필드)을 포함할 수 있다. 이것은 열 개의 비디오 필드들(예컨대, 짝수 필드 A0, B0, C0, D0, D0와 홀수 필드 A1, B1, B1, C1, D1)을 산출시킬 수 있다. 네 개의 필름 프레임들은 다섯 개의 최상단 필드들과 다섯 개의 바닥 필드들로 파티션화되므로, 필드들 중 하나 이상(예컨대, 두 개)의 필드가 반복될 수 있다. 필드가 반복될 때, 필드 쌍 중의 하나의 필드는 과잉(예컨대, 용장성)이 된다는 것이 이해된다. 예를 들어, 도 4에서는 D0과 B1이 반복될 수 있다. 이러한 경우, 반복 필드(예컨대, 최상단, 짝수, 및/또는 0 필드) 쌍(D0과 D0) 중 하나의 필드는 과잉(예컨대, 용장성)이 된다. 반복 필드(예컨대, 바닥, 홀수, 및/또는 1 필드) 쌍(B1과 B1) 중 하나의 필드는 과잉(예컨대, 용장성)이 된다.
도 5는 2:3 풀다운의 예시의 도면(500)이다. 2:3 풀다운 텔레시네는 필름을 대략 0.1% 만큼 초당 23.976개 프레임(23.976 fps)으로 늦출 수 있다. 2:3 풀다운 기술은 필름의 네 개의 프로그레시브 프레임들(A, B, C, D)을 29.97 Hz의 다섯 개의 인터레이싱된 비디오 프레임들(501~505)로 분배시킬 수 있다. 다섯 개의 인터레이싱된 비디오 프레임들 각각은 두 개의 비디오 필드들(예컨대, 최상단, 짝수, 및/또는 0 필드와, 바닥, 홀수, 및/또는 1 필드)을 포함할 수 있다. 이것은 열 개의 비디오 필드들(예컨대, 짝수 필드 A0, B0, B0, C0, D0와 홀수 필드 A1, B1, C1, C1, D1)을 산출시킬 수 있다. 네 개의 필름 프레임들은 다섯 개의 최상단 필드들과 다섯 개의 바닥 필드들로 파티션화되므로, 필드들 중 하나 이상(예컨대, 두 개)의 필드가 반복될 수 있다. 필드가 반복될 때, 필드 쌍 중의 하나의 필드는 과잉(예컨대, 용장성)이 된다는 것이 이해된다. 예를 들어, 도 5에서는 B0과 C1이 반복될 수 있다. 이러한 경우, 반복 필드(예컨대, 최상단, 짝수, 및/또는 0 필드) 쌍(B0과 B0) 중 하나의 필드는 과잉(예컨대, 용장성)이 된다. 반복 필드(예컨대, 바닥, 홀수, 및/또는 1 필드) 쌍(C1과 C1) 중 하나의 필드는 과잉(예컨대, 용장성)이 된다.
2:3 풀다운을 수행할 때, 혼합 비디오 프레임 또는 더티(dirty) 비디오 프레임이 생성될 수 있다. 혼합 프레임 또는 더티 프레임이란 예컨대, 동일 필름 프레임들 대신에 인접한 필름 프레임들로부터의 필드들을 포함한 비디오 프레임을 가리킬 수 있다. 예를 들어, 도 3의 프레임들(303, 304)은 혼합 프레임 또는 더티 프레임일 수 있다. 도 4의 프레임들(403, 404)은 혼합 프레임 또는 더티 프레임일 수 있다. 도 5의 프레임(503)은 혼합 프레임 또는 더티 프레임일 수 있다.
역 텔레시네 프로세스가 제공될 수 있다. 디코딩된 비디오 시퀀스들에서 텔레시네를 검출하고 제거하는 것은 이점들이 있을 수 있다. 예를 들어, 비인터레이싱(non-interlaced) 디스플레이들(예컨대, 컴퓨터 모니터, 디지털 TV 등)은 보다 높은 품질의 비인터레이싱 콘텐츠를 보여줄 수 있다. 혼합 프레임 또는 더티 프레임을 제거하는 것은 디코딩된 비디오에 적용될 수 있는 비디오 압축 및/또는 프로세싱 기술들(예컨대, 필터링)의 결과들을 개선시킬 수 있다.
반복(예컨대, 용장성 또는 과잉) 필드들의 검색이 수행될 수 있다. 2:3 풀다운 텔레시네 패턴들을 결정하기 위해 인접한 비디오 프레임들로부터의 필드들이 비교될 수 있다. 예를 들어, 이것은 인터레이싱된 비디오의 프레임들을 조사하고 최종 번호의 프레임들(예컨대, 최종 5~10개 프레임들)에서 짝수 필드와 홀수 필드 사이의 쌍별 차이들의 추적을 계속함으로써 순차적으로 행해질 수 있다. 쌍별 차이들이 보통의 프레임별 차이들보다 작은 경우들은 반복적인(예컨대, 용장성 또는 과잉) 필드들인 것으로 의심될 수 있다. 이러한 경우들이 5개 프레임들의 주기성을 갖는 체계적 패턴을 형성하는 경우, 이 경우들은 텔레시네 생성되었다고 결정될 수 있다.
도 6은 필드 제거에 의한 역 텔레시네의 예시의 도면(600)이다. 반복(예컨대, 용장성 또는 과잉) 필드들이 제거될 수 있다. 역 텔레시네 기술은 반복되는(예컨대, 용장성 또는 과잉) 필드들의 제거를 포함할 수 있다. 예를 들어, 필드들(B1', B1")은 반복 필드들인 것으로서 식별될 수 있다. 반복 필드(B1")는 과잉 필드인 것으로서 결정되어 제거될 수 있고, 이에 따라 필드(B1')(602)가 출력 시퀀스(예컨대, 역 텔레시네로부터의 결과)에서 남겨질 수 있다. 예를 들어, 필드들(D0', D0")은 반복 필드들인 것으로서 식별될 수 있다. 반복 필드(D0')는 과잉 필드인 것으로서 결정되어 제거될 수 있고, 이에 따라 필드(D0")(604)가 출력 시퀀스(예컨대, 역 텔레시네로부터의 결과)에서 남겨질 수 있다. 프레임(C0'│C1')은 짝수 및/또는 홀수 필드들을 결합하고, 과잉 필드들, 예를 들어, 필드(B1", D0')을 빼버림으로써 재구축될 수 있다.
도 7은 필드 평균화를 이용한 역 텔레시네의 예시의 도면(700)이다. 필드 평균화가 수행될 수 있다. 하나 이상의 반복 필드들은 평균화될 수 있다. 필드 평균화는 보다 우수한 재구축 품질을 제공할 수 있는데, 그 이유는 예를 들어, 필드들이 인코딩되고 재구축될 수 있고, 필드들은 상이한 재구축 에러들을 포함할 수 있기 때문이다. 필드 평균화는 이러한 재구축 에러들을 감소시킬 수 있다. 예로서, B1'과 B1"은 홀수 필드(예컨대, 바닥 필드 또는 1 필드) 내에서의 반복 필드들일 수 있다. 출력 시퀀스(예컨대, 역 텔레시네로부터의 결과)에서, B1'과 B1" 간의 평균(예컨대, B1* = (B1' + B1")/2)인 필드(B1*)(702)가 제공될 수 있다. D0'과 D0"은 짝수 필드(예컨대, 최상단 필드 또는 0 필드) 내에서의 반복 필드들일 수 있다. 출력 시퀀스(예컨대, 역 텔레시네로부터의 결과)에서, D0'과 D0" 간의 평균(예컨대, D0* = (D0' + D0")/2)인 필드(D0*)(704)가 제공될 수 있다.
도 8은 예시적인 비디오 인코딩 및 디코딩 프로세스의 도면(800)이다. 인코딩과 디코딩은 재구축된 필드들에 시각적 아티팩트(artifact)들을 도입시킬 수 있다. 디코딩된 비디오 스트림은 편집될 수 있고/있거나 삽입된 광고들을 포함할 수 있다(예컨대, 텔레시네 패턴을 변경시킬 수 있다). 디코딩된 비디오 스트림의 재구축된 필드들은 압축(예컨대, 비디오 스트림의 인코딩)으로 인한 코딩 아티팩트들에 의해 영향을 받을 수 있다. 전송 및/또는 저장을 위한 비디오 시퀀스를 압축하기 위해, 시각적으로 중요할 수 있는 정보는 손실될 수 있기 때문에 코딩 아티팩트들이 발생할 수 있다. 압축은 예를 들어, 블로킹(blocking) 및 양자화 노이즈와 같은, 시각적 아티팩트들을 도입시킬 수 있다. 압축의 양에 따라, 아티팩트들이 재구축된 프레임들 내에 도입될 수 있다.
필터, 서버, 및/또는 디스플레이 디바이스는 (예컨대, 프로세서를 통해) 인코딩된 비디오 시퀀스를 수신할 수 있다. 필터, 서버, 및/또는 디스플레이 디바이스는 예를 들어, 여기서 설명된 하나 이상의 기능들을 수행할 수 있는 프로세서를 포함할 수 있다. 필터는 하나 이상의 비디오 필터들(예컨대, 하나 이상의 비디오 사후 필터들)을 포함할 수 있다. 서버는 콘텐츠 서버를 포함할 수 있다. 필터, 서버, 및/또는 디스플레이 디바이스는 (예컨대, 프로세서를 통해) 인코딩된 비디오 시퀀스를 디코딩할 수 있다. 디코딩된 비디오 시퀀스는 복수의 필드들을 포함할 수 있다. 프레임은 짝수 패리티 필드(예컨대, 최상단, 짝수, 및/또는 0 필드)와 홀수 패리티 필드(예컨대, 바닥, 홀수, 및/또는 1 필드)에 의해 나타낼 수 있다. 짝수 필드 및/또는 홀수 필드(디코딩된 비디오 시퀀스)는 일련의 필드들(예컨대, 필드들(A0'~D0") 및/또는 필드들(A1'~D1'))을 포함할 수 있다. 일련의 필드들 내에서의 적어도 하나의 필드는 과잉 필드일 수 있다.
재구축된(에컨대, 디코딩된) 필드들(A0'~D0" 및 A1'~D1')은 인코딩, 전송/저장, 및 디코딩 후 오리지널 필드들(A0~D0 및 A1~D1)과 동일하지 않을 수 있다. 예를 들어, 디코딩된 필드들은 오리지널 비디오 내에서의 대응하는 프레임 데이터와 동일한 것이 아닐 수 있다. 또한, 심지어 재구축된 반복 필드들도 서로 동일하지 않을 수 있다(예컨대, 또한 오리지널 반복 필드들과도 동일하지 않는다). 예를 들어, 반복 필드들(B1', B1")은 서로 동일하지 않거나 또는 오리지널 반복 필드(B1)와 동일하지 않을 수 있다. 반복 필드들(B1', B1")은 다양한 양의 아티팩트들을 포함할 수 있다. 반복 필드들(B1', B1")은 재구축된 프레임에 대해 동일한 레벨들의 품질을 산출시키지 않을 수 있다. 디코딩된 비디오 내에서의 반복 필드들(B1' 및/또는 B1")은 상이한 기준 필드들로부터 예측될 수 있다. 예컨대, B1'은 인트라코딩(intracoded)될 수 있는 반면에, B1"은 모션 예측(motion predicted)될 수 있거나, 또는 이와 반대로 될 수 있다. 결과물은 B1'과 B1"간의 차이가 상당해질 수 있다는 것일 수 있다. 결과적인 비인터레이싱 프레임은 가시적인 시각적 아티팩트들을 나타낼 수 있다.
반복 필드들(D0', D0")은 서로 동일하지 않거나 또는 오리지널 반복 필드(D0)와 동일하지 않을 수 있다. 반복 필드들(D0', D0")은 다양한 양의 아티팩트들을 포함할 수 있다. 반복 필드들(D0', D0")은 재구축된 프레임에 대해 동일한 레벨들의 품질을 산출시키지 않을 수 있다.
오리지널 프로그레시브 비디오의 보다 정확한 재구축을 가능하게 해주는, 인코딩된 비디오의 역 텔레시네 변환이 수행될 수 있다. 비디오 압축의 효과는, 예를 들어, 오리지널 시퀀스와 가장 가깝게 닮은 디코딩된 시퀀스 내에서 반복 필드를 식별함으로써(예컨대, 반복 쌍 내에서 과잉 필드를 식별함으로써) 감소될 수 있다. 역 텔레시네 기술은 풀다운 패턴(예컨대, 2:3 풀다운 패턴)을 식별하고, 반복 필드들을 결정하고/결정하거나 결합하여 재구축된 프레임을 생성함으로써 수행될 수 있다.
풀다운 패턴을 식별하는 것이 제공될 수 있다. 여기서 설명되는 실시예들은, 2:3 풀다운 패턴을 참조하여 설명되지만, 임의의 풀다운 패턴에 적용될 수 있다.
도 9는 2:3 풀다운 패턴을 식별하거나, 또는 서로 최대로 유사한 필드들의 쌍을 결정하는 방법의 예시의 도면(900)이다. 2:3 풀다운 패턴을 식별하기 위해, 최상단 및/또는 바닥 필드들(예컨대, 인접한 최상단 및/또는 바닥 필드들)이 비교될 수 있다. 예를 들어, 최상단 필드 내에서 인접한 필드들(예컨대, 시간적으로 인접한 필드들)을 비교하기 위해 평균 제곱 오차(mean squared error; MSE)가 이용될 수 있다(예컨대, MSE(A0', B0'), MSE(B0', C0'), MSE(C0', D0'), MSE(D0', D0")). 최상단 필드 내에서 최저 MSE(902)를 갖는 필드들의 쌍(예컨대, D0', D0")이 식별될 수 있다. 최저 MSE를 갖는 필드들의 쌍은 반복 필드들을 포함할 수 있다. 최상단 필드 내에서 인접 필드들을 비교하기 위해 다른 방법들이 이용될 수 있다. 바닥 필드 내에서 인접 필드들을 비교하기 위해 MSE가 이용될 수 있다(예컨대, MSE(A1', B1'), MSE(B1', B1"), MSE(B1", C1'), MSE(C1', D1')). 바닥 필드 내에서 최저 MSE(904)를 갖는 필드들의 쌍(예컨대, B1', B1")이 식별될 수 있다. 최저 MSE를 갖는 필드들의 쌍은 반복 필드들을 포함할 수 있다. 바닥 필드 내에서 인접 필드들을 비교하기 위해 다른 방법들이 이용될 수 있다. 예를 들어, 인접 필드들을 비교하여 서로가 최대로 유사한 필드들의 쌍을 결정하기 위해 MSE 이외의 다른 메트릭(metric)들이 이용될 수 있다.
2:3 풀다운 패턴을 결정하기 위해 반복 필드들의 식별이 이용될 수 있다. 2:3 풀다운 패턴은, 식별되면, 일정하게 남아있는 것으로 가정될 수 있다. 풀다운 패턴은 편집, 삽입 등으로 인해 변경되는 것으로 가정될 수 있고, 이로써 MSE는 시퀀스 전반에 걸쳐서 추적될 수 있고, 패턴은 예를 들어, 필요한 바에 따라 조정될 수 있다.
MSE는, 예를 들어, 비디오 프레임들 및/또는 비디오 필드들을 객관적으로 비교하기 위해, 모션 추정과 같은, 비디오 코딩 기술들에서 이용될 수 있다. MSE는 시각적 불일치를 추적할 수 있다. 예를 들어, 낮은 MSE는 프레임들 및/또는 필드들이 잘 매칭되어 있다(이것은, 예를 들어, 오인식의 가능성을 감소시킬 수 있다)는 표시일 수 있다. 풀다운 패턴(예컨대, 2:3 풀다운 패턴)을 식별하기 위해 아래의 수학식(수학식 1)이 이용될 수 있다:
Figure 112016082743094-pct00001
도 10은 반복 필드들 중 어느 반복 필드(예를 들어, 보다 바람직한 반복 필드들)를 선택할 수 있는지를 결정하는 방법의 예시의 도면(1000)이다. 두 개 이상의 (예컨대, 쌍지어진) 반복 필드들을 식별한 후, 왜곡을 최소화하는 반복 필드가 선택될 수 있고, 해당 쌍의 나머지 다른 반복 필드는 과잉인 것으로서 간주될 수 있다.
왜곡을 최소화하는 반복 필드들은 대응하는 오리지널 필드(들)에 대한 예상된 왜곡을 최소화하는 필드들일 수 있다. 예를 들어, 두 개 이상의 반복 필드들이 존재할 수 있기 때문에, 왜곡을 최소화하는 반복 필드가 비교를 위한 기준 필드를 이용하여 결정되고 선택될 수 있다.
일련의 제1 패리티 필드들(예컨대, 최상단, 짝수, 및/또는 0 필드)은 A0', B0', C0', D0', 및 D0"을 포함할 수 있다. D0'과 D0"는 여기서 설명된 반복 쌍으로서 식별될 수 있다. 역 텔레시네에서, D0'과 D0" 중 어느 하나가 선택될 것이고, 나머지 다른 필드는 과잉일 것이다. 선택된 필드(예컨대, 왜곡을 최소화하는 필드)는 D0*으로서 표현될 수 있다.
일련의 제2 패리티 필드들(예컨대, 바닥, 홀수, 및/또는 1 필드)은 A1', B1', B1", C1', 및 D1'을 포함할 수 있다. B1'과 B1"는 여기서 설명된 반복 쌍으로서 식별될 수 있다. 역 텔레시네에서, B1'과 B1" 중 어느 하나가 선택될 것이고, 나머지 다른 필드는 과잉일 것이다. 선택된 필드(예컨대, 왜곡을 최소화하는 필드)는 B1*으로서 표현될 수 있다.
예를 들어, B1'과 B1" 각각이 바닥 필드(예컨대, 동일 패리티) 내의 각자의 인접한(예컨대, 시간적으로 인접한) 필드들과 비교될 수 있다. B1'은 A1'과 비교될 수 있다(참조번호 1002). B1'은 C1'과 비교될 수 있다(참조번호 1004). B1"은 A1'과 비교될 수 있다(참조번호 1006). B1"은 C1'과 비교될 수 있다(참조번호 1008). 과잉 필드는, 필드들의 쌍 중 어느 것이 각자의 각각의 인접 필드(들)에 최소로 유사한지를 결정함으로써 선택될 수 있다. 예를 들어, 과잉 필드를 선택할 때, 인접 필드들간의 유사성은 (예컨대, 비제한적인 예시로서 MSE와 같은 메트릭을 이용하여) 인접 필드와 그 시간적 이웃간의 왜곡을 계산함으로써 결정될 수 있다.
반복 필드들(예컨대, 도 10에서의 B1' 및/또는 B1")에 대한 가능한 기준 필드들(예컨대, 도 10에서의 A1' 및 C1')의 세트가 결정될 수 있다. 가능한 기준 필드들의 세트로부터 최상의 기준 필드가 선택될 수 있다. 예를 들어, 기준 필드는, 반복 필드들에 대한 가능한 기준 필드들 각각의 왜곡(예컨대, MSE)을 계산하고, 왜곡을 최소화하는 기준 필드를 결정함으로써 결정될 수 있다. 예를 들어, 도 10에서는, 반복 필드들 {B1', B1"}에 대한 최상의 기준 필드가 아래의 수학식(수학식 2)을 이용하여 결정될 수 있다:
Figure 112016082743094-pct00002
기준 필드는 오리지널 필드에 대한 대용물로서 이용될 수 있는 필드를 가리킬 수 있다.
예를 들어, 주어진 반복 필드들의 세트에 대해서는, 비교가 동일 패리티의 하나 이상의 가장 가까운(예컨대, 시간적으로 가장 가까운) 필드들에 대해 수행될 수 있다. 예를 들어, 도 10의 반복 필드들(B1', B1")의 경우, 비교는 A1', C1'의 세트로부터 기준 필드를 결정함으로써 수행될 수 있다. 비교는 반대 패리티의 하나 이상의 가장 가까운(예컨대, 시간적으로 가장 가까운) 필드들에 대해 수행될 수 있다. 예를 들어, 도 10의 반복 필드들(B1', B1")의 경우, 비교는 B0', C0', D0'의 세트로부터 기준 필드를 결정함으로써 수행될 수 있다.
비교는 하나 이상의 패리티들의 하나 이상의 필드들에 대한 크기 N의 검색 윈도우에 대해서 수행될 수 있다. 예를 들어, 비교는 검출된 반복 필드들의 두 개의 필드 위치들(N=2)의 거리 내에 있는 필드들(예컨대, 모든 필드들)에 대해 수행될 수 있다. 예를 들어, 도 10의 반복 필드들(B1', B1")의 경우, 비교는 A1', B0', C0', D0', C1'의 세트로부터 기준 필드를 결정함으로써 수행될 수 있다.
최상의 기준 필드에 대한 왜곡을 최소화하는 반복 필드가 결정될 수 있고, 이 필드는 오리지널 프로그레시브 비디오 시퀀스의 재구축에서의 이용을 위해 선택될 수 있다. 예를 들어, 왜곡을 최소화하는 선택된 필드는 아래의 수학식(수학식 3)을 이용하여 결정될 수 있다:
Figure 112016082743094-pct00003
반복 필드는 양자화 값들을 이용하여 선택될 수 있다. 양자화 값들을 결정하기 위해 필드들을 인코딩하는 비디오 비트스트림이 분석될 수 있다. 왜곡을 최소화하는 반복 필드의 선택은 반복 필드들의 (예컨대, 각각의) 매크로블록(macroblock)을 인코딩하기 위해 이용되는 양자화 스케일 파라미터들을 평가함으로써 행해질 수 있다. 보다 낮은 양자화 스케일 파라미터는, 필드들 및/또는 프레임들이 보다 낮은 양자화 에러를 가지며, 이들은 코딩 아티팩트들에 덜 영향을 받고/받거나, 이들은 오리지널과 가장 가깝게 닮았다는 것을 나타낼 수 있다.
양자화 파라미터(quantization parameter; QP)들의 평가가 통계적 분석을 수행함으로써 행해질 수 있다. 주어진 반복 필드(예컨대, 도 10의 B1' 또는 B1")에서의 (예컨대, 각각의) 매크로블록의 경우, DCT 계수들을 인코딩하기 위해 이용되는 양자화 파라미터가 결정될 수 있다. QP는 매크로블록별로 상이할 수 있다. 반복 필드의 하나 이상의 (예컨대, 모든) 매크로블록들에 대한 평균 QP가 결정될 수 있다. 최저 평균 QP를 갖는 반복 필드가 왜곡을 최소화하는 반복 필드로서 선택될 수 있다.
왜곡을 최소화하는 반복 필드는 예측 유형에 기초하여 선택될 수 있다. 반복 필드들이 혼합 프레임 또는 더티 프레임의 일부인 경우, 왜곡을 최소화하는 반복 필드의 선택(예컨대, 과잉 필드의 선택해제)은 필드 상에서 이용된 예측 유형에 기초하여 행해질 수 있다. 예를 들어, 필드 및/또는 프레임은 인트라코딩(intracoded)되거나 또는 비인트라코딩(non-intracoded)(예컨대, 모션 보상)될 수 있다. 비인트라코딩된 필드는, 기준 필드로부터 예측되고 오리지널의 더 가까운 표현일 수 있기 때문에, 더 청정할 수 있다. 예측 유형은 사진(예컨대, 필드) 레벨로 시그널링될 수 있고, 검출된 반복 필드들 각각의 예측 유형에 기초하여 선택된 필드를 결정하기 위해, 인코딩된 비트스트림에서의 이러한 시그널링이 분석될 수 있다.
왜곡을 최소화하는 반복 필드는 매크로블록 레벨 선택 프로세스에 기초하여 결정될 수 있다. 예를 들어, 두 개 이상의 상이한 반복 필드들로부터의 선택된 매크로블록들을 함께 결합함으로써 신규 필드가 구축될 수 있다. 예를 들어, 상이한 반복 필드들의 대응하는 매크로블록들은 서로에 대해서 비교될 수 있고, 오리지널 프로그레시브 비디오 시퀀스와 가장 가깝게 닮은 것으로 예상되는 매크로블록이 신규 필드의 구축에서 이용되기 위해 선택될 수 있다. 그런 후, 신규 필드는 오리지널 프로그레시브 비디오 시퀀스를 재구축하기 위해 이용될 수 있다. 상이한 반복 필드들의 대응하는 매크로블록들간의 비교는, 예를 들어, 여기서 설명된 MSE, QP, 및/또는 예측 유형 비교들을 이용하여 행해질 수 있다.
매크로블록 비교의 예시로서, 반복 필드들의 쌍(B1', B1")이 도 10에서 나타난 바와 같이 검출될 수 있고, 최상의 기준 프레임이 결정될 수 있다. 반복 프레임들을 결정하고, 검출된 반복 프레임들의 세트에 대한 최상의 기준 프레임을 선택하기 위한 기술들이 여기서 설명된다. 그런 후, 오리지널 프로그레시브 비디오 프레임을 재구축하기 위해 이용되는 필드(B1*)는 두 개의 검출된 반복 프레임들로부터의 선택 및 매크로블록 레벨 비교에 의해 구축될 수 있다. 예를 들어, B1*의 각각의 매크로블록 B1*(n)은 아래의 비교(수학식 4)에 따라 B1'으로부터의 대응하는 매크로블록으로서, 또는 B1"으로부터의 대응하는 매크로블록으로서 선택될 수 있다:
Figure 112016082743094-pct00004
결정된 반복 프레임들의 매크로블록들과의 비교를 위해 이용하기 위한 단일의 최상의 기준 필드를 선택하는 것 대신에, 매크로블록 B1*(n) 각각의 결정시에 이용하기 위해 최상의 기준 매크로블록이 결정될 수 있다. 예를 들어, 반복 필드들의 대응하는 매크로블록들(B1'(n), B1"(n))이 주어지면 각각의 최상의 기준 매크로블록(예컨대, “최상의 기준(n)”)을 결정하기 위해 수학식 2가 매크로블록 레벨에서 적용될 수 있다. 반복 필드들의 대응하는 매크로블록들(B1'(n), B1"(n))과 비교될 때, 최소 왜곡(예컨대, 최소 MSE)를 갖는 대응하는 매크로블록을 찾기 위해, 동일 패리티, 반대 패리티, 및/또는 이 둘 다의 패리티의 주변 필드들의 세트의 대응하는 매크로블록들이 검색될 수 있다.
매크로블록 비교의 예시로서, (도 10에서 나타낸 바와 같이) 반복 프레임들의 쌍(B1', B1")이 검출될 수 있고, 그런 후, 오리지널 프로그레시브 비디오 프레임을 재구축하기 위해 이용되는 필드(B1*)는 양자화 파라미터들(예컨대, QP 스케일 파라미터들) 및/또는 예측 유형의 매크로블록 레벨 비교에 의해 구축될 수 있다. 양자화 파라미터 비교의 경우에서, 매크로블록 B1*(n)이 대응하는 매크로블록 B1'(n)으로서, 또는 대응하는 매크로블록 B1"(n)으로서 선택될 수 있는데, 이러한 선택은 예컨대, 이러한 대응하는 매크로블록들 중 어느 것이 더 미세한 양자화를 갖는지, 또는 더 작은 QP 스케일 파라미터들을 등가적으로 갖는지에 의존하여 행해질 수 있다. 더 미세한 양자화 및/또는 더 작은 QP 스케일은 왜곡의 측면에서 매크로블록이 오리지널 프로그레시브 비디오 시퀀스로부터의 데이터에 더 가까운 것을 나타낼 수 있고, 이에 따라, 이러한 매크로블록들이 B1* 내의 포함을 위해 선택될 수 있다. 예측 유형 비교의 경우에서, 매크로블록 B1*(n)이 대응하는 매크로블록 B1'(n)으로서, 또는 대응하는 매크로블록 B1"(n)으로서 선택될 수 있는데, 이러한 선택은 예컨대, 이러한 대응하는 매크로블록들이 비디오 비트스트림 내에서 인코딩되었을 때 이용된 예측 유형들에 의존하여 행해질 수 있다. P 또는 B 예측 유형을 이용하여 코딩된 매크로블록은, 예컨대, I 예측 유형을 이용하여 코딩된 매크로블록 중에서 선택될 수 있는데, 그 이유는 P 또는 B 예측 유형은 해당 매크로블록이 왜곡 측면에서 오리지널 프로그레시브 비디오 시퀀스에 더 가깝다는 것을 나타낼 수 있다.
역 텔레시네가 수행된 후 사후 필터링이 수행될 수 있다. 오리지널 프로그레시브 프레임들이 재구축되면, 콘텐츠의 인터레이싱된 인코딩에 의해 도입될 수 있었던 아티팩트들을 제거하기 위해 사후 필터가 적용될 수 있다. 예를 들어, 상이한 프레임들에 속하는 필드들이 MPEG-2와 같은 코덱에 의해 사진 프레임들로서 코딩되었다고 결정되면, 재구축된 프로그레시브 프레임들에서 수직적으로 상당한 나이퀴스트 노이즈가 있을 수 있다. 나이퀴스트 아래로 설정된 차단 주파수(fc)를 갖는 수직 로우 패스 필터가 적용될 수 있다.
도 11은 종래 기술의 역 텔레시네(1102), 여기서 설명된 역 텔레시네(1104), 및 사후 필터링(fc = 0.5)을 갖는 것으로서 여기서 설명된 역 텔레시네(1106)의 예시의 도면(1100)이다.
도 12는 종래 기술의 역 텔레시네(1202), 여기서 설명된 역 텔레시네(1204), 및 사후 필터링(fc = 0.5)을 갖는 것으로서 여기서 설명된 역 텔레시네(1206)의 예시의 도면(1200)이다.
도 13은 종래 기술의 역 텔레시네(1302), 여기서 설명된 역 텔레시네(1304), 및 사후 필터링(fc = 0.5)을 갖는 것으로서 여기서 설명된 역 텔레시네(1306)의 예시의 도면(1300)이다.
본 발명의 특징부 및 구성요소들이 특정한 조합형태로 상술되었지만, 본 발명분야의 당업자라면 각 특징부 또는 구성요소들은 단독으로 사용될 수 있거나 또는 다른 특징부 및 구성요소들과 함께 임의의 조합으로 사용될 수 있다는 것을 알 것이다. 또한, 본 명세서에서 설명된 방법은 컴퓨터 또는 프로세서에 의해 실행하기 위한 컴퓨터 판독가능한 매체에 병합된 컴퓨터 프로그램, 소프트웨어, 또는 펌웨어로 구현될 수 있다. 컴퓨터 판독가능한 매체의 예시들에는 (유선 또는 무선 접속들을 통해 송신되는) 전자적 신호들과 컴퓨터 판독가능한 저장 매체를 포함한다. 컴퓨터 판독가능한 저장매체의 예시들에는 ROM(read only memory), RAM(random access memory), 레지스터, 캐시 메모리, 반도체 메모리 장치, 내부 하드 디스크와 탈착가능 디스크와 같은 자기 매체, 광자기 매체, 및 CD-ROM 디스크, DVD(digital versatile disk)와 같은 광학 매체가 포함되나, 이들로 제한되는 것은 아니다. WTRU, UE, 단말기, 기지국, RNC, 또는 임의의 호스트 컴퓨터에서 이용하기 위한 무선 주파수 트랜스시버를 구현하기 위해 소프트웨어와 연계된 프로세서가 이용될 수 있다.

Claims (24)

  1. 비디오 필터링 방법에 있어서,
    복수의 필드(field)들 - 필드는 짝수 패리티(even parity) 필드와 홀수 패리티(odd parity) 필드 중 하나이고, 상기 복수의 필드들 중 적어도 하나의 필드는 과잉(superfluous) 필드임 - 을 포함하는 인코딩된 비디오 시퀀스를 수신하고 디코딩하는 단계;
    각각의 필드를 동일 패리티의 적어도 하나의 시간적으로(temporally) 인접해 있는 필드에 비교하는 단계;
    서로가 최대로 유사한 필드들의 쌍 - 상기 필드들의 쌍은 상기 과잉 필드를 포함함 - 을 결정하는 단계;
    상기 필드들의 쌍 중 어느 것이 각각의 시간적으로 인접해 있는 필드(상기 필드들의 쌍 중 나머지 다른쪽 필드는 아님)와 최소로 유사한지를 결정함으로써 상기 필드들의 쌍 중 어느 것이 상기 과잉 필드인지를 결정하는 단계; 및
    상기 결정된 과잉 필드 없이 상기 비디오 시퀀스를 재구축하는 단계
    를 포함하는 비디오 필터링 방법.
  2. 제1항에 있어서,
    아티팩트(artifact)를 제거하기 위한 필터를 적용하는 단계
    를 더 포함하는 비디오 필터링 방법.
  3. 제1항에 있어서,
    상기 각각의 시간적으로 인접해 있는 필드(상기 필드들의 쌍 중 나머지 다른쪽 필드는 아님)는 상기 필드들의 쌍과 동일한 패리티를 갖는 것인, 비디오 필터링 방법.
  4. 제1항에 있어서,
    상기 각각의 시간적으로 인접해 있는 필드(상기 필드들의 쌍 중 나머지 다른쪽 필드는 아님)는 상기 필드들의 쌍과는 반대되는 패리티를 갖는 것인, 비디오 필터링 방법.
  5. 제1항에 있어서,
    상기 서로가 최대로 유사한 필드들의 쌍은 최저 평균 제곱 오차(mean squared error)를 갖는 필드들의 쌍인 것인, 비디오 필터링 방법.
  6. 제1항에 있어서,
    상기 과잉 필드는 자신의 각각의 시간적으로 인접해 있는 필드에 대해 더 높은 평균 제곱 오차를 갖는 것인, 비디오 필터링 방법.
  7. 제1항에 있어서,
    상기 과잉 필드는 자신의 각각의 시간적으로 인접해 있는 필드에 대해 더 높은 평균 양자화 스케일 파라미터(mean quantization scale parameter)를 갖는 것인, 비디오 필터링 방법.
  8. 제1항에 있어서,
    상기 과잉 필드는 상기 필드들의 쌍 내의 모션 보상된(motion compensated) 필드인 것인, 비디오 필터링 방법.
  9. 제1항에 있어서,
    상기 비디오 시퀀스 내에서의 과잉 필드들의 패턴을 결정하는 단계
    를 더 포함하는 비디오 필터링 방법.
  10. 비디오 필터링 방법에 있어서,
    일련의 필드들 - 상기 일련의 필드들 중 적어도 하나의 필드는 과잉 필드임 - 을 포함한 복수의 프레임들을 수신하는 단계;
    각각의 필드를 적어도 하나의 시간적으로 인접해 있는 필드에 비교하여 서로 최대로 유사한 필드들의 쌍 - 상기 필드들의 쌍은 상기 과잉 필드를 포함함 - 을 결정하는 단계;
    상기 필드들의 쌍 중 어느 것이 각각의 시간적으로 인접해 있는 필드(상기 필드들의 쌍 중 나머지 다른쪽 필드는 아님)와 최소로 유사한지를 결정하고 해당 필드를 상기 과잉 필드로서 지정하는 단계; 및
    상기 결정된 과잉 필드 없이 상기 복수의 프레임들을 재구축하는 단계
    를 포함하는 비디오 필터링 방법.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
KR1020167023349A 2014-02-10 2015-02-10 역 텔레시네 필터 KR101858212B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461938100P 2014-02-10 2014-02-10
US61/938,100 2014-02-10
PCT/US2015/015187 WO2015120443A1 (en) 2014-02-10 2015-02-10 Inverse telecine filter

Publications (2)

Publication Number Publication Date
KR20160114121A KR20160114121A (ko) 2016-10-04
KR101858212B1 true KR101858212B1 (ko) 2018-05-16

Family

ID=52474141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167023349A KR101858212B1 (ko) 2014-02-10 2015-02-10 역 텔레시네 필터

Country Status (6)

Country Link
US (1) US20160360199A1 (ko)
EP (1) EP3105922B1 (ko)
KR (1) KR101858212B1 (ko)
CN (1) CN105981373A (ko)
TW (1) TW201603583A (ko)
WO (1) WO2015120443A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017126899A2 (en) * 2016-01-19 2017-07-27 Samsung Electronics Co., Ltd. Methods and systems for reconstructing a high frame rate high resolution video
US11303847B2 (en) * 2019-07-17 2022-04-12 Home Box Office, Inc. Video frame pulldown based on frame analysis

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9303369D0 (en) * 1993-02-19 1993-04-07 Philips Electronics Uk Ltd Identifying film frames in a video sequence
US5828786A (en) * 1993-12-02 1998-10-27 General Instrument Corporation Analyzer and methods for detecting and processing video data types in a video data stream
US5757435A (en) * 1995-12-08 1998-05-26 C-Cube Microsystems, Inc. MPEG-2 inverse telecine circuit
US5847772A (en) * 1996-09-11 1998-12-08 Wells; Aaron Adaptive filter for video processing applications
US6873368B1 (en) * 1997-12-23 2005-03-29 Thomson Licensing Sa. Low noise encoding and decoding method
US7961251B2 (en) * 2002-06-28 2011-06-14 Trident Microsystems (Far East) Ltd. Method and apparatus for conversion of video formats to 120 Hz 4 to 1 interlaced formats
KR100518580B1 (ko) * 2003-06-10 2005-10-04 삼성전자주식회사 인버스 텔레시네 변환장치 및 변환방법
US20050231635A1 (en) * 2004-04-16 2005-10-20 Lin Ken K Automated inverse telecine process
US8879635B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
US8401070B2 (en) * 2005-11-10 2013-03-19 Lsi Corporation Method for robust inverse telecine
JP4843361B2 (ja) * 2006-04-27 2011-12-21 富士通株式会社 32プルダウンシーケンスの検出装置、及び検出方法
US8619190B2 (en) * 2006-09-07 2013-12-31 Texas Instruments Incorporated Film mode detection
US8957961B2 (en) * 2006-12-27 2015-02-17 Intel Corporation Method and sytem for telecine detection and restoration
US8199255B1 (en) * 2007-04-30 2012-06-12 Nvidia Corporation System, method, and computer program product for configuring a plurality of devices to process content
US8891011B2 (en) * 2007-08-23 2014-11-18 Qualcomm Incorporated Systems and methods for combining deinterlacing and frame rate decimation for video format conversion
US20090161766A1 (en) * 2007-12-21 2009-06-25 Novafora, Inc. System and Method for Processing Video Content Having Redundant Pixel Values
US20100254453A1 (en) * 2009-04-02 2010-10-07 Qualcomm Incorporated Inverse telecine techniques
US10368108B2 (en) * 2011-12-21 2019-07-30 Ati Technologies Ulc Downstream video composition

Also Published As

Publication number Publication date
EP3105922B1 (en) 2018-04-04
US20160360199A1 (en) 2016-12-08
KR20160114121A (ko) 2016-10-04
WO2015120443A1 (en) 2015-08-13
CN105981373A (zh) 2016-09-28
EP3105922A1 (en) 2016-12-21
TW201603583A (zh) 2016-01-16

Similar Documents

Publication Publication Date Title
US20220329831A1 (en) Enhanced chroma coding using cross plane filtering
US11036459B2 (en) Two-dimensional palette coding for screen content coding
JP6964567B2 (ja) マルチレイヤビデオコーディングにおける空間レイヤのためのサンプリンググリッド情報
US10321130B2 (en) Enhanced deblocking filters for video coding
JP6954763B2 (ja) マルチレイヤビデオコーディングの適応型アップサンプリング
US10044913B2 (en) Temporal filter for denoising a high dynamic range video
US10972731B2 (en) Systems and methods for coding in super-block based video coding framework
US9438898B2 (en) Reference picture lists modification
JP2019165486A (ja) イントラブロックコピー探索
JP2018201245A (ja) スケーラブルビデオ符号化のためのレイヤ間予測
KR101858212B1 (ko) 역 텔레시네 필터
WO2014052602A1 (en) Method and apparatus of edge guided processing for video coding
TW201444342A (zh) 功率感知視訊串流複雜性感知視訊編碼

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right