KR20160063405A - Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치 - Google Patents

Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20160063405A
KR20160063405A KR1020167012740A KR20167012740A KR20160063405A KR 20160063405 A KR20160063405 A KR 20160063405A KR 1020167012740 A KR1020167012740 A KR 1020167012740A KR 20167012740 A KR20167012740 A KR 20167012740A KR 20160063405 A KR20160063405 A KR 20160063405A
Authority
KR
South Korea
Prior art keywords
frames
data stream
bit rate
transition
media content
Prior art date
Application number
KR1020167012740A
Other languages
English (en)
Inventor
유리이 레즈닉
에두아르도 아스분
지펭 첸
라훌 바남
Original Assignee
브이아이디 스케일, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브이아이디 스케일, 인크. filed Critical 브이아이디 스케일, 인크.
Publication of KR20160063405A publication Critical patent/KR20160063405A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04L65/4084
    • H04L65/602
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 및/또는 오디오 인코딩 및 디코딩 시에 원활한 스트림 스위칭을 제공하기 위한 방법 및 장치가 제공될 수도 있다. 원활한 스트림 스위칭은 상이한 레이트로 인코딩된 미디어 콘텐트의 스트림 사이에 이용될 수도 있는 하나 이상의 전이 프레임의 생성 및/또는 디스플레이를 포함할 수도 있다. 전이 프레임은 크로스페이딩 및 중첩, 크로스페이딩 및 트랜스코딩, 필터링을 사용하는 후처리 기술, 재양자화를 사용하는 후처리 기술 등을 통해 생성될 수도 있다. 원활한 스트림 스위칭은 제1 신호 대 잡음 비(SNR)를 특징으로 하는 미디어 콘텐트의 제1 데이터 스트림 및 제2 SNR을 특징으로 하는 상기 미디어 콘텐트의 제2 데이터 스트림을 수신하는 단계를 포함할 수도 있다. 전이 프레임은 제1 데이터 스트림의 프레임 및 제2 데이터 스트림의 프레임 중 적어도 하나를 사용하여 생성될 수도 있다. 전이 프레임은 제1 SNR과 제2 SNR 사이에 있는 하나 이상의 SNR 값을 특징으로 할 수도 있다.

Description

MPEG/3GPP-DASH에서의 원활한 스트림 스위칭을 위한 방법 및 장치{METHOD AND APPARATUS FOR SMOOTH STREAM SWITCHING IN MPEG/3GPP-DASH}
관련 출원에 대한 상호 참조
이 출원은 2012년 4월 24일에 출원된 미국 가특허 출원 제61/637,777호의 이익을 청구하며, 그 내용/내용들은 참조로 본 명세서에 병합되어 있다.
무선 및 유선 네트워크에서의 스트리밍(streaming)은 네트워크에서의 가변 대역폭으로 인해 적응성(adaptation)을 이용할 수도 있다. 콘텐트 제공자가 다중 속도 및/또는 분해능으로 인코딩된 콘텐트를 발행할 수도 있고, 이로 인해 클라이언트가 가변하는 채널 대역폭에 적응 가능할 수도 있다. 예를 들면, 동화상 전문가 그룹(MPEG: Moving Picture Experts Group) 및 3세대 파트너십 프로젝트(3GPP: third generation partnership project) 하이퍼텍스트 트랜스포트 프로토콜(HTTP)을 통한 동적 적응성 스트리밍(DASH) 표준은 무선 및 유선 네트워크를 통한 효율적이고 고품질의 스트리밍 서비스의 전달을 가능하게 할 수도 있는 종단간(end-to-end) 서비스의 설계를 위한 프레임워크(framework)를 정의할 수도 있다.
DASH 표준은 스트림 액세스 포인트(SAP)라고 칭해질 수도 있는 스트림 간의 연결의 타입을 정의할 수도 있다. SAP를 따른 스트림의 연쇄(catenation)가 정확하게 디코드 가능한 MPEG 스트림을 생성할 수도 있다. 그러나, DASH 표준은 스트림 간의 전이의 비구별성(invisibility of transitions)을 확인하기 위한 수단이나 가이드라인을 제공하지는 않는다. 특별한 방안이 적용되지 않으면, DASH 재생 시의 스트림 스위치가 현저해질 수도 있고 사용자에게 저하된 체험 품질(QoE)을 유발할 수도 있다. 속도 간의 차가 비교적 클 때 가시적인 품질의 변화가 특히 현저해질 수도 있고, 예를 들면, 더 높은 품질의 스트림에서 더 낮은 품질의 스트림으로 변화할 때 특히 현저해질 수도 있다.
비디오 및/또는 오디오 인코딩 및 디코딩 시에 원활한 스트림 스위칭을 제공하기 위한 방법 및 장치가 제공될 수도 있다. 원활한 스트림 스위칭은 상이한 레이트로 인코딩된 미디어 콘텐트의 스트림 사이에 이용될 수도 있는 하나 이상의 전이 프레임의 생성 및/또는 디스플레이를 포함할 수도 있다. 전이 프레임은 크로스페이딩(crossfading) 및 중첩, 크로스페이딩 및 트랜스코딩(transcoding), 필터링을 사용하는 후처리 기술, 재양자화를 사용하는 후처리 기술 등을 통해 생성될 수도 있다.
원활한 스트림 스위칭은 미디어 콘텐트의 제1 데이터 스트림 및 상기 미디어 콘텐트의 제2 데이터 스트림을 수신하는 단계를 포함할 수도 있다. 미디어 콘텐트는 비디오를 포함할 수도 있다. 제1 데이터 스트림은 제1 신호 대 잡음 비(SNR)를 특징으로 할 수도 있다. 제2 데이터 스트림은 제2 SNR을 특징으로 할 수도 있다. 제1 SNR은 제2 SNR보다 클 수도 있거나, 제1 SNR은 제2 SNR보다 작을 수도 있다.
전이 프레임은 제1 SNR을 특징으로 하는 제1 데이터 스트림의 프레임 및 제2 SNR을 특징으로 하는 제2 데이터 스트림의 프레임 중 적어도 하나를 사용하여 생성될 수도 있다. 전이 프레임은 제1 SNR과 제2 SNR 사이에 있는 하나 이상의 SNR 값을 특징으로 할 수도 있다. 전이 프레임은 전이 시간 간격을 특징으로 할 수도 있다. 전이 프레임은 미디어 콘텐트의 하나의 세그먼트의 부분일 수도 있다. 제1 데이터 스트림의 하나 이상의 프레임이 디스플레이될 수도 있고, 전이 프레임이 디스플레이될 수도 있으며, 제2 데이터 스트림의 하나 이상의 프레임이 디스플레이될 수도 있다.
전이 프레임을 생성하는 것은 제1 SNR을 특징으로 하는 프레임을 제2 SNR을 특징으로 하는 프레임과 크로스페이딩하여 전이 프레임을 생성하는 것을 포함할 수도 있다. 크로스페이딩은 제1 SNR을 특징으로 하는 프레임과 제2 SNR을 특징으로 하는 프레임의 가중 평균을 계산하여 전이 프레임을 생성하는 것을 포함할 수도 있다. 가중 평균은 시간의 경과에 따라 변할 수도 있다. 크로스페이딩은 제1 SNR을 특징으로 하는 프레임에 제1 가중치를, 그리고 제2 SNR을 특징으로 하는 프레임에 제2 가중치를 적용함으로써 제1 SNR을 특징으로 하는 프레임과 제2 SNR을 특징으로 하는 프레임의 가중 평균을 계산하는 것을 포함할 수도 있다. 제1 가중치 및 제2 가중치 중 적어도 하나는 전이 시간 간격 동안 변할 수도 있다. 크로스페이딩은 제1 데이트 스트림 및 제2 데이터 스트림 사이의 선형 전이 또는 비선형 전이를 사용하여 실행될 수도 있다.
제1 인코딩 데이터 스트림 및 제2 인코딩 데이터 스트림은 미디어 콘텐트의 중첩 프레임을 포함할 수도 있다. 제1 SNR을 특징으로 하는 프레임을 제2 SNR을 특징으로 하는 프레임과 크로스페이딩하여 전이 프레임을 생성하는 것은 제1 데이터 스트림 및 제2 데이터 스트림의 중첩 프레임을 크로스페이딩하여 전이 프레임을 생성하는 것을 포함할 수도 있다. 중첩 프레임은 제1 데이터 스트림 및 제2 데이터 스트림의 대응하는 프레임을 특징으로 할 수도 있다. 중첩 프레임은 중첩 시간 간격을 특징으로 할 수도 있다. 제1 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 전에 디스플레이될 수도 있고, 전이 프레임은 중첩 시간 간격 동안 디스플레이될 수도 있으며, 제2 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 후에 디스플레이될 수도 있다. 제1 인코딩 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 이전의 시간을 특징으로 할 수도 있고, 제2 인코딩 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 이후의 시간을 특징으로 할 수도 있다.
제1 인코딩 데이터 스트림의 프레임의 서브세트가 제2 SNR을 특징으로 하는 대응하는 프레임을 생성하도록 트랜스코딩될 수도 있다. 제1 SNR을 특징으로 하는 프레임을 제2 SNR을 특징으로 하는 프레임과 크로스페이딩하여 전이 프레임을 생성하는 것은 제1 데이터 스트림의 프레임의 서브세트를 제2 SNR을 특징으로 하는 대응하는 프레임과 크로스페이딩하여 전이 프레임을 생성하는 것을 포함할 수도 있다.
전이 프레임을 생성하는 것은 전이 시간 간격 동안 변하는 컷오프 주파수를 특징으로 하는 로우 패스 필터를 사용하여 제1 SNR을 특징으로 하는 프레임을 필터링하여 전이 프레임을 생성하는 것을 포함할 수도 있다. 전이 프레임을 생성하는 것은 하나 이상의 스텝 사이즈(step size)를 사용하여 제1 SNR을 특징으로 하는 프레임을 변환 및 양자화하여 전이 프레임을 생성하는 것을 포함할 수도 있다.
도 1a는 하나 이상의 실시예가 실현될 수도 있는 통신 시스템의 일례의 시스템도이다.
도 1b는 도 1a에 도시된 통신 시스템 내에서 사용될 수도 있는 무선 송수신 유닛(WTRU)의 일례의 시스템도이다.
도 1c는 도 1a에 도시된 통신 시스템 내에서 사용될 수도 있는 코어 네트워크의 일례 및 무선 액세스 네트워크의 일례의 시스템도이다.
도 1d는 도 1a에 도시된 통신 시스템 내에서 사용될 수도 있는 코어 네트워크의 다른 예 및 무선 액세스 네트워크의 다른 예의 시스템도이다.
도 1e는 도 1a에 도시된 통신 시스템 내에서 사용될 수도 있는 코어 네트워크의 다른 예 및 무선 액세스 네트워크의 다른 예의 시스템도이다.
도 2는 상이한 비트레이트(bitrate)로 인코딩된 콘텐트의 일례를 도시하는 도면이다.
도 3은 대역폭 적응 스트리밍의 일례를 도시하는 도면이다.
도 4는 상이한 비트레이트로 인코딩되고 세그먼트로 분할된 콘텐트의 일례를 도시하는 도면이다.
도 5는 HTTP 스트리밍 세션의 일례를 도시하는 도면이다.
도 6은 DASH 고 레벨 시스템 아키텍처의 일례를 도시하는 도면이다.
도 7은 DASH 클라이언트 모드의 일례를 도시하는 도면이다.
도 8은 DASH 미디어 표시 고 레벨 데이터 모델의 일례를 도시하는 도면이다.
도 9는 스트림 액세스 포인트의 파라미터의 예를 도시하는 도면이다.
도 10은 타입 1 SAP의 일례를 도시하는 도면이다.
도 11은 타입 2 SAP의 일례를 도시하는 도면이다.
도 12는 타입 3 SAP의 일례를 도시하는 도면이다.
도 13은 점진적 디코딩 리프레시(GDR: Gradual Decoding Refresh)의 일례를 도시하는 도면이다.
도 14는 스트리밍 세션 동안 속도 간의 전이의 일례를 도시하는 그래프이다.
도 15는 원활한 전이를 갖는 스트리밍 세션 동안 속도 간의 전이의 일례를 도시하는 그래프이다.
도 16a는 원활한 스트림 스위칭이 없는 전이의 일례를 도시하는 도면이다.
도 16b는 원활한 스트림 스위칭이 있는 전이의 일례를 도시하는 도면이다.
도 17은 오버래핑(overlapping) 및 크로스 페이딩(cross fading)을 사용한 원활한 스트리밍 스위칭의 예를 도시하는 그래프이다.
도 18은 스트림을 오버래핑 및 크로스페이딩하기 위한 시스템의 일례를 도시하는 도면이다.
도 19는 스트림을 오버래핑 및 크로스페이딩하기 위한 시스템의 다른 예를 도시하는 도면이다.
도 20은 트랜스코딩(transcoding) 및 크로스페이딩을 사용한 원활한 스트림 스위칭의 예를 도시하는 도면이다.
도 21은 트랜스코딩 및 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
도 22는 트랜스코딩 및 크로스페이딩을 위한 시스템의 다른 예를 도시하는 도면이다.
도 23은 속도 H 및 L 사이의 선형 전이를 사용한 크로스페이딩의 예를 도시하는 그래프이다.
도 24는 비선형 크로스페이딩 기능의 예를 도시하는 그래프이다.
도 25는 스케일러블(scalable) 비디오 비트스트림을 크로스페이딩하기 위한 시스템의 일례를 도시하는 도면이다.
도 26은 스케일러블 비디오 비트스트림을 크로스페이딩하기 위한 시스템의 다른 예를 도시하는 도면이다.
도 27은 QP 크로스페이딩을 사용한 프로그레시브(progressive) 트랜스코딩을 위한 시스템의 일례를 도시하는 도면이다.
도 28은 후처리 가공(post-processing)을 사용하는 원활한 스트림 스위칭의 예를 도시하는 도면이다.
도 29는 상이한 컷오프 주파수를 갖는 로우 패스 필터의 주파수 응답의 일례를 도시하는 도면이다.
도 30은 상이한 프레임 분해능을 갖는 스트림에 대한 원활한 스위칭의 일례를 도시하는 도면이다.
도 31은 상이한 프레임 분해능을 갖는 스트림에 대해 하나 이상의 전이 프레임을 생성하는 일례를 도시하는 도면이다.
도 32는 상이한 프레임 분해능을 갖는 스트림에 대해 H-L 전이 시의 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
도 33은 상이한 프레임 분해능을 갖는 스트림에 대해 L-H 전이 시의 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
도 34는 상이한 프레임 속도를 갖는 스트림에 대한 원활한 스위칭을 위한 시스템의 일례를 도시하는 도면이다.
도 35는 상이한 프레임 속도를 갖는 스트림에 대해 하나 이상의 전이 프레임을 생성하는 일례를 도시하는 도면이다.
도 36은 상이한 프레임 속도를 갖는 스트림에 대해 H-L 전이 시의 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
도 37은 상이한 프레임 속도를 갖는 스트림에 대해 L-H 전이 시의 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
도 38은 MDCT 기반 스피치(speech) 및 오디오 코덱에 사용되는 오브랩 가산(overlap-add) 윈도우의 일례를 도시하는 그래프이다.
도 39는 폐기 가능한 블록을 갖는 오디오 액세스 포인트의 일례를 도시하는 도면이다.
도 40은 3개의 폐기 가능한 블록을 갖는 HE-ACC 오디오 액세스 포인트의 일례를 도시하는 도면이다.
도 41은 H-L 전이 시의 오디오 스트림의 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
도 42는 L-H 전이 시의 오디오 스트림의 크로스페이딩을 위한 시스템의 일례를 도시하는 도면이다.
예시적인 실시예의 상세한 설명을 다양한 도면을 참조하여 이제 설명할 것이다. 이 설명은 가능한 실현예의 상세한 예를 제공하지만, 상세는 예시적인 것일 뿐 결코 본 출원의 범위를 제한하고자 하는 의도는 아님을 주의해야 한다.
도 1a는 하나 이상의 개시된 실시예가 실현될 수도 있는 통신 시스템(100)의 일례의 도면이다. 통신 시스템(100)은 음성, 데이터, 비디오, 메시징(messaging), 방송 등과 같은 콘텐트를 다수의 무선 사용자에게 제공하는 다중 액세스 시스템일 수도 있다. 통신 시스템(100)은 다수의 무선 사용자가 무선 대역폭을 포함하는 시스템 자원의 공유를 통해 그러한 콘텐트에 액세스 가능하게 할 수도 있다. 예를 들면, 통신 시스템(100)은 코드 분할 다중 액세스(CDMA), 시분할 다중 액세스(TDMA), 주파수 분할 다중 액세스(FDMA), 직교 FDMA(OFDMA), 단일 반송파 FDMA(SC-FDMA) 등과 같은 하나 이상의 채널 액세스 방법을 채용할 수도 있다.
도 1a에 도시된 바와 같이, 통신 시스템(100)은 무선 송수신 유닛(WTRU)(102a, 102b, 102c 및/또는 102d)(전체적으로 또는 집합적으로 WTRU(102)로 칭해질 수도 있음), 무선 액세스 네트워크(RAN)(103/104/105), 코어 네트워크(106/107/109), 공중 교환 전화 네트워크(PSTN)(108), 인터넷(110), 및 다른 네트워크(112)를 포함할 수도 있지만, 개시된 실시예는 임의의 수의 WTRU, 기지국, 네트워크 및/또는 네트워크 요소를 고려하고 있음이 이해될 것이다. 각각의 WTRU(102a, 102b, 102c, 102d)는 무선 환경에서 동작하도록 및/또는 통신하도록 구성되는 임의의 타입의 디바이스일 수도 있다. 예로서, WTRU(102a, 102b, 102c, 102d)는 무선 신호를 송신 및/또는 수신하도록 구성될 수도 있고, 사용자 장비(UE), 이동국, 고정 또는 이동 가입자 유닛, 페이저(pager), 셀룰러 전화기, 개인 휴대용 디지털 정보 단말(PDA), 스마트폰, 랩톱, 넷북(netbook), 퍼스널 컴퓨터, 무선 센서, 가전 제품 등을 포함할 수도 있다.
통신 시스템(100)은 기지국(114a) 및 기지국(114b)을 또한 포함할 수도 있다. 각각의 기지국(114a, 114b)은 코어 네트워크(106/107/109), 인터넷(110), 및/또는 네트워크(112)와 같은 하나 이상의 통신 네트워크로의 액세스를 용이하게 하기 위해 WTRU(102a, 102b, 102c, 102d) 중 적어도 하나와 무선으로 인터페이스하도록 구성되는 임의의 타입의 디바이스일 수도 있다. 예로서, 기지국(114a, 114b)은 기지 송수신국(BTS), Node-B, eNode B, 홈 노드 B, 홈 eNode B, 사이트 제어기, 액세스 포인트(AP), 무선 라우터 등일 수도 있다. 기지국(114a, 114b)이 각각 단일 요소로서 도시되어 있지만, 기지국(114a, 114b)은 임의의 수의 상호 연결된 기지국 및/또는 네트워크 요소를 포함할 수도 있음이 이해될 것이다.
기지국(114a)은 다른 기지국 및/또는 기지국 제어기(BSC), 무선 네트워크 제어기(RNC), 중계 노드 등과 같은 네트워크 요소(도시 생략)를 또한 포함할 수도 있는 RAN(103/104/105)의 부분일 수도 있다. 기지국(114a) 및/또는 기지국(114b)은 셀(도시 생략)이라고 칭해질 수도 있는 특정의 지리적 영역 내에서 무선 신호를 송신 및/또는 수신하도록 구성될 수도 있다. 셀은 셀 섹터로 더욱 분할될 수도 있다. 예를 들면, 기지국(114a)과 관련된 셀은 3개의 섹터로 분할될 수도 있다. 그러므로, 일 실시예에서는, 기지국(114a)은 3개의 송수신기 예를 들면, 셀의 각각의 섹터마다 하나를 포함할 수도 있다. 다른 실시예에서는, 기지국(114a)은 다중 입력 다중 출력(MIMO) 기술을 채용할 수도 있고, 그에 따라 셀의 각각의 섹터마다 다수의 송수신기를 이용할 수도 있다.
기지국(114a, 114b)은 임의의 적절한 무선 통신 링크(예를 들면, 무선 주파수(RF), 마이크로파, 적외선(IR), 자외선(UV), 가시광 등)일 수도 있는 무선 인터페이스(115/116/117)를 통해 하나 이상의 WTRU(102a, 102b, 102c, 102d)와 통신할 수도 있다. 무선 인터페이스(115/116/117)는 임의의 적절한 무선 액세스 기술(RAT)을 이용하여 확립될 수도 있다.
더욱 구체적으로는, 위에 언급한 바와 같이, 통신 시스템(100)은 다중 액세스 시스템일 수도 있고, CDMA, TDMA, FDMA, OFDMA, SC-FDMA 등과 같은 하나 이상의 채널 액세스 방식을 채용할 수도 있다. 예를 들면, RAN(103/104/105) 내의 기지국(114a) 및 WTRU(102a, 102b, 102c)는 광대역 CDMA(WCDMA)를 이용하는 무선 인터페이스(115/116/117)를 확립할 수도 있는 범용 이동 전화통신 시스템(UMTS) 지상 무선 액세스(UTRA)와 같은 무선 기술을 실현할 수도 있다. WCDMA는 고속 패킷 액세스(HSPA) 및/또는 강화된(Evolved) HSPA(HSPA+)와 같은 통신 프로토콜을 포함할 수도 있다. HSPA는 고속 다운링크 패킷 액세스(HSDPA) 및/또는 고속 업링크 패킷 액세스(HSUPA)를 포함할 수도 있다.
다른 실시예에서는, 기지국(114a) 및 WTRU(102a, 102b, 102c)는 롱 텀 에볼루션(LTE: Long Term Evolution) 및/또는 LTE-어드밴스드(LTE-A)를 이용하는 무선 인터페이스(115/116/117)를 확립할 수도 있는 강화된 UMTS 지상 무선 액세스(E-UTRA)와 같은 무선 기술을 실현할 수도 있다.
다른 실시예에서는, 기지국(114a) 및 WTRU(102a, 102b, 102c)는 IEEE 802.16(예를 들면, 마이크로파 액세스를 위한 전세계 상호 운용성(WiMAX: Worldwide Interoperability for Microwave Access)), CDMA2000, CDMA2000 1X, CDMA2000 EV-DO, 인터림(Interim) 표준 2000(IS-2000), 인터림 표준 95(IS-95), 인터림 표준 856(IS-856), 이동 통신용 글로벌 시스템(GSM), GSM 에볼루션을 위한 향상된 데이터 속도(EDGE), GSM EDGE(GERAN) 등과 같은 무선 기술을 실현할 수도 있다.
도 1a의 기지국(114b)은 예를 들면, 무선 라우터, 홈 노드 B, 홈 eNode B, 또는 액세스 포인트일 수도 있고, 사무소, 홈, 차량, 캠퍼스 등과 같은 로컬화된 영역에서의 무선 연결을 용이하게 하기 위해 임의의 적절한 RAT를 이용할 수도 있다. 일 실시예에서는, 기지국(114b) 및 WTRU(102c, 102d)는 무선 근거리 통신망(WLAN)을 확립하도록 IEEE 802.11과 같은 무선 기술을 실현할 수도 있다. 다른 실시예에서는, 기지국(114b) 및 WTRU(102c, 102d)는 무선 개인 통신망(WPAN)을 확립하도록 IEEE 802.15와 같은 무선 기술을 실현할 수도 있다. 또 다른 실시예에서는, 기지국(114b) 및 WTRU(102c, 102d)는 피코셀(picocell) 또는 펨토셀(pemtocell)을 확립하도록 셀룰러 기반 RAT(예를 들면, WCDMA, CDMA 2000, GSM, LTE, LTE-A 등)를 이용할 수도 있다. 도 1a에 도시된 바와 같이, 기지국(114b)은 인터넷(110)에 직접 연결할 수도 있다. 그러므로, 기지국(114b)은 코어 네트워크(106/107/109)를 통해 인터넷(110)에 액세스할 필요가 없을 수도 있다.
RAN(103/104/105)은 WTRU(102a, 102b, 102c, 102d) 중 하나 이상에 음성, 데이터, 애플리케이션 및/또는 음성 인터넷 프로토콜(VoIP: voice over internet protocol) 서비스를 제공하도록 구성된 임의의 타입의 네트워크일 수도 있는 코어 네트워크(106/107/109)와 통신하고 있을 수도 있다. 예를 들면, 코어 네트워크(106/107/109)는 호(call) 제어, 과금 서비스, 모바일 위치 기반 서비스, 선불 호출, 인터넷 연결, 비디오 배포 등을 제공할 수도 있고/있거나 사용자 인증과 같은 고 레벨 보안 기능을 실행할 수도 있다. 도 1a에 도시되지는 않았지만, RAN(103/104/105) 및/또는 코어 네트워크(106/107/109)가 RAN(103/104/105)과 동일한 RAT 또는 상이한 RAT를 채용하는 다른 RAN과 직접 또는 간접 통신하고 있을 수도 있음이 이해될 것이다. 예를 들면, E-UTRA 무선 기술을 이용하는 것일 수도 있는 RAN(103/104/105)에 연결되는 것에 덧붙여서, 코어 네트워크(106/107/109)도 또한 GSM 무선 기술을 채용하는 다른 RAN(도시 생략)과 통신하고 있을 수도 있다.
코어 네트워크(106/107/109)는 또한, PSTN(108), 인터넷(110) 및/또는 다른 네트워크(112)에 액세스하기 위해 WTRU(102a, 102b, 102c, 102d)용의 게이트웨이로서의 역할을 할 수도 있다. PSTN(108)은 기존 전화 서비스(POTS)를 제공하는 회선 교환 전화 네트워크를 포함할 수도 있다. 인터넷(110)은 송신 제어 프로토콜(TCP), 사용자 데이터그램(datagram) 프로토콜(UDP) 및 TCP/IP 인터넷 프로토콜 스위트(suite) 내의 인터넷 프로토콜(IP)와 같은 공통 통신 프로토콜을 이용하는 상호 연결된 컴퓨터 네트워크 및 디바이스의 글로벌 시스템을 포함할 수도 있다. 네트워크(112)는 다른 서비스 제공자에 의해 소유되는 및/또는 운영되는 유선 또는 무선 통신 네트워크를 포함할 수도 있다. 예를 들면, 네트워크(112)는 RAN(103/104/105)과 동일한 RAT 또는 상이한 RAT를 채용할 수도 있는 하나 이상의 RAN에 연결되는 다른 코어 네트워크를 포함할 수도 있다.
통신 시스템(100) 내의 WTRU(102a, 102b, 102c, 102d)의 일부 또는 전부가 다중 모드 능력을 포함할 수도 있다, 예를 들면, WTRU(102a, 102b, 102c, 102d)는 상이한 무선 링크를 통해 상이한 무선 네트워크와 통신하기 위한 다수의 송수신기를 포함할 수도 있다. 예를 들면, 도 1a에 도시된 WTRU(102c)는 셀룰러 기반 무선 기술을 채용할 수도 있는 기지국(114a)과, 그리고 IEEE 802 무선 기술을 채용할 수도 있는 기지국(114b)과 통신하도록 구성될 수도 있다.
도 1b는 WTRU(102)의 일례의 시스템도이다. 도 1b에 도시된 바와 같이, WTRU(102)는 프로세서(118), 송수신기(120), 송수신 요소(122), 스피커/마이크로폰(124), 키패드(126), 디스플레이/터치패드(128), 고정식 메모리(130), 착탈식 메모리(132), 전원(134), 전세계 측위 시스템(GPS) 칩셋(136), 및 다른 주변장치(138)를 포함할 수도 있다. WTRU(102)가 일 실시예와의 일관성을 유지하면서 상기 요소의 임의의 서브조합을 포함할 수도 있음이 이해될 것이다. 또한, 실시예들은 기지국(114a 및 114b), 및/또는 기지국(114a 및 114b)이 대신할 수도 있는, 이에 제한되는 것은 아니지만, 송수신국(BTS), Node-B, 사이트 제어기, 액세스 포인트(AP), 홈 node-B, 강화된 홈 node-B(eNodeB), 홈 강화된 node-B(HeNB), 홈 강화된 node-B 게이트웨이와 같은 노드, 및 특히 프록시 노드가 도 1b에 도시되고 본 명세서에 기재되어 있는 요소 중 일부 또는 전부를 포함할 수도 있다.
프로세서(118)는 범용 프로세서, 특수 용도 프로세서, 통상의 프로세서, 디지털 신호 프로세서(DSP), 복수의 마이크로프로세서, DSP 코어와 관련된 하나 이상의 마이크로프로세서, 제어기, 마이크로컨트롤러, 주문형 반도체(ASIC: Application Specific Integrated Circuit), 필드 프로그램 가능한 게이트 어레이(FPGA: Field Programmable Gate Array) 회로, 임의의 다른 타입의 집적 회로(IC), 상태 머신 등일 수도 있다. 프로세서(118)는 신호 코딩, 데이터 처리, 전력 제어, 입/출력 처리 및/또는 WTRU(102)가 무선 환경에서 동작할 수 있게 하는 임의의 다른 기능을 실행할 수도 있다. 프로세서(118)는 송수신 요소(122)에 결합될 수도 있는 송수신기(120)에 결합될 수도 있다. 도 1b는 프로세서(118)와 송수신기(120)를 별개의 구성요소로서 도시하고 있지만, 프로세서(118)와 송수신기(120)는 전자 패키지 또는 칩에 함께 집적될 수도 있음이 이해될 것이다.
송수신 요소(122)는 무선 인터페이스(115/116/117)를 통해 기지국(예를 들면, 기지국(114a))에 신호를 송신하도록 또는 기지국으로부터 신호를 수신하도록 구성될 수도 있다. 예를 들면, 일 실시예에서는, 송수신 요소(122)가 RF 신호를 송신 및/또는 수신하도록 구성되는 안테나일 수도 있다. 다른 실시예에서는, 송수신 요소(122)가 예를 들면, IR, UV 또는 가시광 신호를 송신 및/또는 수신하도록 구성되는 이미터/검출기(emitter/detector)일 수도 있다. 또 다른 실시예에서는, 송수신 요소(122)는 RF와 광 신호의 양자를 송신 및 수신하도록 구성될 수도 있다. 송수신 요소(122)가 무선 신호의 임의의 조합을 송신 및/또는 수신하도록 구성될 수도 있음이 이해될 것이다.
또한, 송수신 유닛(122)이 도 1b에서는 단일 요소로서 도시되어 있지만, WTRU(102)가 임의의 수의 송수신 요소(122)를 포함할 수도 있다. 더욱 구체적으로는, WTRU(102)는 MIMO 기술을 채용할 수도 있다. 그러므로, 일 실시예에서는, WTRU(102)가 무선 인터페이스(115/116/117)를 통해 무선 신호를 송신 및 수신하기 위한 2 이상의 송수신 요소(122)(예를 들면, 다중 안테나)를 포함할 수도 있다.
송수신기(120)는 송수신 요소(122)에 의해 송신되는 신호를 변조하도록 그리고 송수신 요소(122)에 의해 수신되는 신호를 복조하도록 구성될 수도 있다. 위에 언급한 바와 같이, WTRU(102)는 다중 모드 능력을 가질 수도 있다. 그러므로, 송수신기(120)는 WTRU(102)가 예를 들면, UTRA 및 IEEE 802.11과 같은 다중 RAT를 통해 통신하는 것을 가능하게 하기 위한 다중 송수신기를 포함할 수도 있다.
WTRU(102)의 프로세서(118)는 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)(예를 들면, 액정 디스플레이(LCD) 디스플레이 유닛 또는 유기 발광 다이오드(OLED) 디스플레이 유닛)에 결합될 수도 있고, 이들로부터 사용자 입력 데이터를 수신할 수도 있다. 프로세서(118)는 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)에 사용자 데이터를 또한 출력할 수도 있다. 또한, 프로세서(118)는 고정식 메모리(130) 및/또는 착탈식 메모리(132)와 같은 임의의 타입의 적절한 메모리로부터의 정보에 액세스할 수도 있고, 그 메모리에 데이터를 저장할 수도 있다. 고정식 메모리(130)는 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 하드 디스크, 또는 임의의 다른 타입의 메모리 저장 디바이스를 포함할 수도 있다. 착탈식 메모리(132)는 가입자 식별 모듈(SIM) 카드, 메모리 스틱, 시큐어 디지털(SD) 메모리 카드 등을 포함할 수도 있다. 다른 실시예에서는, 프로세서(118)는 서버 또는 홈 컴퓨터(도시 생략) 상과 같은 WTRU(102) 상에 물리적으로 위치하지 않는 메모리로부터의 정보에 액세스할 수도 있고 그 메모리에 데이터를 저장할 수도 있다.
프로세서(118)는 전원(134)으로부터 전력을 받아들일 수도 있고, WTRU(102) 내의 다른 구성요소에 전력을 분배 및/또는 제어하도록 구성될 수도 있다. 전원(134)은 WTRU(102)의 전력 공급을 위한 임의의 적절한 디바이스일 수도 있다. 예를 들면, 전원(134)은 하나 이상의 건전지 배터리(예를 들면, 니켈 카드뮴(NiCd), 니켈 아연(NiZn), 니켈 수소 합금(NiMH), 리튬 이온(Li-ion) 등), 태양 전지, 연료 전지 등을 포함할 수도 있다.
프로세서(118)는 또한, WTRU(102)의 현재 위치에 관한 위치 정보(예를 들면, 경도 및 위도)를 제공하도록 구성될 수도 있는 GPS 칩셋(136)에 결합될 수도 있다. GPS 칩셋(136)으로부터의 정보에 덧붙여서, 또는 그 대신에, WTRU(102)는 기지국(예를 들면, 기지국(114a, 114b))으로부터 무선 인터페이스(115/116/117)를 통해 위치 정보를 수신할 수도 있고/있거나 2 이상의 근처의 기지국으로부터 수신되고 있는 신호의 타이밍에 기초하여 그 위치를 결정할 수도 있다. WTRU(102)는 일 실시예와 일관성을 유지하면서 임의의 적절한 위치 결정 방법에 의해 위치 정보를 획득할 수도 있음이 이해될 것이다.
프로세서(118)는 추가의 특징, 기능 및/또는 유선 또는 무선 연결을 제공하는 하나 이상의 소프트웨어 및/또는 하드웨어 모듈을 포함할 수도 있는 다른 주변장치(138)에 추가로 결합될 수도 있다. 예를 들면, 주변장치(138)는 가속도계, 전자 나침반, 위성 송수신기, (사진 또는 비디오용) 디지털 카메라, 유니버설 시리얼 버스(USB) 포트, 진동 디바이스, 텔레비전 송수신기, 핸즈 프리 헤드셋, 블루투스(등록상표) 모듈, 주파수 변조(FM) 무선 유닛, 디지털 뮤직 플레이어, 미디어 플레이어, 비디오 게임 플레이어 모듈, 인터넷 브라우저 등을 포함할 수도 있다.
도 1c는 일 실시예에 따르는 RAN(103) 및 코어 네트워크(106)의 시스템도이다. 위에 언급한 바와 같이, RAN(103)은 무선 인터페이스(115)를 통해 WTRU(102a, 102b, 102c)와 통신하도록 UTRA 무선 기술을 채용할 수도 있다. RAN(103)은 또한 코어 네트워크(106)와 통신할 수도 있다. 도 1c에 도시된 바와 같이, RAN(103)은 무선 인터페이스(115)를 통해 WTRU(102a, 102b, 102c)와 통신하기 위한 하나 이상의 송수신기를 각각 포함할 수도 있는 Node-B(140a, 140b, 140c)를 포함할 수도 있다. Node-B(140a, 140b, 140c)는 각각 RAN(103) 내의 특정 셀(도시 생략)과 관련될 수도 있다. RAN(103)은 또한 RNC(142a, 142b)를 포함할 수도 있다. RAN(103)은 일 실시예와 일관성을 유지하면서 임의의 수의 Node-B 및 RNC를 포함할 수도 있음이 이해될 것이다.
도 1c에 도시된 바와 같이, Node-B(140a, 140b)는 RNC(142a)와 통신하고 있을 수도 있다. 또한, Node-B(140c)는 RNC(142b)와 통신하고 있을 수도 있다. Node-B(140a, 140b, 140c)는 Iub 인터페이스를 통해 각각의 RNC(142a, 142b)와 통신할 수도 있다. RNC(142a, 142b)는 Iur 인터페이스를 통해 서로 통신하고 있을 수도 있다. RNC(142a, 142b)의 각각은 그것이 연결되는 각각의 Node-B(140a, 140b, 140c)를 제어하도록 구성될 수도 있다. 또한, RNC(142a, 142b)의 각각은 외부 순환 전력 제어, 부하 제어, 진입(admission) 제어, 패킷 스케줄링, 핸드오버 제어, 매크로다이버시티(macrodiversity), 시큐리티 기능, 데이터 암호화 등과 같은 다른 기능을 수행하거나 지원하도록 구성될 수도 있다.
도 1c에 도시된 코어 네트워크(106)는 미디어 게이트웨이(MGW)(144), 이동 교환 센터(MSC: mobile switching center)(146), 서비스하는 GPRS 지원 노드(SGSN: serving GPRS support node)(148), 및/또는 게이트웨이 GPRS 지원 노드(GGSN)(150)를 포함할 수도 있다. 위의 요소의 각각이 코어 네트워크(106)의 부분으로서 도시되어 있지만, 이들 요소 중 어느 하나가 코어 네트워크 운영자와 다른 엔티티에 의해 소유 및/또는 운영될 수도 있음이 이해될 것이다.
RAN(103) 내의 RNC(142a)는 IuCS 인터페이스를 통해 코어 네트워크(106) 내의 MSC(146)에 연결될 수도 있다. MSC(146)는 MGW(144)에 연결될 수도 있다. MSC(146) 및 MGW(144)는 WTRU(102a, 102b, 102c)와 전통적인 랜드 라인 통신 디바이스 사이의 통신을 용이하게 하기 위해 PSTN(108)과 같은 회선 교환 네트워크에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다.
RAN(103) 내의 RNC(142a)는 또한, IuPS 인터페이스를 통해 코어 네트워크(106) 내의 SGSN(148)에 연결될 수도 있다. SGSN(148)은 GGSN(150)에 연결될 수도 있다. SGSN(148) 및 GGSN(150)은 WTRU(102a, 102b, 102c)와 IP 인에이블(IP-enabled) 디바이스 사이의 통신을 용이하게 하기 위해 인터넷(110)과 같은 패킷 교환 네트워크에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다.
위에 언급한 바와 같이, 코어 네트워크(106)는 또한, 다른 서비스 제공자에 의해 소유 및/또는 운영되는 다른 유선 또는 무선 네트워크를 포함할 수도 있는 네트워크(112)에 연결될 수도 있다.
도 1d는 일 실시예에 따르는 RAN(104) 및 코어 네트워크(107)의 시스템도이다. 위에 언급한 바와 같이, RAN(104)은 무선 인터페이스(116)를 통해 WTRU(102a, 102b, 102c)와 통신하도록 E-UTRA 무선 기술을 채용할 수도 있다. RAN(104)은 또한, 코어 네트워크(107)와 통신하고 있을 수도 있다.
RAN(104)은 eNode-B(160a, 160b, 160c)를 포함할 수도 있지만, RAN(104)은 일 실시예와의 일관성을 유지하면서 임의의 수의 eNode-B를 포함할 수도 있음이 이해될 것이다. eNode-B(160a, 160b, 160c)는 각각 무선 인터페이스(116)를 통해 WTRU(102a, 102b, 102c)와 통신하기 위한 하나 이상의 송수신기를 포함할 수도 있다. 일 실시예에서는, eNode-B(160a, 160b, 160c)는 MIMO 기술을 실현할 수도 있다. 그러므로, eNode-B(160a)는 예를 들면, WTRU(102a)로 무선 신호를 송신하고 WTRU(102a)로부터 무선 신호를 수신하기 위해 다중 안테나를 사용할 수도 있다.
eNode-B(160a, 160b, 160c)의 각각은 특정 셀(도시 생략)과 관련될 수도 있고, 무선 자원 관리 디시전(decision), 핸드오버 디시전, 업링크 및/또는 다운링크에서의 사용자의 스케줄링 등을 다루도록 구성될 수도 있다. 도 1d에 도시된 바와 같이, eNode-B(160a, 160b, 160c)는 X2 인터페이스를 통해 서로 통신할 수도 있다.
도 1d에 도시된 코어 네트워크(107)는 이동성 관리 게이트웨이(MME)(162), 서비스하는 게이트웨이(164), 및 패킷 데이터 네트워크(PDN) 게이트웨이(166)를 포함할 수도 있다. 상기 요소의 각각은 코어 네트워크(107)의 부분으로서 도시되어 있지만, 이들 요소 중의 어느 하나가 코어 네트워크 운영자와 다른 엔티티에 의해 소유 및/또는 운영될 수도 있음이 이해될 것이다.
MME(162)는 S1 인터페이스를 통해 RAN(104) 내의 eNode-B(160a, 160b, 160c)의 각각에 연결될 수도 있고 제어 노드로서의 역할을 할 수도 있다. 예를 들면, MME(162)는 WTRU(102a, 102b, 102c), 베어러 활성화/비활성화, WTRU(102a, 102b, 102c)의 초기 접속 동안 특별한 서비스하는 게이트웨이 등을 선택하는 사용자를 인증할 책임이 있을 수도 있다. MME(162)는 또한, GSM 또는 WCDMA와 같은 다른 무선 기술을 채용하는 다른 RAN(도시 생략)과 RAN(104) 사이의 스위칭을 위한 제어 평면(control plane) 기능을 제공할 수도 있다.
서비스하는 게이트웨이(164)는 S1 인터페이스를 통해 RAN(104) 내의 eNode-B(160a, 160b, 160c)의 각각에 연결될 수도 있다. 서비스하는 게이트웨이(164)는 일반적으로 WTRU(102a, 102b, 102c)로/로부터 사용자 데이터 패킷을 라우트(route) 및 포워드(forward)할 수도 있다. 서비스하는 게이트웨이(164)는 또한, eNode-B간 핸드오버 동안 사용자 평면을 앵커링(anchoring)하는 것, 다운링크 데이터가 WTRU(102a, 102b, 102c)에 대해 사용 가능할 때 페이징(paging)을 트리거링(triggering)하는 것, WTRU(102a, 102b, 102c)의 콘텍스트(context)를 관리 및 저장하는 것 등과 같은 다른 기능을 실행할 수도 있다.
서비스하는 게이트웨이(164)는 또한, WTRU(102a, 102b, 102c)와 IP 인에이블 디바이스 사이의 통신을 용이하게 하기 위해 인터넷(110)과 같은 패킷 교환 네트워크에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있는 PDN 게이트웨이(166)에 연결될 수도 있다.
코어 네트워크(107)는 다른 네트워크와의 통신을 용이하게 할 수도 있다. 예를 들면, 코어 네트워크(107)는 WTRU(102a, 102b, 102c)와 전통적인 랜드 라인 통신 디바이스 사이의 통신을 용이하게 하기 위해 PSTN(108)과 같은 회선 교환 네트워크에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다. 예를 들면, 코어 네트워크(107)는 코어 네트워크(107)와 PSTN(108) 사이의 인터페이스로서의 역할을 하는 IP 게이트웨이(예를 들면, IP 멀티미디어 서브시스템(IMS) 서버)를 포함할 수도 있거나, IP 게이트웨이와 통신할 수도 있다. 또한, 코어 네트워크(107)는 다른 서비스 제공자에 의해 소유 및/또는 운영되는 다른 유선 또는 무선 네트워크를 포함할 수도 있는 네트워크(112)에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다.
도 1e는 일 실시예에 따르는 RAN(105) 및 코어 네트워크(109)의 시스템도이다. RAN(105)은 무선 인터페이스(117)를 통해 WTRU(102a, 102b, 102c)와 통신하도록 IEEE 802.16 무선 기술을 채용하는 액세스 서비스 네트워크(ASN)일 수도 있다. 아래에 더욱 논의되는 바와 같이, WTRU(102a, 102b, 102c), RAN(105) 및 코어 네트워크(109)의 상이한 기능 엔티티 사이의 통신 링크는 기준 포인트로서 정의될 수도 있다.
도 1e에 도시된 바와 같이, RAN(105)은 기지국(180a, 180b, 180c) 및 ASN 게이트웨이(182)를 포함할 수도 있지만, RAN(105)은 일 실시예와의 일관성을 유지하면서 임의의 수의 기지국 및 ASN 게이트웨이를 포함할 수도 있음이 이해될 것이다. 기지국(180a, 180b, 180c)은 각각 RAN(105) 내의 특정 셀(도시 생략)과 관련될 수도 있고, 무선 인터페이스(117)를 통해 WTRU(102a, 102b, 102c)와 통신하기 위한 하나 이상의 송수신기를 각각 포함할 수도 있다. 일 실시예에서는, 기지국(180a, 180b, 180c)은 MIMO 기술을 실현할 수도 있다. 그러므로, 기지국(180a)은 예를 들면, WTRU(102a)에 무선 신호를 송신하고 WTRU(102a)로부터 무선 신호를 수신하도록 다중 안테나를 사용할 수도 있다. 기지국(180a, 180b, 180c)은 또한 핸드오프 트리거링, 터널 확립, 무선 자원 관리, 트래픽 분류, 서비스 품질(QoS) 정책 강화 등과 같은 이동성 관리 기능을 제공할 수도 있다. ASN 게이트웨이(182)는 트래픽 집중 포인트로서의 역할을 할 수도 있고 페이징, 가입자 프로파일의 캐싱(caching), 코어 네트워크(109)로의 라우팅 등에 책임이 있을 수도 있다.
WTRU(102a, 102b, 102c)와 RAN(105) 사이의 무선 인터페이스(117)는 IEEE 802.16 사양을 실현하는 R1 기준 포인트로서 정의될 수도 있다. 또한, WTRU(102a, 102b, 102c)의 각각은 코어 네트워크(109)와의 논리 인터페이스(도시 생략)를 확립할 수도 있다. WTRU(102a, 102b, 102c)와 코어 네트워크(109) 사이의 논리 인터페이스는 R2 기준 포인트로서 정의될 수도 있고, 이것이 인증, 인가, IP 호스트 구성 관리, 및/또는 이동성 관리를 위해 사용될 수도 있다.
각각의 기지국(180a, 180b, 180c) 사이의 통신 링크는 WTRU 핸드오버 및 기지국들 사이의 데이터의 전송을 용이하게 하기 위한 프로토콜을 포함하는 R8 기준 포인트로서 정의될 수도 있다. 기지국(180a, 180b, 180c)과 ASN 게이트웨이(182) 사이의 통신 링크는 R6 기준 포인트로서 정의될 수도 있다. R6 기준 포인트는 WTRU(102a, 102b, 102c)의 각각과 관련된 이동성 이벤트에 기초하여 이동성 관리를 용이하게 하기 위한 프로토콜을 포함할 수도 있다.
도 1e에 도시된 바와 같이, RAN(105)은 코어 네트워크(109)에 연결될 수도 있다. RAN(105)과 코어 네트워크(109) 사이의 통신 링크는 예를 들면, 데이터 전송 및 이동성 관리 능력을 용이하게 하기 위한 프로토콜을 포함하는 R3 기준 포인트로서 정의될 수도 있다. 코어 네트워크(109)는 모바일 IP 홈 에이전트(MIP-HA)(184), 인증, 인가, 회계(AAA) 서버(186) 및 게이트웨이(188)를 포함할 수도 있다. 상기 요소의 각각이 코어 네트워크(109)의 부분으로서 도시되어 있지만, 이들 요소 중 어느 하나가 코어 네트워크 운영자와 다른 엔티티에 의해 소유 및/또는 운영될 수도 있음이 이해될 것이다.
MIP-HA는 IP 어드레스 관리에 책임이 있을 수도 있고, WTRU(102a, 102b, 102c)가 상이한 ASN 및/또는 상이한 코어 네트워크 사이에서 로밍하는(roam) 것이 가능하게 할 수도 있다. MIP-HA(184)는 WTRU(102a, 102b, 102c)와 IP 인에이블 디바이스 사이의 통신을 용이하게 하기 위해 인터넷(110)과 같은 패킷 교환 네트워크에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다. AAA 서버(186)는 사용자 인증에 및 사용자 서비스를 지원할 책임이 있을 수도 있다. 게이트웨이(188)는 다른 네트워크와의 상호 연동을 용이하게 할 수도 있다. 예를 들면, 게이트웨이(188)는 WTRU(102a, 102b, 102c)와 전통적인 랜드 라인 통신 디바이스 사이의 통신을 용이하게 하기 위해 PSTN(108)과 같은 회선 교환 네트워크에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다. 또한, 게이트웨이(188)는 다른 서비스 제공자에 의해 소유 및/또는 운영되는 다른 유선 또는 무선 네트워크를 포함할 수도 있는 네트워크(112)에의 액세스를 WTRU(102a, 102b, 102c)에 제공할 수도 있다.
도 1e에 도시되지는 않았지만, RAN(105)이 다른 ASN에 연결될 수도 있고 코어 네트워크(109)가 다른 코어 네트워크에 연결될 수도 있음이 이해될 것이다. RAN(105)과 다른 ASN 사이의 통신 링크는 RAN(105)과 다른 ASN 사이에서 WTRU(102a, 102b, 102c)의 이동성을 조정하기 위한 프로토콜을 포함할 수도 있는 R4 기준 포인트로서 정의될 수도 있다. 코어 네트워크(109)와 다른 코어 네트워크 사이의 통신 링크는 홈 코어 네트워크와 방문 코어 네트워크 사이의 상호 연동을 용이하게 하기 위한 프로토콜을 포함할 수도 있는 R5 기준 포인트로서 정의될 수도 있다.
유선 및 무선 네트워크(예를 들면, 3G, WiFi, 인터넷, 도 1a∼1e에 도시된 네트워크 등)에서의 스트리밍은 네트워크에서의 가변 대역폭으로 인해 적응성을 수반할 수도 있다. 예를 들면, 미디어가 클라이언트에 스트리밍되는 속도가 가변 네트워크 조건에 적응할 수도 있는 대역폭 적응 스트리밍이 이용될 수도 있다. 대역폭 적응 스트리밍은 클라이언트가 미디어가 수신되는 속도를 자신의 가변하는 사용 가능한 대역폭에 더 잘 매치하는 것을 가능하게 할 수도 있다.
대역폭 적응 스트리밍 시스템에서, 콘텐트 제공자는 예를 들면, 도 2에 도시된 바와 같이, 하나 이상의 상이한 비트레이트로 동일한 콘텐트를 제공할 수도 있다. 도 2는 상이한 비트레이트에서 인코딩된 콘텐트의 일례를 도시하는 도면이다. 콘텐트(201)는 예를 들면, 인코더(202)에 의해 다수의 목표 비트레이트(예를 들면, r1, r2, ..., rM)로 인코딩될 수도 있다. 이들 목표 비트레이트를 달성하기 위해, 화질 또는 SNR(예를 들면, 비디오), 프레임 해상도(예를 들면, 비디오), 프레임 레이트(예를 들면, 비디오), 샘플링 레이트(예를 들면, 오디오), 다수의 채널(예를 들면, 오디오), 또는 코덱(codec)(예를 들면, 비디오 및 오디오)와 같은 파라미터가 변할 수도 있다. 기술(description) 파일(예를 들면, 매니페스트(manifest) 파일이라고 칭해질 수도 있음)은 콘텐트 및 그 다중 표현(multiple representations)과 관련된 기술 정보 및 메타데이터를 제공할 수도 있고, 이는 하나 이상의 상이한 사용 가능한 레이트의 선택을 가능하게 할 수도 있다.
다중 레이트에서의 콘텐트의 발행은 도전 예를 들면, 생산의 증가, 품질 보증 관리, 보관 비용 등을 제기할 수도 있다. 다수의 레이트/해상도(예를 들면, 3, 4, 5 등)이 사용 가능하게 만들어질 수도 있다.
도 3은 대역폭 적응 스트리밍의 일례를 도시하는 도면이다. 멀티미디어 스트리밍 시스템은 대역폭 적응을 지원할 수도 있다. 스트리밍 미디어 플레이어(예를 들면, 스트리밍 클라이언트)는 미디어 콘텐트 기술자로부터 사용 가능한 비트레이트에 관해 알게 될 수도 있다. 스트리밍 클라이언트는 네트워크(301)의 사용 가능한 대역폭을 측정 및/또는 추정할 수도 있고, 상이한 비트레이트(302)로 인코딩된 미디어 콘텐트의 세그먼트를 요청함으로써 스트리밍 세션을 제어할 수도 있다. 이것은 예를 들면, 도 3에 도시된 바와 같이, 멀티미디어 콘텐트의 재생 동안 대역폭 변동에 스트리밍 클라이언트가 적응하는 것이 가능하게 할 수도 있다. 클라이언트는 버퍼 레벨, 에러 레이트, 지연 지터(delay jitter) 등 중 하나 이상에 기초하여 사용 가능한 대역폭을 측정 및/또는 추정할 수도 있다. 클라이언트는 예를 들면, 대역폭에 덧붙여서 사용할 레이트 및/또는 세그먼트에 대한 판단을 할 때 시청 조건과 같은 다른 요인을 고려할 수도 있다.
스트림 스위칭 동작은 예를 들면, 클라이언트 또는 네트워크 피드백에 기초하여 서버에 의해 제어될 수도 있다. 이 모델은 예를 들면, RTP/RTSP 프로토콜을 기초로 하는 스트리밍 기술로 사용될 수도 있다.
액세스 네트워크의 대역폭은 예를 들면, 사용되는 하위 기술(예를 들면, 표 1에 도시된 바와 같음)로 인해 및/또는 사용자의 수, 위치, 신호 강도 등으로 인해 변할 수도 있다. 표 1은 액세스 네트워크의 피크 대역폭의 일례를 도시한다.
액세스 기술 피크 대역폭의 예
무선

2.5G 32 kbps
3G 5 Mbps
LTE 50 Mbps
WiFi

802.11b 5 Mbps
802.11g 54 Mbps
802.11n 150 Mbps
인터넷

다이얼 업 64 kbps
DSL 3 Mbps
섬유 1 Gbps
콘텐트가 상이한 사이즈를 갖는 스크린 상에서 예를 들면, 스마트폰, 태블릿, 랩톱 및 예컨대, HDTV와 같은 더 큰 스크린 상에서 시청될 수도 있다. 표 2는 멀티미디어 스트리밍 능력을 포함할 수도 있는 다양한 디바이스의 샘플 스크린 해상도의 일례를 도시한다. 작은 수의 레이트를 제공하면 다양한 클라이언트에게 좋은 사용자 경험을 충분히 제공하지 못할 수도 있다.
디바이스 스크린 해상도
스마트폰

HTC Desire 800 × 480
iPhone 960 × 640
Galaxy Nexus 1280 × 720
태블릿

Galaxy Tab 1024 × 600
iPad 1,2 1024 × 768
iPad 3 2048 × 1536
랩톱

노트북 1024 × 600
미드 레인지 랩톱 1366 × 758
하이 엔드 랩톱 1920 × 1080
HDTVs

720p 1280 × 720
1080p 1920 × 1080
4K, 울트라 HD (UHD) 4096 × 2160
본 명세서에 설명되는 실현예에 의해 이용될 수도 있는 스크린 해상도의 일례가 표 3에 나열된다.
이름(들) 스크린 해상도
240p QVGA 320 × 240
360p 640 × 360
480p VGA 640 × 480
720p 1280 × 720
1080p 풀 HD 1920 × 1080
4K 울트라 HD (UHD) 4096 × 2160
예를 들면, YouTube(등록 상표), iTunes(등록 상표), Hulu(등록 상표) 등과 같은 콘텐트 제공자는 멀티미디어 콘텐트를 배포하기 위해 HTTP 프로그레시브(progressive) 다운로드를 사용할 수도 있다. HTTP 프로그레시브 다운로드는 재생될 수 있기 전의 (예를 들면, 부분적으로 또는 완전히) 다운로드되고 있는 콘텐트를 포함할 수도 있다. HTTP를 사용한 배포는 방화벽에 의해 차단되지 못할 수도 있는 인터넷 트랜스포트 프로토콜일 수도 있다. 예를 들면, RTP/RTSP 또는 멀티캐스팅과 같은 다른 프로토콜이 방화벽에 의해 차단될 수도 또는 인터넷 서비스 제공자에 의해 디스에이블될(disabled) 수도 있다. 프로그레시브 다운로드는 대역폭 적응을 지원하지 않을 수도 있다. HTTP를 통한 대역폭 적응 멀티미디어 스트리밍을 위한 기술이 패킷 네트워크를 통해 라이브(live) 및 주문형 콘텐트를 배포하기 위해 개발될 수도 있다.
미디어 표시가 예를 들면, HTTP를 통한 대역폭 적응 스트리밍 시에, 하나 이상의 비트레이트로 인코딩될 수도 있다. 미디어 표시의 인코딩은 예를 들면, 도 4에 도시된 바와 같이, 더 짧은 지속기간의 하나 이상의 세그먼트로 분할될 수도 있다. 도 4는 인코더(402)에 의해 상이한 비트 레이트로 인코딩되는 및 세그먼트로 분할되는 콘텐트(401)의 일례를 도시하는 도면이다. 클라이언트는 예를 들면, 레이트 적응을 제공할 수도 있는 자신의 현재의 조건에 가장 잘 매치하는 비트레이트로 세그먼트를 요청하도록 HTTP를 사용할 수도 있다.
도 5는 HTTP 스트리밍 세션(500)의 일례를 도시하는 도면이다. 예를 들면, 도 5는 스트리밍 세션 동안 클라이언트와 HTTP 서버 사이의 상호작용의 시퀀스의 일례를 도시할 수도 있다. 기술/매니페스트 파일 및 하나 이상의 스트리밍 세그먼트가 HTTP GET 요청에 의해 획득될 수도 있다. 기술/매니페스트 파일은 예를 들면, URL을 통해 세그먼트들의 위치를 특정할 수도 있다.
대역폭 적응형 HTTP 스트리밍 기술은 예를 들면, HTTP 라이브(Live) 스트리밍(HLS), 원활한(Smooth) 스트리밍, HTTP 다이나믹(Dynamic) 스트리밍, HTTP 적응형 스트리밍(HAS), 및 적응형 HTTP 스트리밍(AHS)을 포함할 수도 있다.
다이나믹 적응형 HTTP 스트리밍(DASH)은 HTTP 스트리밍을 위한 여러 가지 방법을 결합시킬 수도 있다. DASH는 무선 및 유선 네트워크에서의 가변 대역폭에 대처하도록 사용될 수도 있다. DASH는 막대한 수의 콘텐트 제공자 및 디바이스에 의해 지원될 수도 있다.
도 6은 DASH 고레벨 시스템 아키텍처(600)의 일례를 도시하는 도면이다. DASH는 적절한 포맷으로 준비된 라이브 또는 주문형 콘텐트(605)를 배포하는 HTTP 서버(602)의 세트로서 배치될 수도 있다. 클라이언트(601)는 예를 들면, 도 6에 도시된 바와 같이 인터넷(604)을 통해 콘텐트 배포 네트워크(CDN)(603)로부터 및/또는 DASH HTTP 서버(602)로부터 직접 콘텐트에 액세스할 수도 있다. CDN이 콘텐트를 캐시(cache)할 수도 있고, 네트워크의 에지에서 클라이언트 근처에 위치할 수도 있기 때문에, CDN(603)은 예를 들면, 막대한 수의 클라이언트가 예상되는 경우의 배치에 사용될 수도 있다. 클라이언트(601)는 WTRU일 수 있고/있거나 WTRU 예를 들면, 도 1b에 도시된 바와 같은 WTRU 상에 상주할 수도 있다. CDN(603)은 도 1a∼1e에 도시되는 하나 이상의 요소를 포함할 수도 있다.
DASH에서, 스트리밍 세션은 HTTP를 이용하여 세그먼트를 요청하고 그 세그먼트가 콘텐트 제공자 및/또는 CDN(603)으로부터 수신되기 때문에 세그먼트를 함께 접착함으로써 클라이언트(601)에 의해 제어될 수도 있다. 클라이언트(601)는 예를 들면, 네트워크로부터 클라이언트(601)로 정보(intelligence)를 효과적으로 이동시키기 위해, 예를 들면, 네트워크 조건(예를 들면, 패킷 에러 레이트, 지연 지터 등) 및/또는 클라이언트(601)의 상태(예를 들면, 버퍼 충전(fullness), 사용자 행동(behavior) 및 선호(preference) 등)에 기초하여 미디어 레이트를 모니터(예를 들면, 지속적으로 모니터) 및 조정할 수도 있다.
도 7은 DASH 클라이언트 모드의 일례를 도시하는 도면이다. DASH 클라이언트 모드는 유용한 정보를 제공하는 클라이언트 모델을 기초로 할 수도 있다. DASH 액세스 엔진(701)은 미디어 표시 기술(MPD) 파일(702)을 수신하여 구성하고 요청을 발행할 수도 있고/있거나 하나 이상의 세그먼트 및/또는 세그먼트(703)의 부분을 수신할 수도 있다. DASH 액세스 엔진(701)의 출력은 예를 들면, 미디어의 내부 타이밍을 표시의 타임라인(timeline)에 맵핑시키는(map) 타이밍 정보와 함께, MPEG 컨테이너 포맷(예를 들면, MP4 파일 포맷 또는 MPEG-2 트랜스포트 스트림)으로 미디어를 포함할 수도 있다. 미디어의 인코딩된 청크(chunks)와 타이밍 정보의 조합은 콘텐트의 정확한 렌더링(rendering)에 충분할 수도 있다.
도 8은 DASH 미디어 표시 고레벨 데이터 모델(800)의 일례를 도시하는 도면이다. DASH에서, 멀티미디어 표시의 구성은 예를 들면, 도 8에 도시되는 바와 같이 계층적인 데이터 모델을 기초로 할 수도 있다. MPD 파일은 DASH 미디어 표시(예를 들면, 멀티미디어 콘텐트)를 생성할 수도 있는 기간의 시퀀스를 기술할 수도 있다. 기간은 미디어 콘텐트 기간이라 칭할 수도 있고, 그 기간 동안 일관된 세트의 암호화된 버전의 미디어 콘텐트가 사용 가능하게 될 수도 있다. 예를 들면, 사용 가능한 비트레이트, 언어, 자막 등의 세트가 기간 동안 변하지 않을 수도 있다.
적응형 세트는 하나 이상의 미디어 콘텐트 구성요소의 상호 변경 가능한 인코딩된 버전의 세트를 칭할 수도 있다. 예를 들면, 비디오용, 주요 오디오용, 보조 오디오용, 자막용 등의 적응형 세트가 존재할 수도 있다. 적응형 세트는 다중화될 수도 있다. 다중화의 상호 변경 가능한 버전은 단일 적응형 세트로서 기술될 수도 있다. 예를 들면, 적응형 세트는 일정 기간 동안 비디오 및 메인 오디오의 양자를 포함할 수도 있다.
표시는 하나 이상의 미디어 콘텐트 구성요소의 배송 가능한 인코딩된 버전을 칭할 수도 있다. 표시는 하나 이상의 미디어 스트림(예를 들면, 다중화 시에 각각의 미디어 콘텐트 구성요소에 대한 것)을 포함할 수도 있다. 적응형 세트 내의 표시는 미디어 콘텐트 구성요소를 렌더링하기에 충분할 수도 있다. 클라이언트는 네트워크 조건 및/또는 다른 요인에 적응하기 위해 적응형 세트 내에서 표시에서 표시로 스위치할 수도 있다. 클라이언트는 클라이언트가 지원하지 않는 코덱, 프로파일, 및/또는 파라미터를 사용하는 표시를 무시할 수도 있다.
표시 내의 콘텐트는 고정 또는 가변 길이의 하나 이상의 세그먼트로 시분할될 수도 있다. URL이 세그먼트마다(예를 들면, 각 세그먼트마다) 제공될 수도 있다. 세그먼트는 단일 HTTP 요청에 의해 검색될 수 있는 가장 큰 데이터의 단위일 수도 있다.
미디어 표시 기술(MPD) 파일은 하나 이상의 세그먼트에 액세스하도록 및/또는 스트리밍 서비스를 사용자에게 제공하도록 적절한 HTTP-URL을 구성하기 위해 DASH 클라이언트에 의해 사용될 수도 있는 메타데이터를 포함하는 XML 문서일 수도 있다. MPD 파일 내의 베이스 URL은 미디어 표시 내의 하나 이상의 세그먼트 및/또는 다른 자원에 대한 HTTP GET 요청을 생성하도록 클라이언트에 의해 사용될 수도 있다. HTTP 부분 GET 요청은 예를 들면, 바이트 범위를 사용함으로써(예를 들면, '범위' HTTP 헤더를 통해) 세그먼트의 제한된 부분에 액세스하기 위해 사용될 수도 있다. 대체의 베이스 URL은 위치가 사용 불가능한 경우에 표시에 액세스하는 것이 가능하도록 특정될 수도 있다. 대체의 베이스 URL은 예를 들면, 클라이언트측 부하 균형(load balancing) 및/또는 병렬 다운로드를 가능하게 할 수도 있는 멀티미디어 스트림의 배송에 중복성(redundancy)을 제공할 수도 있다.
MPD 파일은 정적 또는 동적인 타입으로 될 수도 있다. 정적 MPD 파일 타입은 미디어 표시 동안 변화하지 못할 수도 있다. 정적 MPD 파일은 주문형 표시용으로 사용될 수도 있다. 동적 MPD 파일 타입은 미디어 표시 동안 업데이트될 수도 있다. 동적 MPD 파일 타입은 라이브 표시용으로 사용될 수도 있다. MPD 파일은 예를 들면, 표시를 위한 세그먼트의 리스트를 확장하도록, 새로운 기간을 도입하도록, 미디어 표시를 종결하도록, 및/또는 타임라인을 처리 또는 조정하도록 업데이트될 수도 있다.
DASH에서, 상이한 미디어 콘텐트 구성요소(예컨대, 비디오, 오디오)의 인코딩된 버전은 공통 타임라인을 공유할 수도 있다. 미디어 콘텐트 내의 액세스 유닛의 표시 시간은 미디어 표시 타임라인이라고 칭해질 수도 있는 글로벌 공통 표시 타임라인에 맵핑될 수도 있다. 미디어 표시 타임라인은 상이한 미디어 구성요소의 동기화를 감안할 수도 있다. 미디어 표시 타임라인은 동일한 미디어 구성요소의 상이한 코딩된 버전(예를 들면, 표시)의 심리스(seamless) 스위칭을 가능하게 할 수도 있다.
세그먼트는 실제 분할된 미디어 스트림을 포함할 수도 있다. 세그먼트는 예를 들면, 표시를 다른 표시와 스위칭 및 동기화하기 위해 미디어 스트림을 미디어 표시 타임라인에 맵핑시키는 방법에 관한 추가의 정보를 포함할 수도 있다.
세그먼트 사용 가능 타임라인이 특정된 HTTP URL에서 하나 이상의 세그먼트의 사용 가능 시간을 클라이언트에게 신호하기 위해 사용될 수도 있다. 사용 가능 시간은 벽시계 시간으로 제공될 수도 있다. 클라이언트는 예를 들면, 특정된 HTTP URL에서 세그먼트에 액세스하기 전에, 벽시계 시간을 세그먼트 사용 가능 시간에 비교할 수도 있다.
하나 이상의 세그먼트의 사용 가능 시간은 예를 들면, 주문형 콘텐트마다 동일할 수도 있다. 미디어 표시의 세그먼트(예를 들면, 모든 세그먼트)는 세그먼트 중 하나가 사용 가능하면 서버 상에서 사용 가능하게 될 수도 있다. MPD 파일은 정적인 문서일 수도 있다.
하나 이상의 세그먼트의 사용 가능 시간은 예를 들면, 라이브 콘텐트용의 미디어 표시 타임라인 내의 세그먼트의 위치에 의존할 수도 있다. 세그먼트는 콘텐트가 생성되는 동안의 시간에 의해 사용 가능하게 될 수도 있다. MPD 파일은 시간 경과에 따른 표시의 변화를 반영하도록 (예를 들면, 주기적으로) 업데이트될 수도 있다. 예를 들면, 하나 이상의 새로운 세그먼트용의 하나 이상의 세그먼트 URL이 MPD 파일에 부가될 수도 있다. 더 이상 사용 가능하지 않은 세그먼트는 MPD 파일로부터 제거될 수도 있다. MPD 파일은 업데이트하는 것은 예를 들어, 세그먼트 URL이 템플릿(template)을 사용하여 기술되는 경우 필요 없게 될 수도 있다.
세그먼트의 지속기간은 예를 들어, 정상 속도로 표시될 때, 세그먼트 내에 포함되는 미디어의 지속기간을 나타낼 수도 있다. 표시 내의 세그먼트는 동일하거나 거의 동일한 지속기간을 가질 수도 있다. 세그먼트 지속기간은 표시마다 상이할 수도 있다. DASH 표시는 하나 이상의 짧은 세그먼트(예를 들면, 2∼8초) 및/또는 하나 이상의 더 긴 세그먼트로 구성될 수도 있다. DASH 표시는 전체 표시에 대해 하나의 세그먼트를 포함할 수도 있다.
짧은 세그먼트가 (종단간 레이턴시(end-to-end latency)를 감소시킴으로써) 라이브 콘텐트용으로 적합할 수도 있고, 세그먼트 레벨에서 높은 스위칭 입상도를 감안할 수도 있다. 긴 세그먼트는 표시 내의 파일의 수를 감소시킴으로써 캐시 성능을 향상시킬 수도 있다. 긴 세그먼트는, 예컨대 바이트 범위 요청(byte range request)들에 의해, 유연한 요청 사이즈를 클라이언트가 만들게 할 수 있다. 긴 세그먼트의 사용은 세그먼트 인덱스의 사용을 강요할 수도 있다.
세그먼트는 시간의 경과에 따라 확장되지 않을 수도 있다. 세그먼트는 전부 사용 가능하게 만들어질 수도 있는 완전한 및 별개의 유닛일 수도 있다. 세그먼트는 영화 단편(movie fragment)이라고 칭해질 수도 있다. 세그먼트는 서브 세그먼트로 세분할될 수도 있다. 서브 세그먼트는 정수개의 완전한 액세스 유닛을 포함할 수도 있다. 액세스 유닛은 할당된 미디어 표시 시간을 갖는 미디어 스트림의 단위일 수도 있다. 세그먼트가 하나 이상의 서브 세그먼트로 분할되는 경우, 세그먼트는 세그먼트 인덱스에 의해 기술될 수도 있다. 세그먼트 인덱스는 표시 내의 표시 시간 범위 및/또는 각 버스 세그먼트에 의해 점유되는 세그먼트 내의 대응하는 바이트 범위를 제공할 수도 있다. 클라이언트는 사전에 세그먼트 인덱스를 다운로드할 수도 있다. 클라이언트는 HTTP 부분 GET 요청을 사용하여 개별 서브 세그먼트 요청을 발행할 수도 있다. 세그먼트 인덱스는 미디어 세그먼트 내에 예를 들면, 파일의 선두에 포함될 수도 있다. 세그먼트 인덱스 정보는 하나 이상의 인덱스 세그먼트(예를 들면, 별개의 인덱스 세그먼트)에 제공될 수도 있다.
DASH는 복수의(예를 들면, 4개의) 타입의 세그먼트를 이용할 수도 있다. 세그먼트의 타입은 초기화 세그먼트, 미디어 세그먼트, 인덱스 세그먼트 및/또는 비트스트림 스위칭 세그먼트를 포함할 수도 있다. 초기화 세그먼트는 표시에 액세스하기 위한 초기화 정보를 포함할 수도 있다. 초기화 세그먼트는 할당된 표시 시간을 갖는 미디어 데이터를 포함하지 않을 수도 있다. 초기화 세그먼트는 포함된 표시의 미디어 세그먼트의 플레이 아웃(play-out)을 가능하게 하기 위해 미디어 엔진을 초기화시키도록 클라이언트에 의해 처리될 수도 있다.
미디어 세그먼트는 표시의 초기화 세그먼트에 의해 기술될 수도 있는 및/또는 이 미디어 세그먼트에 의해 기술될 수도 있는 하나 이상의 미디어 스트림을 포함 및/또는 캡슐화할 수도 있다. 미디어 세그먼트는 하나 이상의 완전한 액세스 유닛을 포함할 수도 있다. 미디어 세그먼트는 예를 들면, 포함된 각 미디어 스트림에 대해 적어도 하나의 스트림 액세스 포인트(SAP)를 포함할 수도 있다.
인덱스 세그먼트는 하나 이상의 미디어 세그먼트에 관련된 정보를 포함할 수도 있다. 인덱스 세그먼트는 하나 이상의 미디어 세그먼트에 대한 인덱싱 정보를 포함할 수도 있다. 인덱스 세그먼트는 하나 이상의 미디어 세그먼트에 대한 정보를 제공할 수도 있다. 인덱스 세그먼트는 특정의 미디어 포맷일 수도 있다. 더 많은 세부 사항이 인덱스 세그먼트를 지원하는 미디어 포맷에 대해 정의될 수도 있다.
비트스트림 스위칭 세그먼트는 할당된 표시로의 스위칭을 위한 데이터를 포함할 수도 있다. 비트스트림 스위칭 세그먼트는 특정의 미디어 포맷일 수도 있다. 더 많은 세부 사항이 비트스트림 스위칭 세그먼트를 지원하는 미디어 포맷에 대해 정의될 수도 있다. 하나의 비트스트림 스위칭 세그먼트가 각 표시마다 정의될 수도 있다.
클라이언트는 예를 들면, 미디어 내의 임의의 포인트에서 적응형 세트 내의 표시에서 표시로 스위치할 수도 있다. 임의의 위치에서의 스위칭은 예를 들면, 표시 내에서의 코딩 종속성으로 인해 복잡할 수도 있다. 중첩하는 데이터 예를 들면, 다수의 표시로부터 동일한 시간 기간 동안의 미디어의 다운로드가 실행될 수도 있다. 스위칭은 새로운 스트림 내의 랜덤 액세스 포인트에서 실행될 수도 있다.
DASH는 스트림 액세스 포인트(SAP)의 코텍 독립 개념을 정의할 수도 있고/있거나 SAP의 하나 이상의 타입을 식별할 수도 있다. 스트림 액세스 포인트 타입은 예를 들어, 적응형 세트 내의 모든 세그먼트가 동일한 SAP 타입을 갖는다고 가정하면, 적응형 세트의 성질 중 하나로서 통신될 수도 있다. SAP는 하나 이상의 미디어 스트림의 파일 컨테이너로의 랜덤 액세스를 가능하게 할 수도 있다. SAP는 예를 들면, 그 위치로부터 시작하여 앞으로 컨테이너에 포함되는 정보를 사용하여 식별된 미디어 스트림의 재생이 시작될 수 있게 하는 컨테이너 내의 위치일 수도 있다. 컨테이너의 다른 부분으로부터 및/또는 과도하게 사용 가능하게 될 수도 있는 초기화 데이터가 사용될 수도 있다. SAP는 예를 들면, DASH 내의 스트림 간의 연결일 수도 있다. 예를 들면, SAP는 클라이언트가 예를 들면, 다른 표시로부터 표시로 스위치할 수도 있는 표시 내의 위치를 특징으로 할 수도 있다. SAP는 SAP를 따른 스트림의 접합(catenation)이 정확하게 디코드 가능한 데이터 스트림(예를 들면, MPEG 스트림)을 생성할 수도 있는 것을 보증할 수도 있다.
TSAP는 예를 들면, TSAP 이상의 표시 시간을 갖는 미디어 스트림의 액세스 유닛이 ISAP 이전의 데이터를 사용하지 않고 ISAP에서 시작하는 비트스트림 내의 데이터를 사용하여 정확하게 디코딩될 수 있도록 하기 위해, 미디어 스트림의 임의의 액세스 유닛의 가장 빠른 표시 시간일 수도 있다. ISAP는 예를 들면, TSAP 이상의 표시 시간을 갖는 미디어 스트림의 액세스 유닛이 ISAP 이전의 데이터를 사용하지 않고 ISAP에서 시작하는 비트스트림 데이터를 사용하여 정확하게 디코딩될 수 있도록 하기 위해, 비트스트림 내의 가장 큰 위치일 수도 있다. ISAU는 예를 들면, TSAP 이상의 표시 시간을 갖는 미디어 스트림의 액세스 유닛이 최근의 액세스 유닛 및 디코딩 순서에서 다음의 액세스 유닛을 사용하여 및 디코딩 순서에서 더 빠른 액세스 유닛은 사용하지 않고 정확하게 디코딩될 수 있도록 하기 위해 미디어 스트림 내의 디코딩 순서에서 최근의 액세스 유닛의 비트스트림 내의 시작 위치일 수도 있다.
TDEC는 ISAU에서 시작하는 비트스트림 내의 데이터를 사용하여 및 ISAU 이전의 임의의 데이터 없이 정확하게 디코딩될 수도 있는 미디어 스트림의 액세스 유닛의 가장 빠른 표시 시간일 수도 있다. TEPT는 비트스트림 내의 ISAU에서 시작하는 미디어 스트림의 액세스 유닛의 가장 빠른 표시 시간일 수도 있다. TPTF는 ISAU에서 시작하는 비트스트림 내의 디코딩 순서에서 미디어 스트림의 제1 액세스 유닛의 표시 시간일 수도 있다.
도 9는 스트림 액세스 포인트(SAP)의 파라미터의 예를 도시하는 도면이다. 도 9의 예는 3개의 상이한 타입의 프레임: I 프레임, P 프레임 및 B 프레임을 갖는 인코딩된 비디오 스트림의 일례를 도시한다. P 프레임은 디코딩될 이전의 I 또는 P 프레임을 이용할 수도 있다. B 프레임은 이전 및 이후의 I 또는 P 프레임을 이용할 수도 있다. I 프레임, P 프레임 및/또는 B 프레임의 송신, 디코딩 및/또는 표시 순서에 차이가 있을 수도 있다.
복수의(예를 들면, 6개의) SAP 타입이 정의될 수도 있다. 상이한 SAP 타입의 사용은 프로파일에 기초하여 제한될 수도 있다. 예를 들면, 타입 1, 2 및 3의 SAP가 일부 프로파일에 감안될 수도 있다. SAP의 타입은 어느 액세스 유닛이 정확하게 디코딩 가능하게 될 수 있는지 및/또는 액세스 유닛의 표시 순서의 배열에 의존할 수도 있다.
도 10은 타입 1 SAP(1000)의 일례를 도시하는 도면이다. 타입 1 SAP는 아래: TEPT = TDEC = TSAP = TPFT에 의해 기술될 수도 있다. 타입 1 SAP는 "폐쇄된 GoP 랜덤 액세스 포인트"에 대응할 수도 및/또는 "폐쇄된 GoP 랜덤 액세스 포인트"로 칭해질 수도 있다. (예를 들면, 디코딩 순서에서) ISAP로부터 시작하는 액세스 유닛이 타입 1 SAP에서 정확하게 디코딩될 수도 있다. 그 결과는 어떠한 갭 없이 정확하게 디코딩된 액세스 유닛의 연속적인 시간 시퀀스일 수도 있다. 디코딩 순서에서의 제1 액세스 유닛은 표시 순서에서의 제1 액세스 유닛일 수도 있다.
도 11은 타입 2 SAP(1100)의 일례를 도시하는 도면이다. 타입 2 SAP는 아래: TEPT = TDEC = TSAP < TPFT에 의해 기술될 수도 있다. 타입 2 SAP는 "폐쇄된 GoP 랜덤 액세스 포인트"에 대응할 수도 및/또는 "폐쇄된 GoP 랜덤 액세스 포인트"로 칭해질 수도 있으며, 여기에서 ISAU로부터 시작하는 미디어 스트림 내의 디코딩 순서에서의 제1 액세스 유닛은 표시 순서에서의 제1 액세스 유닛이 아닐 수도 있다. 제1 프레임(예를 들면, 제1의 2개의 프레임)은 역방향 예측 P 프레임(예를 들면, 순방향 전용 B 프레임(forward-only B-frames)으로서 구문적으로(syntactically) 코딩될 수도 있음)일 수도 있고, 디코딩될 후속 프레임(예를 들면, 제3 프레임)을 이용할 수도 있다.
도 12는 타입 3 SAP(1200)의 일례를 도시하는 도면이다. 타입 3 SAP는 아래: TEPT < TDEC = TSAP <= TPFT에 의해 기술될 수도 있다. 타입 3 SAP는 "폐쇄된 GoP 랜덤 액세스 포인트"에 대응할 수도 및/또는 "개방된 GoP 랜덤 액세스 포인트"로 칭해질 수도 있으며, 예를 들면, 여기에서 정확하게 디코딩되지 않을 수도 있는 및/또는 TSAP 미만인 표시 시간을 가질 수도 있는 ISAU 이후의 디코딩 순서에서의 액세스 유닛이 존재할 수도 있다.
도 13은 3 프레임의 지속기간 및 6 프레임의 간격을 갖는 점진적 디코딩 리프레시(GDR)의 일례를 도시하는 도면이다. 타입 4 SAP는 아래: TEPT <= TPFT < TDEC = TSAP에 의해 기술될 수도 있다. 타입 4 SAP는 "점진적 디코딩 리프레시(GDR) 랜덤 액세스 포인트"(예를 들면, "더티(dirty)" 랜덤 액세스)에 대응할 수도 및/또는 "점진적 디코딩 리프레시(GDR) 랜덤 액세스 포인트"로 칭해질 수도 있으며, 예를 들면, 여기에서 정확하게 디코딩되지 않을 수도 있는 및/또는 TSAP 미만인 표시 시간을 가질 수도 있는 ISAU로부터 시작하는 및 이후의 디코딩 순서에서의 액세스 유닛이 존재할 수도 있다.
GDR의 일례는 N 프레임까지 확장될 수도 있고 프레임의 부분이 인트라 매크로블록(MB)으로 코딩될 수도 있는 인트라 리프레싱 프로세스일 수도 있다. 비중첩 부분은 N 프레임을 가로질러 인트라 코딩될 수도 있다. 이 프로세스는 전체 프레임이 리프레시될 때까지 반복될 수도 있다.
타입 5 SAP는 아래: TEPT = TDEC < TSAP에 의해 기술될 수도 있다. 타입 5 SAP는 정확하게 디코딩될 수 없는 및/또는 TDEC를 초과하는 표시 시간을 가질 수도 있는 ISAP로부터 시작하는 디코딩 순서에서 적어도 하나의 액세스 유닛이 존재할 수도 있는 경우 및/또는 TDEC가 ISAU로부터 시작하는 액세스 유닛의 가장 빠른 표시 시간일 수도 있는 경우에 대응할 수도 있다.
타입 6 SAP는 아래: TEPT < TDEC < TSAP에 의해 기술될 수도 있다. 타입 6 SAP는 정확하게 디코딩될 수 없는 및/또는 TDEC를 초과하는 표시 시간을 가질 수도 있는 ISAP로부터 시작하는 디코딩 순서에서 적어도 하나의 액세스 유닛이 존재할 수도 있는 경우 및/또는 TDEC가 ISAU로부터 시작하는 액세스 유닛의 가장 빠른 표시 시간이 아닐 수도 있는 경우에 대응할 수도 있다. 타입 4, 5, 및/또는 6 SAP는 오디오 코딩에서의 전이를 다루는 경우에 이용될 수도 있다.
비디오 및/또는 오디오 인코딩 및 디코딩 시에 원활한 스트림 스위칭이 제공될 수도 있다. 원활한 스트림 스위칭은 상이한 레이트에서 인코딩된 미디어 콘텐트의 스트림(예를 들면, 스트림의 부분) 사이에 이용될 수도 있는 하나 이상의 전이 프레임의 생성 및/또는 디스플레이를 포함할 수도 있다. 전이 프레임은 크로스페이딩(crossfading) 및 중첩, 크로스페이딩 및 트랜스코딩(transcoding), 필터링을 이용한 후처리 기술, 재양자화(re-quantization)를 이용한 후처리 기술 등을 통해 생성될 수도 있다.
원활한 스트림 스위칭은 미디어 콘텐트의 제1 데이터 스트림 및 미디어 콘텐트의 제2 데이터 스트림을 수신하는 것을 포함할 수도 있다. 미디어 콘텐트는 비디오 및/또는 오디오를 포함할 수도 있다. 미디어 콘텐트는 MPEG 컨테이너 포맷으로 될 수도 있다. 제1 데이터 스트림 및/또는 제2 데이터 스트림은 MPD 파일로 식별될 수도 있다. 제1 데이터 스트림은 인코딩된 데이터 스트림일 수도 있다. 제2 데이터 스트림은 인코딩된 데이터 스트림일 수도 있다. 제1 데이터 스트림 및 제2 데이터 스트림은 동일한 데이터 스트림의 부분일 수도 있다. 예를 들면, 제1 데이터 스트림은 제2 데이터 스트림으로 시간적으로 진행할 수도 있다(예를 들면, 즉시 진행할 수도 있다). 예를 들면, 제1 데이터 스트림 및/또는 제2 데이터 스트림은 미디어 콘텐트의 SAP에서 시작 및/또는 종료할 수도 있다.
제1 데이터 스트림은 제1 신호 대 잡음 비(SNR)를 특징으로 할 수도 있다. 제2 데이터 스트림은 제2 SNR을 특징으로 할 수도 있다. 예를 들면, 제1 SNR 및 제2 SNR은 각각 제1 데이터 스트림 및 제2 데이터 스트림의 인코딩에 관련할 수도 있다. 제1 SNR은 제2 SNR 보다 더 클 수도 있거나, 제1 SNR은 제2 SNR 보다 작을 수도 있다.
전이 프레임은 제1 데이터 스트림의 프레임 및 제2 데이터 스트림의 프레임 중 적어도 하나를 이용하여 생성될 수도 있다. 전이 프레임은 제1 SNR과 제2 SNR 사이에 있는 하나 이상의 SRN 값을 특징으로 할 수도 있다. 전이 프레임은 전이 시간 간격을 특징으로 할 수도 있다. 전이 프레임은 미디어 콘텐트의 하나의 세그먼트의 부분일 수도 있다. 제1 데이터 스트림의 하나 이상의 프레임이 디스플레이될 수도 있고, 전이 프레임이 디스플레이될 수도 있으며, 제2 데이터 스트림의 하나 이상의 프레임이 디스플레이될 수도 있는데, 예를 들면, 이 순서대로 디스플레이될 수도 있다. 제1 데이터 스트림으로부터 전이 프레임으로 및/또는 전이 프레임으로부터 제2 데이터 스트림으로의 스위치는 미디어 콘텐트의 SAP에서 행해질 수도 있다.
송신 프레임을 생성하는 것은 송신 프레임을 생성하기 위해 제1 SNR을 특징으로 하는 프레임과 제2 SNR을 특징으로 하는 프레임을 크로스페이딩하는 것을 포함할 수도 있다. 크로스페이딩은 송신 프레임을 생성하기 위해 제1 SNR을 특징으로 하는 프레임과 제2 SNR을 특징으로 하는 프레임의 가중 평균을 계산하는 것을 포함할 수도 있다. 가중 평균은 시간 경과에 따라 변할 수도 있다. 크로스페이딩은 제1 가중치를 제1 SNR을 특징으로 하는 프레임에 적용하고 제2 가중치를 제2 SNR을 특징으로 하는 프레임에 적용함으로써 제1 SNR을 특징으로 하는 프레임과 제2 SNR을 특징으로 하는 프레임의 가중 평균을 계산하는 것을 포함할 수도 있다. 제1 가중치와 제2 가중치 중의 적어도 하나는 송신 시간 간격 동안 변할 수도 있다. 크로스페이딩은 제1 데이터 스트림과 제2 데이터 스트림 사이의 선형 전이 또는 비선형 전이를 이용하여 실행될 수도 있다.
제1 데이터 스트림 및 제2 데이터 스트림은 미디어 콘텐트의 프레임을 중첩하는 것을 포함할 수도 있다. 송신 프레임을 생성하기 위해 제1 SNR을 특징으로 하는 프레임을 제2 SNR을 특징으로 하는 프레임과 크로스페이딩하는 것은 송신 프레임을 생성하기 위해 제1 데이터 스트림 및 제2 데이터 스트림의 중첩 프레임을 크로스페이딩하는 것을 포함할 수도 있다. 중첩 프레임은 제1 데이터 스트림 및 제2 데이터 스트림의 대응하는 프레임을 특징으로 할 수도 있다. 중첩 프레임은 중첩 시간 간격을 특징으로 할 수도 있다. 제1 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 이전에 디스플레이될 수도 있고, 전이 프레임은 중첩 시간 간격 동안 디스플레이될 수도 있으며, 제2 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 이후에 디스플레이될 수도 있다. 제1 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 이전의 시간을 특징으로 할 수도 있고, 제2 데이터 스트림의 하나 이상의 프레임은 중첩 시간 간격 이후의 시간을 특징으로 할 수도 있다.
제1 데이터 스트림의 프레임의 서브세트가 제2 SNR을 특징으로 하는 대응하는 프레임을 생성하기 위해 트랜스코딩될 수도 있다. 전이 프레임을 생성하기 위해 제1 SNR을 특징으로 하는 프레임을 제2 SNR을 특징으로 하는 프레임과 크로스페이딩하는 것은 전이 프레임을 생성하기 위해 제1 데이터 스트림의 프레임의 서브세트를 제2 SNR을 특징으로 하는 대응하는 프레임과 크로스페이딩하는 것을 포함할 수도 있다.
전이 프레임을 생성하는 것은 전이 프레임을 생성하기 위해 전이 시간 간격 동안 변하는 컷오프 주파수를 특징으로 하는 로우 패스 필터를 이용하여 제1 SNR을 특징으로 하는 프레임을 필터링하는 것을 포함할 수도 있다. 전이 프레임을 생성하는 것은 전이 프레임을 생성하기 위해 하나 이상의 스텝 사이즈(step size)를 이용하여 제1 SNR을 특징으로 하는 프레임을 변환 및 양자화하는 것을 포함할 수도 있다.
미디어 콘텐트의 하나 이상의 파라미터(예를 들면, 비디오 시퀀스)는 인코딩된 미디어 콘텐트의 비트레이트의 변화에 영향을 주도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, 파라미터는 신호 대 잡음 비(SNR), 프레임 해상도, 프레임 레이트 등에 한정되는 것은 아니지만 이들을 포함할 수도 있다. 미디어 콘텐트의 SNR은 가변 비트레이트를 갖는 미디어 콘텐트의 인코딩된 버전을 생성하도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, SNR은 인코딩하는 동안 변환 계수에 이용되는 양자화 파라미터(QP)를 통해 제어될 수도 있다. 예를 들면, QP를 변화시키면 인코딩된 비디오 시퀀스의 SNR(예를 들면, 및 비트레이트)에 영향을 줄 수도 있다. 예를 들면, QP의 변화는 상이한 화질 및/또는 SNR을 갖는 비디오 시퀀스를 초래할 수도 있다. SNR 및 비트레이트는 관련될 수도 있다. 예를 들면, 인코딩하는 동안 QP를 변화시키는 것이 비트레이트를 제어하는 한 방법일 수도 있다. 예를 들면, QP가 더 낮은 경우에는, 인코딩된 비디오 시퀀스는 더 높은 SNR, 더 높은 비트레이트 및/또는 더 높은 화질을 가질 수도 있다.
미디어 콘텐트(예를 들면, 인코딩된 비디오 스트림)의 SNR은 미디어 콘텐트의 인코딩을 참조할 수도 있다. 예를 들면, 미디어 콘텐트의 SNR은 미디어 콘텐트의 인코딩하는 동안 이용되는 QP에 의해 제어될 수도 있다. 예를 들면, 미디어 콘텐트는 예를 들어, 도 2, 도 4 및 도 6을 참조하여 기술된 바와 같이, 상이한 SNR을 특징으로 할 수도 있는 미디어 콘텐트의 대응하는 버전을 생성하도록 상이한 레이트에서 인코딩될 수도 있다. 예를 들면, 높은 레이트에서 인코딩된 미디어 콘텐트는 높은 SNR 값을 특징으로 할 수도 있는 한편, 낮은 레이트에서 인코딩된 미디어 콘텐트는 낮은 SNR 값을 특징으로 할 수도 있다. 예를 들면, 미디어 콘텐트의 SNR은 미디어 콘텐트의 인코딩을 참조할 수도 있고, 미디어 콘텐트가 클라이언트에 의해 수신될 수 있게 하는 송신 채널과 관련하지 않을 수도 있다.
미디어 콘텐트의 하나 이상의 프레임의 프레임 해상도(예를 들면, 픽셀 내의 비디오 프레임의 수평 및 수직 치수)는 가변 비트레이트를 갖는 미디어 콘텐트의 인코딩된 버전을 생성하도록 인코딩하는 동안 (예를 들면, 240p, 360p, 720p, 1080p 등의 사이에서) 제어될 수도 있다. 예를 들면, 인코딩하는 동안 프레임 해상도를 변화시키면 미디어 콘텐트의 인코딩된 버전(예를 들면, 인코딩된 비디오 시퀀스)의 비트레이트를 변화시킬 수도 있다. 프레임 해상도 및 비트레이트는 관련될 수도 있다. 예를 들면, 프레임 해상도가 더 낮은 경우에는, 더 낮은 비트레이트가 유사한 화질로 비디오 시퀀스를 인코드하는 데 이용될 수도 있다.
미디어 콘텐트의 프레임 레이트(예를 들면, 초당 프레임의 수(fps))는 가변 비트레이트를 갖는 미디어 콘텐트의 인코딩된 버전을 생성하도록 인코딩하는 동안 (예를 들면, 15fps, 20fps, 30fps, 60fps 등의 사이에서) 제어될 수도 있다. 예를 들면, 인코딩하는 동안 프레임 레이트를 변화시키면 미디어 콘텐트의 인코딩된 버전(예를 들면, 인코딩된 비디오 시퀀스)의 비트레이트를 변화시킬 수도 있다. 프레임 레이트 및 비트레이트는 관련될 수도 있다. 예를 들면, 프레임 레이트가 더 낮은 경우에는, 더 낮은 비트레이트가 유사한 주관적인 화질로 비디오 시퀀스를 인코드하는 데 이용될 수도 있다.
미디어 콘텐트의 하나 이상의 파라미터(예를 들면, 비디오 시퀀스)는 대역폭 적응형 스트리밍을 위해 미디어 콘텐트의 목표 비트레이트를 달성하도록 인코딩하는 동안 제어될(예를 들면, 변할) 수도 있다. 미디어 콘텐트의 (예를 들면, QP를 통한) SNR은 상이한 비트레이스로 인코딩된 미디어 콘텐트를 생성하도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, 하나 이상의 상이한 비트레이트에 대해, 비디오 시퀀스는 동일한 프레임 레이트(예를 들면, 초당 30 프레임) 및 동일한 해상도(예를 들면, 720p)로 인코딩될 수도 있는 한편, 인코딩된 비디오 시퀀스의 SNR은 변할 수도 있다. 인코딩된 비디오 시퀀스의 SNR을 변화시키는 것은 목표 비트레이트의 범위가 비교적 작을 때(예를 들면, 1과 2 Mbps 사이) 유용하게 될 수도 있는데, 그 이유는 비디오 시퀀스의 QP를 변화시키면 원하는 목표 비트레이트에서 양호한 화질의 비디오 시퀀스를 생성할 수도 있기 때문이다.
미디어 콘텐트의 프레임 해상도는 상이한 비트레이트로 인코딩된 미디어 콘텐트를 생성하도록 제어될 수도 있다. 미디어 콘텐트(예를 들면, 비디오 시퀀스)는 동일한 프레임 레이트(예를 들면, 초당 30 프레임) 및 SNR로 인코딩될 수도 있는 한편, 미디어 콘텐트의 프레임의 프레임 해상도는 변할 수도 있다. 예를 들면, 비디오 시퀀스는 동일한 프레임 레이트(예를 들면, 30fps) 및 동일한 SNR을 유지하면서 하나 이상의 상이한 해상도(예를 들면, 240p, 360p, 720p, 1080p 등)로 인코딩될 수도 있다. 미디어 콘텐트의 프레임 해상도를 변화시키는 것은 목표 비트레이트의 범위가 클 때(예를 들면, 500 kbps와 10 Mbps 사이) 유용할 수도 있다.
미디어 콘텐트의 프레임 레이트는 상이한 비트레이트로 인코딩된 미디어 콘텐트를 생성하도록 인코딩하는 동안 제어될 수도 있다. 미디어 콘텐트(예를 들면, 비디어 시퀀스)는 동일한 프레임 해상도(예를 들면, 720p) 및 동일한 SNR로 인코딩될 수 있는 한편, 미디어 콘텐트의 프레임 레이트(예를 들면, 15 fps, 20 fps, 30 fps, 60 fps 등)는 변할 수도 있다. 예를 들면, 비디오 시퀀스는 더 낮은 비트레이트의 인코딩된 비디오 시퀀스를 생성하기 위해 더 낮은 프레임 레이트로 인코딩될 수도 있다. 예를 들면, 더 높은 비트레이트에서의 비디오 시퀀스는 풀(full) 30 fps로 인코딩될 수도 있는 한편, 더 낮은 비트레이트에서의 비디오 시퀀스는 동일한 해상도(예를 들면, 720p) 및 동일한 SNR을 유지하면서 5∼20 fps로 인코딩될 수도 있다.
미디어 콘텐트의 (예를 들면, QP를 통한) SNR 및 프레임 해상도는 상이한 레이트로 인코딩된 미디어 콘텐트를 생성하도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, 비디오 시퀀스는 더 낮은 비트레이트의 인코딩된 비디오 시퀀스를 생성하기 위해 더 낮은 SNR 및 프레임 해상도로 인코딩될 수도 있는 한편, 동일한 프레임 레이트가 인코딩된 비디오 시퀀스에 이용될 수도 있다. 예를 들면, 더 높은 레이트에서의 비디오 시퀀스는 720p, 30 fps로 및 다수의 SNR 포인트에서 인코딩될 수도 있는 한편, 더 낮은 레이트에서의 시퀀스는 360p, 30 fps로 및 동일한 SNR로 인코딩될 수도 있다.
미디어 콘텐트의 (예를 들면, QP를 통한) SNR 및 프레임 레이트는 상이한 레이트로 인코딩되는 미디어 콘텐트를 생성하도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, 비디오 시퀀스는 더 낮은 비트레이트의 인코딩된 비디오 시퀀스를 생성하기 위해 더 낮은 SNR 및 프레임 레이트로 인코딩될 수도 있는 한편, 동일한 프레임 해상도가 인코딩된 비디오 시퀀스에 대해 유지될 수도 있다. 예를 들면, 더 높은 레이트에서의 비디오 시퀀스는 720p, 30 fps로 및 다수의 SNR 포인트에서 인코딩될 수도 있는 한편, 더 낮은 레이트에서의 비디오 시퀀스는 720p, 10 fps로 및 동일한 SNR로 인코딩될 수도 있다.
미디어 콘텐트의 프레임 해상도 및 프레임 레이트는 상이한 레이트로 인코딩되는 미디어 콘텐트를 생성하도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, 비디오 시퀀스는 인코딩된 비디오 시퀀스에 대해 동일한 화질(예를 들면, SNR)을 유지하면서, 더 낮은 비트레이트의 인코딩된 비디오 시퀀스를 생성하기 위해 더 낮은 프레임 해상도 및 프레임 레이트로 인코딩될 수도 있다. 예를 들면, 더 높은 레이트에서의 비디오 시퀀스는 720p로, 20 내지 30 fps의 프레임 레이트로 및 동일한 SNR로 인코딩될 수도 있는 한편, 더 낮은 레이트에서의 시퀀스는 360p로, 10 내지 20 fps로 및 동일한 SNR로 인코딩될 수도 있다.
미디어 콘텐트의 (예를 들면, QP를 통한) SNR, 프레임 해상도 및 프레임 레이트는 상이한 레이트로 인코딩되는 미디어 콘텐트를 생성하도록 인코딩하는 동안 제어될 수도 있다. 예를 들면, 비디오 시퀀스는 더 낮은 비트레이트의 인코딩된 비디오 시퀀스를 생성하기 위해 더 낮은 SNR, 프레임 해상도 및 프레임 레이트로 인코딩될 수도 있다. 예를 들면, 더 높은 비트레이트에서의 비디오 시퀀스는 720p, 30 fps로 및 더 높은 SNR 포인트에서 인코딩될 수도 있는 한편, 더 낮은 레이트에서의 비디오 시퀀스는 360p, 10 fps로 및 더 낮은 SNR 포인트에서 인코딩될 수도 있다.
본 명세서에 기재되는 실현예들은 상이한 비트레이트, SNR, 프레임 해상도, 및/또는 프레임 레이트를 특징으로 하는 미디어 콘텐트(예를 들면, 비디오, 오디오 등)의 미디어 스트림(예를 들면, 비디오 스트림, 오디오 스트림 등) 사이의 전이를 원활하게 하기 위해 이용될 수도 있다. 2개의 상이한 비트레이트(예를 들면, 높은(H) 및 낮은(L)), SNR, 프레임 해상도, 및/또는 프레임 레이트로 인코딩되는 미디어 스트림 사이의 전이로서 본 명세서에 기재되어 있지만, 본 명세서에 기재되는 실현예들은 임의의 수의 상이한 비트레이트, SNR, 프레임 해상도, 및/또는 프레임 레이트로 인코딩되는 미디어 스트림 사이의 전이에 적용될 수도 있다.
도 14는 원활한 전이를 포함하지 않는 스트리밍 세션 동안의 레이트 사이의 전이의 일례를 도시하는 그래프(1400)이다. 미디어 콘텐트(예를 들면, 비디오)는 예를 들면, 도 14에 도시된 바와 같은 복수의(예를 들면, 2개의) 상이한 비디오 레이트 예를 들면, 높은 레이트(예를 들면, 레이트 H) 및 낮은 레이트(예를 들면, 레이트 L)로 인코딩될 수도 있다. 전이는 예를 들면, 도 14에 도시된 바와 같이, 높은 레이트(H)로부터 낮은 레이트(L)로(1401) 및/또는 낮은 레이트로부터 높은 레이트로(1402) 일어날 수도 있다. 원활한 전이(예를 들면, 도 14에 도시된 바와 같은 1401 및 1402)를 포함하지 않는 스트리밍 세션에서의 전이는 예를 들면, 미디어 콘텐트가 예를 들면, 미디어 콘텐트의 개재 부분(예를 들면, 세그먼트, 프레임 등) 없이 하나의 레이트로부터 다른 레이트로 (예를 들면, 고에서 저로, 또는 저에서 고로) 전이할 수도 있기 때문에, 급격한 전이(abrupt transition)라고 칭해질 수도 있다. 미디어 콘텐트의 레이트는 예를 들면, 비트레이트, SNR, 해상도, 및/또는 프레임 레이트와 같은 미디어 콘텐트의 하나 이상의 파라미터/특징을 참조할 수도 있다.
도 15는 원활한 전이를 포함하지 않는 스트리밍 세션 동안 레이트 사이의 전이의 일례를 도시하는 그래프(1500)이다. 원활한 스트림 스위칭은 미디어 콘텐트의 화질의 적절한 스텝 업/다운을 달성하기 위해 이용될 수도 있는 레이트 사이의(예를 들면, 레이트 H와 레이트 L 사이의) 원활한 전이(1501, 1502)를 이용할 수도 있다. 예를 들면, 원활한 전이(1501)는 레이트 H로부터 레이트 L로의 스위치를 위해 이용될 수 있는 한편, 원활한 전이(1502)는 레이트 L로부터 레이트 H로의 스위치를 위해 이용될 수 있다. 원활한 전이(1501, 1502)는 체험 품질(QoE)의 향상을 위해 제공할 수도 있다. 예를 들면, 원활한 전이는 상이한 레이트(예를 들면, 레이트 H 및 레이트 L)로 인코딩되는 시간적으로 대응하는 프레임의 파라미터 사이에 있는 하나 이상의 파라미터를 특징으로 하는 전이 프레임을 사용함으로써 달성될 수도 있다.
도 16a는 원활한 스트림 스위칭이 없는 전이의 일례를 도시하는 도면이다. 도 16b는 원활한 스트림 스위칭이 있는 전이의 일례를 도시하는 도면이다. 원활한 전이는 상이한 레이트로 인코딩되는 미디어 콘텐트 사이의 미디어 콘텐트의 하나 이상의 개재 부분(예를 들면, 세그먼트, 전이 프레임 등)을 포함할 수도 있다. 예를 들면, 원활한 스트림 스위칭을 사용한 결과로서, (예를 들면, 도 16b에 도시된 바와 같이) 레이트 H 또는 레이트 L에서의 프레임의 일부가 화질을 저하시킬 때(예를 들면, H에서 L로의 전이) 또는 향상시킬 때(예를 들면, L에서 H로의 전이)의 프레임으로 대체될 수도 있다. 원활한 전이 동안 이용되는 프레임은 전이 프레임이라고 칭해질 수도 있다.
원활한 스트림 스위칭이 예를 들면, 도 16a에 도시된 바와 같이, 이용되지 않는 경우에는, 레이트 H와 레이트 L 사이의 전이가 급격하게 될 수도 있으며, 예를 들면, 어떤 전이 프레임 없이 하나의 레이트의 프레임으로부터 다른 레이트의 프레임으로 이동한다. 원활한 스트림 스위칭이 예를 들면, 도 16b에 도시된 바와 같이, 이용되는 경우에는, 하나 이상의 전이 프레임(1601, 1602)이 레이트 사이에 이용될 수도 있다. 도 16b에 도시된 예에서는 각 전이 시에 4개의 전이 프레임이 이용되지만, 임의의 수의 전이 프레임이 전이 시에 이용될 수도 있다. 도 16b에 도시된 예에서는 각 전이 시에 2개의 상이한 값의 전이 프레임(1601, 1602)이 이용되지만, 임의의 수의 전이 프레임의 값이 전이 시에 이용될 수도 있다. 하나의 전이(예를 들면, H에서 L로의 전이) 시의 전이 프레임의 값은 다른 전이(예를 들면, L에서 H로의 전이) 시의 전이 프레임과 동일하거나 상이할 수도 있다. 임의의 수의 전이 프레임의 값이 전이 시에 이용될 수도 있다. 전이 프레임의 값은 전이 프레임을 특징으로 하는 하나 이상의 파라미터(예를 들면, SNR, 프레임 해상도, 프레임 레이트 등)와 관련될 수도 있다. 예를 들면, 전이 프레임(1601)은 레이트 H의 프레임의 특징에 더욱 가까운 특징에 의해 정의될 수도 있는 한편, 전이 프레임(1602)은 레이트 L의 프레임의 특징에 더욱 가까운 특징에 의해 정의될 수도 있다. 전이 프레임(1601, 1602)의 사용은 사용자에게 향상된 QoE를 제공할 수도 있다.
원활한 스트림 스위칭은 사용자에게 덜 주목받을 수도 있고 사용자 경험을 향상시킬 수도 있는 스트림 스위치를 제공할 수도 있다. 원활한 스트림 스위칭은 예를 들면, 아티팩트(artifacts)의 차이를 실질적으로 제거함으로써 상이한 코덱을 이용하도록 미디어 콘텐트의 상이한 세그먼트를 감안할 수도 있다. 원활한 스트림 스위칭은 미디어 콘텐트의 콘텐트 제공자에 의해 재생되는 인코딩/레이트의 수를 감소시킬 수도 있다.
스트리밍 클라이언트는 DASH 부합 인코더에 의해 준비되는 미디어 콘텐트(예를 들면, 비디오, 오디오 등)의 하나 이상의 스트림을 수신할 수도 있다. 예를 들면, 미디어 콘텐트의 하나 이상의 스트림은 임의의 타입 예를 들면, 타입 1-6의 스트림 액세스 포인트를 포함할 수도 있다.
클라이언트는 인코딩된 미디어 세그먼트를 재생 엔진에 연결 및 공급하기 위한 처리를 포함할 수도 있다. 클라이언트는 미디어 세그먼트를 디코딩하는, 및/또는 크로스 페이드 및/또는 후처리 동작을 적용하는 처리를 포함할 수도 있다. 클라이언트는 예를 들면, 본 명세서에 기재된 처리를 통해, 미디어 세그먼트의 중첩 부분을 로드할 수도 있고/있거나 원활한 스트림 스위칭을 위해 중첩 세그먼트를 이용할 수도 있다.
상이한 SNR(예를 들면, SNR 포인트)을 갖는 스트림 사이의 원활한 스트림 스위칭은 본 명세서에 기재된 하나 이상의 실현예들을 이용하여, 예를 들면, 중첩 및 크로스페이딩을 이용하여, 트랜스코딩 및 크로스페이딩을 이용하여, 스케일러블(scalable) 코덱과 함께 크로스페이딩을 이용하여, 점진적인 트랜스코딩을 이용하여, 및/또는 후처리를 이용하여 실행될 수도 있다. 이들 실현예는 예를 들면, H로부터 L로의 및/또는 L로부터 H로의 전이를 위해 이용될 수도 있다.
2개의 상이한 레이트(예를 들면, H 및 L)로 인코딩하는 스트림을 참조하여 설명하였지만, 본 명세서에 기재된 원활한 스트림 스위칭 실현예는 임의의 수의 상이한 레이트로 인코딩되는 미디어 콘텐트의 스트림에 이용될 수도 있다. 미디어 콘텐트의 인코딩된 스트림의 프레임 레이트 및/또는 해상도(예를 들면, H 및 L)는 동일할 수도 있는 한편, 미디어 콘텐트의 인코딩된 스트림의 SNR은 상이할 수도 있다.
도 17은 중첩 및 크로스페이딩을 이용하는 원활한 스위칭 전이의 예를 도시하는 그래프이다. 클라이언트는 예를 들면, 중첩 세그먼트 또는 서브 세그먼트를 이용하여, 미디어 콘텐트의 중첩 세그먼트 또는 서브 세그먼트를 요청 및/또는 수신할 수도 있고, 미디어 콘텐트의 인코딩된 스트림 사이의 크로스페이드를 실행할 수도 있다. 중첩 요청은 하나 이상의 상이한 레이트로 인코딩되는 미디어 콘텐트이 하나 이상의 세그먼트의 요청일 수도 있다. 중첩 세그먼트는 2 이상의 상이한 레이트(예를 들면, 및 상이한 SNR)로 인코딩되는 미디어 콘텐트의 시간적으로 대응하는 세그먼트를 특징으로 할 수도 있다. 2 이상의 상이한 레이트로 인코딩되는 세그먼트는 예를 들면, 적어도 전이 시간의 지속기간 동안 수신될 수도 있다. 예를 들면, 도 17에 도시된 바와 같이, 레이트 H로 및 레이트 L로 인코딩되는 중첩 세그먼트는 ta 내지 tb의 시간 간격 동안 수신될 수도 있다. 중첩 요청과 관련된 시간 간격은 중첩 시간 간격(예를 들면, 도 17의 ta 내지 tb)이라고 칭해질 수도 있다. 그래프(1701)는 레이트 H로부터 레이트 L로의 전이를 도시하는 한편, 그래프(1702)는 레이트 L로부터 레이트 H로의 전이를 도시한다.
클라이언트는 예를 들면, 중첩 세그먼트 또는 서브 세그먼트를 이용하여, 미디어 콘텐트의 중첩 세그먼트 또는 서브 세그먼트를 요청 및/또는 수신할 수도 있고, 미디어 콘텐트의 인코딩된 스트림 사이의 크로스페이드를 실행할 수도 있다. 특정 세그먼트의 서브 세그먼트가 원활한 스트림 스위칭을 위해 이용될 수도 있다. 예를 들면, 세그먼트가 예를 들어, 30초보다 큰 과 같은 더 긴 지속기간으로 된 경우에는, 클라이언트가 예를 들면, 원활한 스트림 스위칭을 실행하기 위해, 서브 세그먼트의 2-5초의 가치와 같은 그 세그먼트의 중첩 서브 세그먼트를 요청 및/또는 수신할 수도 있다. 세그먼트(들)는 전체 세그먼트(들)를 지칭할 수도 있고/있거나 세그먼트(들)의 하나 이상의 서브 세그먼트를 지칭할 수도 있다.
중첩 세그먼트를 수신한 후에, 크로스페이딩이 하나 이상의 전이 프레임을 생성하기 위해 중첩 세그먼트의 프레임 사이에 실행될 수도 있다. 예를 들면, 크로스페이딩은 도 17에 도시된 바와 같이, 레이트 H로 인코딩되는 프레임과 레이트 L로 인코딩되는 시간적으로 대응하는(예를 들면, 중첩하는) 프레임 사이에 실행될 수도 있다. 예를 들면, 크로스페이딩은 ta 내지 tb의 전체 중첩 시간 간격 또는 일부 동안 실행될 수도 있다. 전이 프레임이 중첩 세그먼트의 크로스페이딩을 통해 중첩 시간 간격(예를 들면, 도 17의 ta 내지 tb의 시간)에 생성될 수도 있다. 전이 프레임은 전이 시간 간격을 특징으로 할 수도 있다. 전이 시간 간격은 클라이언트가 하나의 레이트로 인코딩되는 미디어 콘텐트로부터 다른 레이트로 인코딩되는 미디어 콘텐트로 전이할 수도 있는 시간 기간과 관련될 수도 있다. 전이 프레임의 수는 중첩 프레임의 수와 같을 수도 있거나 같지 않을 수도 있다. 따라서, 전이 시간 간격은 중첩 시간 간격과 같을 수도 있거나 같지 않을 수도 있다.
크로스페이딩은 결과적인 전이 프레임이 전이 시간 간격 동안 하나의 레이트로부터 다른 레이트로 점진적으로 전이하는 파라미터를 갖도록 하나의 레이트로 인코딩되는 중첩 프레임과 다른 레이트로 인코딩되는 중첩 프레임의 가중 평균을 계산하는 것을 포함할 수도 있다. 예를 들면, 각각의 레이트로 인코딩된 중첩 프레임에 적용되는 가중치는 시간(예를 들면, 전이 시간 간격)의 경과에 따라 변할 수도 있으므로, 생성된 전이 프레임이 다양한 레이트로 인코딩된 미디어 콘텐트 사이의 더욱 점진적인 전이를 위해 이용될 수도 있게 된다. 예를 들면, 크로스페이딩은 예를 들어, 제1 레이트를 특징으로 하는 프레임에 제1 가중치를 적용하고 제2 레이트를 특징으로 하는 프레임에 제2 가중치를 적용함으로써 하나의 레이트(예를 들면, 제1 SNR)를 특징으로 하는 하나 이상의 프레임과 다른 레이트(예를 들면, 제2 SNR)를 특징으로 하는 하나 이상의 프레임의 가중 평균을 계산하는 것을 포함할 수도 있다. 제1 가중치와 제2 가중치 중 적어도 하나는 시간(예를 들면, 전이 시간 간격)의 경과에 따라 변할 수도 있다. 예를 들면, 크로스페이딩은 원활한 페이드 인 또는 알파 블렌딩(alpha-blending)을 지칭할 수도 있다.
크로스페이딩을 통해 전이 프레임을 생성한 후에, 전이 프레임은 예를 들면, 하나 이상의 레이트(예를 들면, 레이트 H 및/또는 레이트 L)에서 시간적으로 대응하는 프레임 대신에, 클라이언트에 의해 디스플레이될 수도 있다. 예를 들면, 클라이언트는 시간 간격을 전이 및/또는 중첩하기 전에 하나의 레이트(예를 들면, 레이트 H)로 인코딩된 미디어 콘텐트의 하나 이상의 프레임을 디스플레이할 수도 있고, 시간 간격을 전이 및/또는 중첩하는 동안 하나 이상의 전이 프레임을 디스플레이할 수도 있으며, 시간 간격을 전이 및/또는 중첩한 후에 다른 레이트(예를 들면, 레이트 L)로 인코딩된 미디어 콘텐트의 하나 이상의 프레임을 디스플레이할 수도 있는데, 예를 들면, 이 순서대로 디스플레이할 수도 있다. 이것은 상이한 레이트로 인코딩된 미디어 콘텐트 사이에 원활한 전이를 제공할 수도 있다.
도 18은 스트림을 중첩 및 크로스페이딩하기 위한 시스템(1800)의 일례를 도시하는 도면이다. 도 18에 도시된 시스템(1800)은 H로부터 L로의 전이에 이용될 수도 있다. 도 18에 도시된 시스템(1800)은 아래의 식에 따라서 미디어 콘텐트의 중첩 세그먼트의 크로스페이딩을 실행할 수도 있다:
Figure pat00001
도 19는 스트림을 중첩 및 크로스페이딩하기 위한 시스템(1900)의 일례를 도시하는 도면이다. 도 19에 도시된 시스템(1900)은 L로부터 H로의 전이에 이용될 수도 있다. 도 19에 도시된 시스템(1900)은 아래의 식에 따라서 미디어 콘텐트의 중첩 세그먼트의 크로스페이딩을 실행할 수도 있다:
Figure pat00002
도 18 및 도 19의 시스템을 참조하여 설명된 식은 상이한 레이트로 인코딩된 미디어 콘텐트의 프레임(예를 들면, H 프레임 및 L 프레임) 사이에 선형 전이를 사용하여 크로스페이딩을 실행하는 데 이용될 수도 있다. 선형 전이는 전이 시간에 걸쳐 예를 들면, 0과 1 사이에 (예를 들면, 선형으로 또는 비선형으로) 변하는
Figure pat00003
(t)를 특징으로 할 수도 있다.
하나의 레이트(예를 들면, 레이트 L)에서의 중첩 스트림은 예를 들면, DASH에 중첩 및 크로스페이딩 전이를 이용할 때, 서브 세그먼트로 분할될 수도 있다. 예를 들면, 레이트 L에서의 중첩 스트림이 서브 세그먼트로 분할되는 경우에는, (예를 들면, H로부터 L로의 전이를 위한) 시간 ta 또는 (예를 들면, L로부터 H로의 전이를 위한) 시간 tb는 예를 들면, 도 17에 도시된 바와 같이, 이들이 서브 세그먼트의 시작 또는 종료에 각각 매치하도록 선택될 수도 있다. 레이트 L에서의 중첩 스트림이 서브 세그먼트로 분할되지 않는 경우에는, 완전한 세그먼트가 중첩 요청 시에 획득된 후 디코딩될 수도 있다. (예를 들면, H로부터 L로의 전이를 위한) 시간 ta 또는 (예를 들면, L로부터 H로의 전이를 위한) 시간 tb는 원활한 전이를 실행하기에 충분한 프레임이 사용 가능하도록 선택될 수도 있다.
도 20은 트랜스코딩 및 크로스페이딩을 이용한 원활한 스트림 스위칭의 예를 도시하는 그래프이다. 높은(H) SNR에서의 미디어 콘텐트는 예를 들면, (예를 들면, 도 20에 도시된 바와 같이 ta와 tb 사이의 시간 동안) 높은 SNR과 낮은 SNR의 양자에서 시간적으로 대응하는 미디어 콘텐트를 생성하기 위해, 낮은(L) SNR의 레이트 또는 레벨로 트랜스코딩될 수도 있다. 예를 들면, 트랜스코딩은 레이트 H를 특징으로 하는 하나 이상의 세그먼트를 이용하여 L을 특징으로 하는 미디어 콘텐트의 하나 이상의 시간적으로 대응하는 세그먼트를 생성하도록 실행될 수도 있다.
트랜스코딩한 후에, 레이트 H(예를 들면, 높은 SNR) 및 레이트 L(예를 들면, 낮은 SNR)에서의 시간적으로 대응하는 미디어 콘텐트는 본 명세서에 기재된 중첩 세그먼트와 유사하게 이용될 수도 있다. 예를 들면, 레이트 H(예를 들면, 높은 SNR) 및 레이트 L(예를 들면, 낮은 SNR)에서의 시간적으로 대응하는 미디어 콘텐트는 하나 이상의 전이 세그먼트를 생성하도록 크로스페이딩될 수도 있다. 전이 프레임은 예를 들면, 전이 시간(예를 들면, 도 20에서의 ta와 tb 사이의 시간) 동안 레이트 H(예를 들면, SNR H)에서의 시간적으로 대응하는 프레임 대신에 디스플레이될 수도 있다. 그래프 2001은 레이트 H로부터 레이트 L로의 전이를 도시하는 한편, 그래프 2002는 레이트 L로부터 레이트 H로의 전이를 도시한다. H로부터 L SNR 레벨로의 및/또는 L로부터 H SNR 레벨로의 원활한 전이는 예를 들면, 도 20에 도시된 바와 같이, 트랜스코딩 및 크로스페이딩을 이용하여 달성될 수도 있다.
도 21은 트랜스코딩 및 크로스페이디을 위한 시스템(2100)의 일례를 도시하는 도면이다. 도 21에 도시된 시스템(2100)은 H로부터 L로의 전이에 이용될 수도 있다. 도 21에 도시된 시스템(2100)은 아래의 식에 따라서 낮은 SNR에서 트랜스코딩된 미디어 및 높은 SNR에서 미디어의 크로스페이딩을 실행할 수도 있다:
Figure pat00004
도 22는 트랜스코딩 및 크로스페이디을 위한 시스템(2200)의 일례를 도시하는 도면이다. 도 22에 도시된 시스템(2200)은 L로부터 H로의 전이에 이용될 수도 있다. 도 22에 도시된 시스템(2200)은 아래의 식에 따라서 낮은 SNR에서 트랜스코딩된 미디어 및 높은 SNR에서 미디어의 크로스페이딩을 실행할 수도 있다:
Figure pat00005
도 23은 레이트 H 및 L 사이의 선형 전이를 이용한 크로스페이딩의 예를 도시하는 그래프이다. 그래프 2301은 레이트 H로부터 레이트 L로의 선형 전이를 도시하는 한편, 그래프 2302는 레이트 L로부터 레이트 H로의 선형 전이를 도시한다. 도 23은 아래의 식에 따라서 2개의 포인트를 통과하는 선의 일례를 도시한다:
y-y1 = m(x-x1), 여기에서 m = (y2-y1)/(x2-x1).
선형 전이 이외의 예를 들면, 비선형 전이의 다른 타입의 크로스페이딩이 사용될 수도 있다. 예를 들면,
Figure pat00006
(t)가 비선형적으로 변할 수도 있다. 도 24는 비선형 크로스페이딩 함수의 예를 도시하는 그래프(2400)이다. 예를 들면, 도 24는 H로부터 L로의 선형 크로스페이딩 함수와 비교했을 때 H로부터 L로의 더 느린 비선형 크로스페이딩 함수(2401) 및 더 빠른 비선형 크로스페이딩 함수(2402)의 일례를 도시한다.
예를 들면, 비선형 전이를 위해,
Figure pat00007
(t)는 비선형 함수, 로그 함수 및/또는 지수 함수일 수도 있다. 예를 들면, 비선형 함수는 2차 이상의 다함수일 수도 있다(예를 들면,
Figure pat00008
(t)는 2차의 다항식일 수도 있고, 여기에서
Figure pat00009
(t)=a*t2+b*t+c이다). 예를 들면, 로그 함수는
Figure pat00010
(t)=log(
Figure pat00011
(t))로서 정의될 수도 있고, 여기에서 log는 로그 베이스(logarithm base) "b"일 수도 있고
Figure pat00012
(t)는 t의 함수일 수도 있다. 예를 들면, 지수 함수는
Figure pat00013
(t)=exp(
Figure pat00014
(t))로서 정의될 수도 있고, 여기에서 exp는 베이스(예를 들면, "2", "e", "10" 등)일 수도 있고
Figure pat00015
(t)는 t의 함수일 수도 있다.
Figure pat00016
(t)는 t의 선형 함수, 비선형 함수, 로그 함수, 도는 지수 함수일 수도 있다.
도 25는 스케일러블 비디오 스트림을 크로스페이딩하기 위한 시스템(2500)의 일례를 도시하는 도면이다. 도 26은 스케일러블 비디오 스트림을 크로스페이딩하기 위한 시스템(2600)의 일례를 도시하는 도면이다. 스케일러블 비디오 코덱이 사용될 때, 상이한 계층 간의 원활한 스위칭이 예를 들면, 중첩 세그먼트에 대해 본 명세서에 기재되어 있는 바와 같이, 기본 계층(base layer)과 향상 계층(enhancement layer) 사이의 크로스페이딩을 사용하여 실행될 수도 있다. 도 25 및 도 26은 각각 H로부터 L로의 및 L로부터 H로의 전이를 위한 스케일러블 비디오 코덱용의 원활한 스트림 스위칭을 위한 시스템(2500, 2600)의 예를 도시한다. 스케일러블 비디오 비트스트림을 위한 하나의 기본 계층과 하나 이상의 향상 계층이 존재할 수도 있다. 향상 계층은 이전의 계층(예를 들면, 기본 계층 또는 하위의 향상 계층)을 향상시킬 수도 있다. 예를 들면, 향상 계층은 이전의 계층의 SNR, 프레임 레이트, 및/또는 해상도를 향상시킬 수도 있다. 예를 들면, L 표시가 기본 계층을 디코딩함으로써 획득될 수도 있는 한편, H 표시가 기본 계층 및 하나 이상의 향상 계층을 디코딩함으로써 획득될 수도 있다.
도 27은 QP 크로스페이딩을 이용하는 점진적인 트랜스코딩을 위한 시스템(2700)의 일례를 도시하는 도면이다. 원활한 스위칭은 예를 들면, 도 27에 도시된 바와 같이, 레이트 H에서의 SNR로 미디어 콘텐트(예를 들면, 비디오 스트림)를 트랜스코딩하고, QPH와 QPL 사이의 크로스페이딩을 이용하여 QP를 제어함으로써 실행될 수도 있다. 도 27에 도시되지는 않았지만, 디코더가 인코더 다음에 제공될 수도 있으며, 이 디코더의 출력이 원활한 스트림 스위칭을 위해 이용될 수도 있는 하나 이상의 전이 프레임일 수도 있다. H 표시 및 L 표시의 QP가 획득될 수도 있다. 예를 들면, QP는 비트스트림으로 시그널링, MPD로 시그널링될 수도 있고/있거나 디코더에 의해 추정될 수도 있다. 크로스페이딩은 H 표시 및 L 표시의 QP 사이에서 실행될 수도 있다. 결과적인 QP 값이 하나 이상의 전이 프레임을 생성하도록 시퀀스를 재인코드(re-encode)하는 데 사용될 수도 있다. 예를 들면, 하나 이상의 전이 프레임이 도 21 및 도 22를 참조하여 설명된 바와 유사한 방식으로 예를 들면, (도 21-22에서와 같이) 디코딩된 프레임에 크로스페이딩을 실행하고 가변 SNR을 가잘 수도 있는 비트스트림을 생성하도록 QP 도메인에서 크로스페이딩이 실행될 수도 있는 예에 의해 생성될 수도 있다.
도 28은 후처리를 사용하는 원활한 스트림 스위칭의 예를 도시하는 도면이다. 후처리를 사용하는 원활한 스트림 스위칭은 예를 들면, 상이한 파라미터(예를 들면, SNR, 해상도, 비트레이트 등)를 갖는 스트림 사이의 스위칭을 위해 사용될 하나 이상의 전이 프레임을 생성하도록 필터링 및 재양자와(re-quantization)와 같은 후처리 기술의 사용을 지칭할 수도 있다. 후처리는 하나 이상의 더 높은 파라미터(들)(예를 들면, 도 28에 도시된 바와 같은 더 높은 SNR)를 특징으로 하는 미디어 콘텐트에 대해 실행될 수도 있다. 예를 들면, 레이트 H에서의 스트림이 레이트 L에서의 스트림으로의 또는 그 스트림으로부터의 점진적인 전이에 영향을 주도록 후처리될 수도 있다. 후처리는, 이와 달리 중첩 및 크로스페이딩 및/또는 트랜스코딩 및 크로스페이딩을 통해 생성되거나 획득될 수도 있는 전이 프레임을 생성하는 데 이용될 수도 있다. 후처리를 통해 생성되는 전이 프레임은 예를 들면, 도 28에 도시된 바와 같이, 레이트 H에서의 시간적으로 대응하는 프레임 대신에 전이 시간(예를 들면, ta와 tb 사이의 시간) 동안 디스플레이될 수도 있다. 그래프 2801은 레이트 H로부터 레이트 L로의 전이를 도시하는 한편, 그래프 2802는 레이트 L로부터 레이트 H로의 전이를 도시한다. 후처리는 클라이언트에게 계산의 부담을 감소시킬 수도 있다. 후처리는 중첩 요청이 이용되지 않을 수도 있으므로, 네트워크 트래픽을 증가시키지 않을 수도 있다.
후처리를 위한 입력은 더 높은 파라미터(들)(예를 들면, 더 높은 SNR로 인코딩되는 프레임)을 특징으로 하는 및/또는 더 높은 레이트로 인코딩된 미디어 콘텐트일 수도 있다. 후처리의 출력은 하나의 레이트로 인코딩된 스트림으로부터 다른 레이트로 인코딩된 스트림으로 더욱 점진적으로 전이하도록 전이 시간 동안 이용될 수도 있는 전이 프레임일 수도 있다. 예를 들면, 필터링 및 재양자화와 같은 다양한 후처리 기술이 전이 프레임을 생성하기 위해 미디어 콘텐트의 화질을 떨어뜨리는 데 사용될 수도 있다.
필터링이 원활한 스트림 스위칭을 위한 전이 프레임을 생성하도록 후처리 기술로서 이용될 수도 있다. 도 29는 상이한 컷오프 주파수를 갖는 로우 패스 필터의 주파수 응답의 일례를 도시하는 그래프(2900)이다. 가변 길이의 로우 패스 필터(예를 들면, 또는 비가변 길이의 하나 이상의 로우 패스 필터)가 예를 들면, 하나 이상의 전이 프레임을 생성하기 위해 더 높은 파라미터(예를 들면, 더 높은 SNR로 인코딩된 프레임)를 특징으로 하는 및/또는 더 높은 레이트로 인코딩된 미디어 콘텐트에 적용될 수도 있다. 로우 패스 필터링은 H보다 더 낮은 레이트에서 전이 프레임을 생성하는 데 사용될 수도 있는 더 높은 압축의 효과를 시뮬레이트할 수도 있다.
로우 패스 필터의 강도(예를 들면, 컷오프 주파수)는 예를 들면, 도 29에 도시된 바와 같이, 레이트 H에서 프레임의 원하는 하락의 정도에 따라서 변할 수도 있다. 예를 들면, h(m,n)이 레이트 H에서의 프레임이고 lp(k,l)이 로우 패스 필터의 유한 임펄스 응답(FIR: finite impulse response)인 경우에는, 후처리된 프레임 p(m,n)(예를 들면, 전이 프레임)은 아래의 식에 따라서 생성될 수도 있다:
p(m,n) = h(m,n)*lp(k,l),
여기에서 "*"는 콘벌루션(convolution)을 나타낼 수도 있다.
재양자화가 원활한 스트림 스위칭을 위한 하나 이상의 전이 프레임을 생성하도록 후처리 기술로서 이용될 수도 있다. 예를 들면, 레이트 H에서 프레임의 픽셀 값이 변환될 수도 있고, H보다 더 낮은 레이트에서 전이 프레임을 생성하도록 상이한 레벨에서 양자화될 수도 있다. 하나 이상의 양자화기(예를 들면, 균일 양자화기)가 전이 프레임을 생성하는 데 이용될 수도 있다. 예를 들면, 하나 이상의 양자화기는 레이트 H에서 프레임의 원하는 하락의 정도에 따라서 변할 수도 잇는 스텝 사이즈를 특징으로 할 수도 있다. 더 큰 스텝 사이즈가 더 큰/더 높은 하락을 초래할 수도 있고/있거나 레이트 L에서의 프레임과 더욱 많이 유사한 전이 프레임을 생성하는 데 이용될 수도 있다. 양자화 레벨의 수는 윤곽 형성(contouring)(예를 들면, 일정 레벨을 갖는 픽셀의 연속적인 영역, 그 경계가 윤곽이라고 칭해질 수도 있다)을 회피하기에 충분할 수도 있다. h(m,n)이 레이트 H에서의 프레임이고, Q(·,s)가 스텝 사이즈의 균일 양자화기인 경우에는, 후처리된 프레임 p(m,n)(예를 들면, 전이 프레임)은 아래의 식에 따르는 픽셀 양자화를 사용하여 생성될 수도 있다:
p(m,n) = Q(h(m,n),s).
원활한 스위칭이 상이한 공간 해상도를 갖는 스트림에 의해 이용될 수도 있다. 클라이언트 디바이스(예를 들면, 스마트폰, 태블릿 등)는 스트리밍 재생 동안 비디오를 전체 화면으로 확대할 수도 있다. 비디오를 전체 화면으로 확대하면 스트리밍 세션 동안 상이한 공간 해상도로 인코딩된 스트림 사이에 스위칭을 가능하게 할 수도 있다. 낮은 해상도로부터 스트림을 업 샘플링하면 예를 들면, 고 주파수 정보가 다운 샘플링 동안 손실될 수도 있기 때문에, 비디오가 흐릿하게 되게 할 수도 있는 시각적인 아티팩트를 야기할 수도 있다.
도 30은 상이한 프레임 해상도를 갖는 스트림에 대한 원활한 스위칭의 일례를 도시하는 도면이다. 도면 3000은 원활한 스트림 스위칭을 이용하지 않고 급격한 전이(3001)를 포함하는 일례이다. 도면 3010은 원활한 스트림 스위칭을 이용하고 원활한 전이(3011)를 포함하는 일례이다. 상이한 프레임 해상도를 갖는 스트림 사이에 원활한 스위칭을 실행하기 위해, 낮은 해상도 프레임의 업샘플링으로 인해 발생할 수도 있는 시각적인 아티팩트가 예를 들면, 도 30에 도시된 바와 같이, 최소화될 수도 있다. 스트림 H 및 L에서의 프레임 레이트 및/또는 프레임 노출 시간은 동일할 수도 있다.
도 31은 상이한 프레임 해상도를 갖는 스트림에 대해 하나 이상의 전이 프레임을 생성하는 일례를 도시하는 도면이다. 하나 이상의 전이 프레임(3101)은 예를 들면, 도 31에 도시된 바와 같이, 상이한 레이트로 디코딩된 미디어 콘텐트(예를 들면, 프레임 레이트 H 및/또는 프레임 레이트 L에서의 비디오 스트림)로부터의 정보를 사용하여 생성될 수도 있다. 전이 시간의 경과에 따라(예를 들면, ta 및 tb로부터), 하나의 프레임 해상도(예컨대, 프레임 해상도 L)에서 미디어 콘텐트(3102)의 중첩 세그먼트가 클라이언트에 의해 요청 및/또는 수신될 수도 있다. 전이 시간의 경과에 따라(예를 들면, ta와 tb 사이), 더 낮은 레이트로 인코딩된 미디어 콘텐트로부터 동일한 시간 위치에 있는 하나 이상의 프레임(3102)이 하나 이상의 업샘플링된 프레임(3103)을 생성하도록 더 높은 해상도로 인코딩된 미디어 콘텐트와 동일한 해상도로 업샘플링될 수도 있다. 예를 들면, 스트림 L의 하나 이상의 프레임(3102)이 스트림 H로부터의 프레임과 동일한 해상도로 업샘플링될 수도 있다. 업샘플링은 클라이언트의 내장 기능을 사용하여 실행될 수도 있다. 스트림 H(3104) 및 L(3102)로부터의 프레임과 동일한 시간 위치에 있는 업샘플링된 프레임(3103)이 예를 들면, 크로스페이딩을 사용하여 시간적으로 대응하는 전이 프레임(3101)을 생성하는 데 이용될 수도 있다. 전이 프레임(3101)은 그 후, 하나의 해상도로부터 다른 해상도로의(예를 들면, H로부터 L로 또는 L로부터 H로의) 원활한 스위칭 동안 재생하는 동안 이용될 수도 있다.
도 32는 상이한 프레임 해상도를 갖는 스트림에 대해 H-L 전이 시의 크로스페이딩을 위한 시스템(3200)의 일례를 도시하는 도면이다. 도 32의 시스템(3200)은 아래의 식에 따라서 H로부터 L로의 전이 동안 크로스페이딩을 실행할 수도 있다:
Figure pat00017
도 33은 상이한 프레임 해상도를 갖는 스트림에 대해 L-H 전이 시의 크로스페이딩을 위한 시스템(3300)의 일례를 도시하는 도면이다. 도 33의 시스템(3300)은 아래의 식에 따라서 L로부터 H로의 전이 동안 크로스페이딩을 실행할 수도 있다:
Figure pat00018
원활한 스트림 스위칭이 상이한 프레임 레이트를 갖는 스트림에 의해 이용될 수도 있다. 낮은 프레임 레이트를 갖는 미디어 콘텐트(예를 들면, 비디오 스트림)은 예를 들면, 프레임들이 더 높은 프레임 레이트를 갖는 미디어 콘텐트와 비교할 때 서로로부터 시간적으로 더 멀리 떨어져 있을 수도 있기 때문에, 프레임 사이의 상관이 열악하게 될 수도 있다. 프레임 레이트 업샘플링(FRU) 기술이 낮은 프레임 레이트를 갖는 미디어 콘텐트의 스트림을 높은 프레임 레이트로 변환시키는 데 이용될 수도 있다.
도 34는 상이한 프레임 레이트를 갖는 스트림에 대한 원활한 스위칭을 위한 시스템(3400)의 일례를 도시하는 도면이다. 상이한 프레임 레이트를 갖는 스트림 사이의 원활한 스위칭은 예를 들면, 도 34에 도시된 바와 같이, 낮은 프레임 레이트로 인한 시각적인 아티팩트를 최소화하는 데 이용될 수도 있다. H 프레임 레이트 스트림 및 L 프레임 레이트 스트림의 프레임 해상도가 동일할 수도 있다.
도 35는 상이한 프레임 레이트를 갖는 스트림에 대해 하나 이상의 전이 프레임을 생성하는 일례를 도시하는 도면이다. 하나 이상의 전이 프레임(3501)은 예를 들면, 도 35에 도시된 바와 같이, 높은 프레임 레이트(예를 들면, 프레임 레이트 H)로 인코딩된 미디어 콘텐트의 스트림 및 낮은 프레임 레이트(예를 들면, 프레임 레이트 L)로 인코딩된 미디어 콘텐트의 스트림으로부터의 정보를 사용하여 생성될 수도 있다. 클라이언트는 전이 시간의 경과에 따라(예를 들면, ta와 tb 사이) 더 낮은 프레임 레이트(예를 들면, 프레임 레이트 L)에서 미디어 콘텐트의 중첩 세그먼트를 요청 및/또는 수신할 수도 있다. 중첩 프레임은 높은 레이트로 인코딩된 대응하는 시간 프레임에 덧붙여서 요청 및/또는 수신될 수도 있다. 전이 시간의 경과에 따라(예를 들면, ta와 tb 사이), 하나 이상의 전이 프레임(3501)이 생성될 수도 있다. 예를 들면, 전이 프레임(3501)은 예를 들면, 프레임을 크로스시킴으로써, 프레임 레이트 H로 인코딩된 프레임(3502) 및 프레임 레이트 L로 인코딩된 시간적으로 이전의 프레임(3503)을 사용하여 생성될 수도 있다. 생성된 전이 프레임(3501)은 프레임 레이트 H로 인코딩된 프레임(3502)과 동일한 시간적인 위치에서 이용될 수도 있지만, 프레임 레이트 L로 인코딩된 프레임(3503)과 동일한 시간적인 위치에서 이용되지 못할 수도 있다. 예를 들면, 도 35에 도시된 바와 같이, 생성된 전이 프레임(3501)과 동일한 시간적인 위치에서 프레임 레이트 L로 인코딩된 프레임이 존재하지 않을 수도 있다.
도 36은 상이한 프레임 레이트를 갖는 스트림에 대해 H-L 전이 시의 크로스페이딩을 위한 시스템(3600)의 일례를 도시하는 도면이다. 도 36의 시스템(3600)은 아래의 식에 따라서 H로부터 L로의 전이 동안 크로스페이딩을 실행할 수도 있다:
Figure pat00019
도 37은 상이한 프레임 레이트를 갖는 스트림에 대해 L-H 전이 시의 크로스페이딩을 위한 시스템(3700)의 일례를 도시하는 도면이다. 도 37의 시스템(3700)은 아래의 식에 따라서 L로부터 H로의 전이 동안 크로스페이딩을 실행할 수도 있다:
Figure pat00020
H로부터 L로의 및/또는 L로부터 H로의 전이를 원활하게 하기 위한 지속기간의 비대칭성이 이용될 수도 있다. 저 품질 표시로부터 고 품질 표시로의 전이는 고화질 표시로부터 저화질 표시로의 전이보다 덜 하락하는 효과를 특징으로 할 수도 있다. H로부터 L로의 및 L로부터 H로의 전이를 원활하게 하기 위한 시간 지연은 상이할 수도 있다. 예를 들면, 더 긴 전이(예를 들면, 더 많은 전이 프레임을 포함하는 전이)는 H로부터 L로의 전이에 대해서는 더 길고 L로부터 H로의 전이에 대해서는 더 짧을 수도 있다. 예를 들면, 커플(couple) 초(예를 들면, 2초)의 전이가 H로부터 L로의 전이에 이용될 수도 있고/있거나 약간 더 짧은 전이(예를 들면, 1초)가 L로부터 H로의 전이에 이용될 수도 있다.
원활한 스트림 스위칭은 예를 들면, DASH에서의 오디오 전이에 이용될 수도 있다. DASH 표준은 스트림 사이의 하나 이상의 연결 타입을 정의할 수도 있고, 이를 SAP라고 칭할 수도 있다. SAP는 이들 포인트를 따르는 스트림의 연쇄가 정확하게 디코딩 가능한 MPEG 스트림을 생성할 수도 있음을 보증하는 데 이용될 수도 있다.
도 38은 MDCT 기반 스피치(speech) 및 오디오 코덱에 사용되는 오브랩 가산(overlap-add) 윈도우의 일례를 도시하는 그래프이다. 오디오 스트림은 I 프레임(예를 들면, 또는 I 프레임의 등가물)을 포함하지 않을 수도 있다. 예를 들면, MP3, MPEG-4 AAC, HE-AAC 등과 같은 오디오 코덱은 오디오 샘플을 블록이라 칭하는 단위로 인코드할 수도 있다(예를 들면, 1024 및 960 샘플 블록). 블록은 상호 의존적일 수도 있다. 이러한 상호 의존의 성질은 예를 들면, 도 38에 도시된 바와 같이, 변환(예를 들면, MDCT)을 계산하기 전에 이들 블록 내의 샘플에 적용될 수도 있는 중첩 윈도우에 의존할 수도 있다.
오디오 코덱은 선두에서 하나의 블록을 디코드 및 폐기할 수도 있다. 이것은 예를 들면, 중첩 윈도우를 채용할 수도 있는 MDCT 변환의 완전한 재구성 성질로 인해, 후속하는 모든 블록의 정확한 인코딩을 위해 수학적으로 충분하게 될 수도 있다. 디코딩되고 있는 블록 이전의 블록은 예를 들면, 랜덤 액세스를 달성하기 위해서, 요청된 데이터를 디코딩하기 전에 검색, 디코딩 및 그 후 폐기될 수도 있다. 오디오 코덱(예를 들면, HE-AAC, AAC-ELD, MPEG-서라운드 등)에 대해, 선두에서 폐기되는 블록의 수는 예를 들면, SBR 툴(tool)의 사용으로 인해 1보다 크거나 작을 수도 있다(예를 들면, 3개의 블록).
오디오 세그먼트는 예를 들면, 스트림 스위치가 존재하지 않는 경우, 및/또는 동일한 코덱을 사용하고, 동일한 샘플링 레이트 및 동일한 컷오프 주파수에서 캡처된 오디로 동작하며, 동일한 채널 수를 사용하고/하거나 코덱 시에 동일한 툴 및 모드를 사용하는(예를 들면, SBR 툴의 추가/제거 없이, 동일한 스테레오 코딩 모드를 사용하는 등) 스트림 사이의 스위치가 존재하는 경우에, SAP 타입=1로 라벨 붙여지거나 라벨 붙여지지 않을 수도 있다(예를 들면, StartWithSAP 속석을 포함하지 않음).
예를 들면, 128Kbps에서의 스테레오 AAC 스트림이 고 품질 재생을 위해 이용될 수도 있다. 스트림은 더 낮은 품질을 위해 대략 64-80Kbps로 감소될 수도 있다. 32-48Kbps의 레이트로 진행하기 위해서, (예를 들면, HE-AAC를 사용하는) SBR 툴, 파라메트릭(parametric) 스테레오로의 스위치 등이 이용될 수도 있다.
도 39는 폐기 가능한 블록을 갖는 오디오 액세스 포인트의 일례(3900)를 도시하는 도면이다. 선두에서 하나의 블록(3901)이 예를 들면, 도 39에 도시된 바와 같이, 폐기될 수도 있다(예를 들면, AAC 및 MP3 오디오 코덱을 가짐). 오디오 액세스 포인트에 대해, 아래는 참을 유지할 수도 있다: TEPT = TPTF < TSAP = TDEC. 이것은 예를 들면, TEPT <= TPTF < TDEC = TSAP로 도시된 바와 같이 DASH에서 SAP 타입 4에 매핑할(map) 수도 있다.
도 40은 3개의 폐기 가능한 블록을 갖는 HE-ACC 오디오 액세스 포인트의 일례(4000)를 도시하는 도면이다. 디코더는 1보다 많은(예를 들면, 3개의) 선두 블록(4001)을 디코드 및 폐기할 수도 있다. 이것은 HE-AAC 코덱으로의 스위치를 위해 실행될 수도 있으며, 여기에서 AAC 코더는 1/2 샘플링 레이트에서 동작될 수도 있고/있거나 SBR 툴을 효과를 나타내기 시작하도록 여분의 데이터를 이용할 수도 있다. 예를 들면, 3개의 블록(4001)이 디코딩되고 폐기되면, 제2 및 제3 블록은 코어-AAC 코덱의 관점에서 볼 때 정확하게 디코딩된 것으로 생각될 수도 있지만, TSAP가 전체 스펙트럼 재구성을 위해 타입 6 DASH SAP로 설정될 수도 있다. 예를 들면, DASH의 타입 6 SAP는 아래: TEPT < TDEC < TSAP를 특징으로 할 수도 있고, 이것은 그것을 사용하는 데이터 타입 또는 수단과 관련되지 않을 수도 있다.
SAP 포인트 선언(declaration)이 스위치 가능한 오디오 스트림에 이용될 수도 있다. 예를 들면, MDCT-코어 AAC, 돌비 AC3, 및/또는 MP3 코덱에 대해, SAP가 SAP 타입 4 포인트로서 정의될 수도 있다. 예를 들면, HE-AAC, AAC-ELD, MPEG 서라운드, MPEG SAOC, 및/또는 MPEG USAC 코덱에 대해, SAP가 SAP 타입 6 포인트로서 정의될 수도 있다. 예를 들면, 새로운 SAP 타입(예를 들면, SAP 타입 "0")이 오디오 코덱과 함께 사용하기 위해 정의될 수도 있다. 새로운 SAP 타입은 아래: TEPT <= TPTF < TDEC <= TSAP를 특징으로 할 수도 있다. 예를 들면, TDEC < TSAP이면, 추가의 파라미터가 포인트 사이의 거리를 정의하기 위해 이용될 수도 있다. 예를 들면, 새로운 SAP 타입(예를 들면, 타입 0)의 사용은 예를 들면, DASH의 대부분의 프로파일이 타입 <=3의 SAP를 지원하기 때문에, 프로파일의 변화를 수반하지 않을 수도 있다.
오디오 스트림 사이의 심리스 스트림 스위칭이 실현될 수도 있다. SAP 타입이 정확하게 정의되는 경우, 세그먼트의 연쇄가 재생하는 동안 최상의 사용자 경험을 초래할 수도 있다. 코덱 또는 샘플링 레이트의 변화는 재생하는 동안 클릭을 나타낼 수도 있다. 그러한 클릭을 피하기 위해, 클라이언트(예를 들면, DASH 클라이언트)가 예를 들면, 비디오 스위칭을 참조하여 상술한 바와 유사한 디코드 및/또는 크로스페이드 동작을 실현할 수도 있다.
도 41은 H-L 전이 시의 오디오 스트림의 크로스페이딩을 위한 시스템(4100)의 일례를 도시하는 도면이다. 도 41의 시스템(4100)은 아래의 식에 따라서 H로부터 L로의 전이 동안 오디오의 크로스페이딩을 실행할 수도 있다:
Figure pat00021
도 42는 L-H 전이 시의 오디오 스트림의 크로스페이딩을 위한 시스템(4200)의 일례를 도시하는 도면이다. 도 42의 시스템(4200)은 아래의 식에 따라서 H로부터 L로의 전이 동안 오디오의 크로스페이딩을 실행할 수도 있다:
Figure pat00022
일부 실현예가 인코딩 또는 디코딩 중 하나를 참조하여 상술하였지만, 당업자는 실현예가 미디어 콘텐트의 인코딩 및 디코딩 스트림의 양자에 이용될 수도 있음을 이해할 것이다.
특징 및 요소들이 특정 조합으로 상술되어 있지만, 당업자는 각각의 특징 또는 요소가 단독으로 또는 다른 특징 및 요소와 임의의 조합으로 사용될 수 있음을 이해할 것이다. 또한, 본 명세서에 기재된 방법은 컴퓨터 또는 프로세서에 의한 실행을 위한 컴퓨터로 판독 가능한 매체에 내장되는 컴퓨터 프로그램, 소프트웨어 또는 펌웨어로 실현될 수도 있다. 컴퓨터로 판독 가능한 매체의 예는 (유선 도는 무선 연결을 통해 송신되는) 전자 신호 및 컴퓨터로 판독 가능한 저장 매체를 포함한다. 컴퓨터로 판독 가능한 저장 매체의 예는 판독 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 레지스터, 캐시 메모리, 반도체 메모리 디바이스, 내부 하드 디스크 및 착탈식 디스크와 같은 자기 매체, 자기 광학 매체, 및 CD-ROM 디스크와 같은 광학 매체, 및 디지털 다기능 디스크(DVD)에 한정되는 것은 아니지만, 이들을 포함한다. 소프트웨어와 관련하여 프로세서는 WTRU, UE, 단말, 기지국, RNC, 또는 임의의 호스트 컴퓨터에 사용하기 위한 무선 주파수 송수신기를 실현하는 데 사용될 수도 있다.

Claims (20)

  1. 미디어 콘텐츠의 원활한 스트림 스위칭을 실행하는 방법으로서,
    제1 비트레이트(bitrate)를 특징으로 하는, 미디어 콘텐트의 제1 인코딩 데이터 스트림(encoded data stream)을 수신하는 단계;
    제2 비트레이트를 특징으로 하는, 상기 미디어 콘텐트의 제2 인코딩 데이터 스트림을 수신하는 단계; 및
    전이 프레임들(transition frames)을 생성하기 위해, 전이 시간 간격 동안 변하는 컷오프 주파수를 특징으로 하는 로우 패스 필터를 사용하여 상기 제1 비트레이트를 특징으로 하는 프레임들의 서브세트를 필터링하는 단계를 포함하며,
    상기 전이 프레임들은 상기 제1 비트레이트와 상기 제2 비트레이트 사이에 있는 하나 이상의 비트레이트를 특징으로 하는 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  2. 제1항에 있어서, 상기 제1 비트레이트는 상기 제2 비트레이트보다 큰 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  3. 제1항에 있어서,
    상기 제1 비트레이트를 특징으로 하는 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하는 단계;
    상기 전이 프레임들을 디스플레이하는 단계; 및
    상기 제2 비트레이트를 특징으로 하는 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하는 단계를 더 포함하는, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  4. 제1항에 있어서,
    상기 제2 비트레이트를 특징으로 하는 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하는 단계;
    상기 전이 프레임들을 디스플레이하는 단계; 및
    상기 제1 비트레이트를 특징으로 하는 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하는 단계를 더 포함하는, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  5. 제1항에 있어서, 상기 미디어 콘텐트는 비디오를 포함하는 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  6. 미디어 콘텐트의 원활한 스트림 스위칭을 실행하도록 구성된 무선 송수신 유닛(WTRU: wireless transmit/receive unit)으로서,
    프로세서를 포함하고, 상기 프로세서는,
    제1 비트레이트를 특징으로 하는, 미디어 콘텐트의 제1 인코딩 데이터 스트림을 수신하고;
    제2 비트레이트를 특징으로 하는, 상기 미디어 콘텐트의 제2 인코딩 데이터 스트림을 수신하고;
    전이 프레임들을 생성하기 위해, 전이 시간 간격 동안 변하는 컷오프 주파수를 특징으로 하는 로우 패스 필터를 사용하여 상기 제1 비트레이트를 특징으로 하는 프레임들의 서브세트를 필터링하도록 구성되고,
    상기 전이 프레임들은 상기 제1 비트레이트와 상기 제2 비트레이트 사이에 있는 하나 이상의 비트레이트를 특징으로 하는 것인, 무선 송수신 유닛(WTRU).
  7. 제6항에 있어서, 상기 제1 비트레이트는 상기 제2 비트레이트보다 큰 것인, 무선 송수신 유닛(WTRU).
  8. 제6항에 있어서, 상기 프로세서는 또한,
    상기 제1 비트레이트를 특징으로 하는 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하고;
    상기 전이 프레임들을 디스플레이하고;
    상기 제2 비트레이트를 특징으로 하는 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하도록 구성되는 것인, 무선 송수신 유닛(WTRU).
  9. 제6항에 있어서, 상기 프로세서는 또한,
    상기 제2 비트레이트를 특징으로 하는 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하고;
    상기 전이 프레임들을 디스플레이하고;
    상기 제1 비트레이트를 특징으로 하는 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하도록 구성되는 것인, 무선 송수신 유닛(WTRU).
  10. 제6항에 있어서, 상기 미디어 콘텐트는 비디오를 포함하는 것인, 무선 송수신 유닛(WTRU).
  11. 미디어 콘텐트의 원활한 스트림 스위칭을 실행하는 방법으로서,
    상기 미디어 콘텐트의 제1 인코딩 데이터 스트림을 요청하는 단계;
    제1 비트레이트를 특징으로 하는, 상기 미디어 콘텐트의 상기 제1 인코딩 데이터 스트림을 수신하는 단계;
    상기 미디어 콘텐트의 제2 인코딩 데이터 스트림을 요청하는 단계;
    제2 비트레이트를 특징으로 하는, 상기 미디어 콘텐트의 상기 제2 인코딩 데이터 스트림을 수신하는 단계로서, 상기 제1 인코딩 데이터 스트림과 상기 제2 인코딩 데이터 스트림은 상기 미디어 콘텐트의 중첩 프레임들(overlapping frames)을 포함하는 것인, 상기 제2 인코딩 데이터 스트림을 수신하는 단계; 및
    전이 프레임들을 생성하기 위해, 상기 제1 비트레이트를 특징으로 하는 프레임들을 상기 제2 비트레이트를 특징으로 하는 프레임들과 크로스페이딩(crossfading)하는 단계를 포함하며,
    상기 전이 프레임들은 상기 제1 비트레이트와 상기 제2 비트레이트 사이에 있는 하나 이상의 비트레이트를 특징으로 하는 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  12. 제11항에 있어서, 상기 전이 프레임들을 생성하기 위해 상기 제1 비트레이트를 특징으로 하는 프레임들을 상기 제2 비트레이트를 특징으로 하는 프레임들과 크로스페이딩하는 단계는, 상기 전이 프레임들을 생성하기 위해 상기 제1 인코딩 데이터 스트림과 상기 제2 인코딩 데이터 스트림의 중첩 프레임들을 크로스페이딩하는 단계를 포함하는 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  13. 제12항에 있어서, 상기 중첩 프레임들은 상기 제1 비트레이트 및 상기 제2 비트레이트로 인코딩된 상기 미디어 콘텐트의 일시적으로 대응하는 세그먼트들을 특징으로 하는 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  14. 제13항에 있어서, 상기 중첩 프레임들은 중첩 시간 간격(overlap time interval)을 특징으로 하고, 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임은 상기 중첩 시간 간격 이전의 시간을 특징으로 하며, 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임은 상기 중첩 시간 간격 이후의 시간을 특징으로 하고, 상기 방법은,
    상기 중첩 시간 간격 전에 상기 제1 인코딩 데이터 스트림의 상기 하나 이상의 프레임을 디스플레이하는 단계;
    상기 중첩 시간 간격 동안 상기 전이 프레임들을 디스플레이하는 단계; 및
    상기 중첩 시간 간격 후에 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하는 단계를 더 포함하는, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  15. 제11항에 있어서, 상기 미디어 콘텐트는 비디오를 포함하는 것인, 미디어 콘텐트의 원활한 스트림 스위칭 실행 방법.
  16. 미디어 콘텐트의 원활한 스트림 스위칭을 실행하도록 구성된 무선 송수신 유닛(WTRU: wireless transmit/receive unit)으로서,
    프로세서를 포함하고, 상기 프로세서는,
    상기 미디어 콘텐트의 제1 인코딩 데이터 스트림을 요청하고;
    제1 비트레이트를 특징으로 하는, 상기 미디어 콘텐트의 상기 제1 인코딩 데이터 스트림을 수신하고;
    상기 미디어 콘텐트의 제2 인코딩 데이터 스트림을 요청하고;
    제2 비트레이트를 특징으로 하는, 상기 미디어 콘텐트의 상기 제2 인코딩 데이터 스트림을 수신하고;
    전이 프레임들을 생성하기 위해 상기 제1 비트레이트를 특징으로 하는 프레임들을 상기 제2 비트레이트를 특징으로 하는 프레임들과 크로스페이딩(crossfading)하도록 구성되고,
    상기 제1 인코딩 데이터 스트림과 상기 제2 인코딩 데이터 스트림은 상기 미디어 콘텐트의 중첩 프레임들을 포함하고, 상기 전이 프레임들은 상기 제1 비트레이트와 상기 제2 비트레이트 사이에 있는 하나 이상의 비트레이트을 특징으로 하는 것인, 무선 송수신 유닛(WTRU).
  17. 제16항에 있어서, 상기 전이 프레임들을 생성하기 위해 상기 제1 비트레이트를 특징으로 하는 프레임들을 상기 제2 비트레이트를 특징으로 하는 프레임들과 크로스페이딩하는 것은, 상기 전이 프레임들을 생성하기 위해 상기 제1 인코딩 데이터 스트림과 상기 제2 인코딩 데이터 스트림의 중첩 프레임들을 크로스페이딩하는 것을 포함하는 것인, 무선 송수신 유닛(WTRU).
  18. 제17항에 있어서, 상기 중첩 프레임들은 상기 제1 비트레이트 및 상기 제2 비트레이트로 인코딩된 상기 미디어 콘텐트의 일시적으로 대응하는 세그먼트들을 특징으로 하는 것인, 무선 송수신 유닛(WTRU).
  19. 제18항에 있어서, 상기 중첩 프레임들은 중첩 시간 간격을 특징으로 하고, 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임은 상기 중첩 시간 간격 이전의 시간을 특징으로 하며, 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임은 상기 중첩 시간 간격 이후의 시간을 특징으로 하고, 상기 프로세서는 또한,
    상기 중첩 시간 간격 전에 상기 제1 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하고;
    상기 중첩 시간 간격 동안 상기 전이 프레임들을 디스플레이하고;
    상기 중첩 시간 간격 후에 상기 제2 인코딩 데이터 스트림의 하나 이상의 프레임을 디스플레이하도록 구성되는 것인, 무선 송수신 유닛(WTRU).
  20. 제16항에 있어서, 상기 미디어 콘텐트는 비디오를 포함하는 것인, 무선 송수신 유닛(WTRU).
KR1020167012740A 2012-04-24 2013-04-23 Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치 KR20160063405A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261637777P 2012-04-24 2012-04-24
US61/637,777 2012-04-24
PCT/US2013/037855 WO2013163224A1 (en) 2012-04-24 2013-04-23 Method and apparatus for smooth stream switching in mpeg/3gpp-dash

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020147032853A Division KR101622785B1 (ko) 2012-04-24 2013-04-23 Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20160063405A true KR20160063405A (ko) 2016-06-03

Family

ID=48325920

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020167012740A KR20160063405A (ko) 2012-04-24 2013-04-23 Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치
KR1020147032853A KR101622785B1 (ko) 2012-04-24 2013-04-23 Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020147032853A KR101622785B1 (ko) 2012-04-24 2013-04-23 Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치

Country Status (7)

Country Link
US (1) US20130282917A1 (ko)
EP (1) EP2842338A1 (ko)
JP (2) JP2015518350A (ko)
KR (2) KR20160063405A (ko)
CN (1) CN104509119A (ko)
TW (1) TWI605699B (ko)
WO (1) WO2013163224A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021201307A1 (ko) * 2020-03-30 2021-10-07 엘지전자 주식회사 차량에 의해 기록되는 비디오를 전송하는 방법 및 장치

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9190110B2 (en) 2009-05-12 2015-11-17 JBF Interlude 2009 LTD System and method for assembling a recorded composition
US9756468B2 (en) 2009-07-08 2017-09-05 Dejero Labs Inc. System and method for providing data services on vehicles
US10165286B2 (en) * 2009-07-08 2018-12-25 Dejero Labs Inc. System and method for automatic encoder adjustment based on transport data
US8942215B2 (en) 2010-07-15 2015-01-27 Dejero Labs Inc. System and method for transmission of data from a wireless mobile device over a multipath wireless router
US11232458B2 (en) 2010-02-17 2022-01-25 JBF Interlude 2009 LTD System and method for data mining within interactive multimedia
US9607655B2 (en) 2010-02-17 2017-03-28 JBF Interlude 2009 LTD System and method for seamless multimedia assembly
AU2011311659B2 (en) * 2010-10-06 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
US8930559B2 (en) * 2012-06-01 2015-01-06 Verizon Patent And Licensing Inc. Adaptive hypertext transfer protocol (“HTTP”) media streaming systems and methods
US9125073B2 (en) * 2012-08-03 2015-09-01 Intel Corporation Quality-aware adaptive streaming over hypertext transfer protocol using quality attributes in manifest file
US9009619B2 (en) 2012-09-19 2015-04-14 JBF Interlude 2009 Ltd—Israel Progress bar for branched videos
US10735486B2 (en) * 2012-12-28 2020-08-04 Qualcomm Incorporated Device timing adjustments and methods for supporting dash over broadcast
CN105191409B (zh) * 2013-03-14 2018-10-16 交互数字专利控股公司 用于选择用于接收内容的分布式网关的wtru及方法
US9257148B2 (en) 2013-03-15 2016-02-09 JBF Interlude 2009 LTD System and method for synchronization of selectably presentable media streams
US9419737B2 (en) 2013-03-15 2016-08-16 Concio Holdings LLC High speed embedded protocol for distributed control systems
US8953452B2 (en) * 2013-05-16 2015-02-10 Cisco Technology, Inc. Enhancing performance of rapid channel changes and other playback positioning changes in adaptive streaming
US9973559B2 (en) 2013-05-29 2018-05-15 Avago Technologies General Ip (Singapore) Pte. Ltd. Systems and methods for presenting content streams to a client device
US9100618B2 (en) 2013-06-17 2015-08-04 Spotify Ab System and method for allocating bandwidth between media streams
US9832516B2 (en) 2013-06-19 2017-11-28 JBF Interlude 2009 LTD Systems and methods for multiple device interaction with selectably presentable media streams
US10097604B2 (en) 2013-08-01 2018-10-09 Spotify Ab System and method for selecting a transition point for transitioning between media streams
US10448119B2 (en) 2013-08-30 2019-10-15 JBF Interlude 2009 LTD Methods and systems for unfolding video pre-roll
CN105556922B (zh) 2013-09-17 2019-06-28 瑞典爱立信有限公司 网络中的dash表示自适应
US9529888B2 (en) 2013-09-23 2016-12-27 Spotify Ab System and method for efficiently providing media and associated metadata
US9654532B2 (en) 2013-09-23 2017-05-16 Spotify Ab System and method for sharing file portions between peers with different capabilities
US9530454B2 (en) 2013-10-10 2016-12-27 JBF Interlude 2009 LTD Systems and methods for real-time pixel switching
US9063640B2 (en) 2013-10-17 2015-06-23 Spotify Ab System and method for switching between media items in a plurality of sequences of media items
GB2520292A (en) * 2013-11-14 2015-05-20 Snell Ltd Method and apparatus for processing a switched audio signal
WO2015081218A1 (en) 2013-11-27 2015-06-04 Interdigital Patent Holdings, Inc. Media presentation description
CN103702137A (zh) * 2013-12-23 2014-04-02 乐视网信息技术(北京)股份有限公司 在转码任务处理过程中生成统计数据的方法和系统
US9641898B2 (en) 2013-12-24 2017-05-02 JBF Interlude 2009 LTD Methods and systems for in-video library
US9520155B2 (en) 2013-12-24 2016-12-13 JBF Interlude 2009 LTD Methods and systems for seeking to non-key frames
US9653115B2 (en) 2014-04-10 2017-05-16 JBF Interlude 2009 LTD Systems and methods for creating linear video from branched video
US9792026B2 (en) 2014-04-10 2017-10-17 JBF Interlude 2009 LTD Dynamic timeline for branched video
WO2016014852A1 (en) 2014-07-23 2016-01-28 Sonic Ip, Inc. Systems and methods for streaming video games using gpu command streams
JP6258168B2 (ja) * 2014-09-12 2018-01-10 株式会社東芝 配信装置、再生装置および配信システム
KR101605773B1 (ko) * 2014-09-25 2016-04-01 현대자동차주식회사 단말 장치, 그를 가지는 차량 및 단말 장치의 제어 방법
US9792957B2 (en) 2014-10-08 2017-10-17 JBF Interlude 2009 LTD Systems and methods for dynamic video bookmarking
US11412276B2 (en) * 2014-10-10 2022-08-09 JBF Interlude 2009 LTD Systems and methods for parallel track transitions
US20160248829A1 (en) * 2015-02-23 2016-08-25 Qualcomm Incorporated Availability Start Time Adjustment By Device For DASH Over Broadcast
EP3627337A1 (en) 2015-02-27 2020-03-25 DivX, LLC Systems and methods for frame duplication and frame extension in live video encoding and streaming
US9973562B2 (en) * 2015-04-17 2018-05-15 Microsoft Technology Licensing, Llc Split processing of encoded video in streaming segments
US9672868B2 (en) 2015-04-30 2017-06-06 JBF Interlude 2009 LTD Systems and methods for seamless media creation
US10582265B2 (en) 2015-04-30 2020-03-03 JBF Interlude 2009 LTD Systems and methods for nonlinear video playback using linear real-time video players
US10460765B2 (en) 2015-08-26 2019-10-29 JBF Interlude 2009 LTD Systems and methods for adaptive and responsive video
CN106686036A (zh) * 2015-11-10 2017-05-17 中兴通讯股份有限公司 多媒体数据下载方法、客户端、服务器及系统
US20170178590A1 (en) * 2015-12-22 2017-06-22 Vallabhajosyula S. Somayazulu Wireless Display Sink Device
US11128853B2 (en) 2015-12-22 2021-09-21 JBF Interlude 2009 LTD Seamless transitions in large-scale video
US11164548B2 (en) 2015-12-22 2021-11-02 JBF Interlude 2009 LTD Intelligent buffering of large-scale video
WO2017140685A1 (en) * 2016-02-16 2017-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient adaptive streaming
JP2017157903A (ja) 2016-02-29 2017-09-07 富士ゼロックス株式会社 情報処理装置
US10462202B2 (en) 2016-03-30 2019-10-29 JBF Interlude 2009 LTD Media stream rate synchronization
US11856271B2 (en) 2016-04-12 2023-12-26 JBF Interlude 2009 LTD Symbiotic interactive video
US10218760B2 (en) 2016-06-22 2019-02-26 JBF Interlude 2009 LTD Dynamic summary generation for real-time switchable videos
US10346126B2 (en) * 2016-09-19 2019-07-09 Qualcomm Incorporated User preference selection for audio encoding
WO2018058993A1 (zh) * 2016-09-30 2018-04-05 华为技术有限公司 一种视频数据的处理方法及装置
WO2018079293A1 (ja) * 2016-10-27 2018-05-03 ソニー株式会社 情報処理装置および方法
US10355798B2 (en) 2016-11-28 2019-07-16 Microsoft Technology Licensing, Llc Temporally correlating multiple device streams
US11050809B2 (en) 2016-12-30 2021-06-29 JBF Interlude 2009 LTD Systems and methods for dynamic weighting of branched video paths
US20190327425A1 (en) * 2017-01-30 2019-10-24 Sony Corporation Image processing device, method and program
WO2018139283A1 (ja) * 2017-01-30 2018-08-02 ソニー株式会社 画像処理装置および方法、並びにプログラム
WO2018139285A1 (ja) * 2017-01-30 2018-08-02 ソニー株式会社 画像処理装置および方法、並びにプログラム
EP3579564A4 (en) * 2017-01-31 2020-01-15 Sony Corporation INFORMATION PROCESSING DEVICE AND METHOD
JP6247782B1 (ja) * 2017-02-15 2017-12-13 パナソニック株式会社 端末装置、映像配信システムおよび映像配信方法
CN106657680A (zh) * 2017-03-10 2017-05-10 广东欧珀移动通信有限公司 一种移动终端帧率的控制方法、装置及移动终端
EP3603006B1 (en) 2017-03-23 2024-05-01 Vid Scale, Inc. Metrics and messages to improve experience for 360-degree adaptive streaming
WO2018189901A1 (ja) 2017-04-14 2018-10-18 Ykk株式会社 めっき材及びその製造方法
JP6277318B1 (ja) * 2017-10-10 2018-02-07 パナソニック株式会社 端末装置、映像配信システムおよび映像配信方法
JP6271072B1 (ja) * 2017-10-10 2018-01-31 パナソニック株式会社 端末装置、映像配信システムおよび映像配信方法
JP6993869B2 (ja) * 2017-12-25 2022-01-14 古野電気株式会社 再生装置、遠隔再生システム、再生方法、及びコンピュータプログラム
US10257578B1 (en) 2018-01-05 2019-04-09 JBF Interlude 2009 LTD Dynamic library display for interactive videos
US11601721B2 (en) 2018-06-04 2023-03-07 JBF Interlude 2009 LTD Interactive video dynamic adaptation and user profiling
MX2021001970A (es) 2018-08-21 2021-05-31 Dolby Int Ab Métodos, aparatos y sistemas para generación, transporte y procesamiento de tramas de ejecución inmediata (ipfs).
WO2020080873A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
WO2020080765A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080665A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US10965945B2 (en) * 2019-03-29 2021-03-30 Bitmovin, Inc. Optimized multipass encoding
CN110071765B (zh) * 2019-04-29 2020-12-18 上海师范大学 自由光通信、射频和可见光通信三跳中继通信方法及装置
US11490047B2 (en) 2019-10-02 2022-11-01 JBF Interlude 2009 LTD Systems and methods for dynamically adjusting video aspect ratios
WO2021089487A1 (en) * 2019-11-08 2021-05-14 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for transmitting real-time media stream
WO2021144244A1 (en) * 2020-01-15 2021-07-22 Dolby International Ab Adaptive streaming of media content with bitrate switching
US11245961B2 (en) 2020-02-18 2022-02-08 JBF Interlude 2009 LTD System and methods for detecting anomalous activities for interactive videos
US12096081B2 (en) 2020-02-18 2024-09-17 JBF Interlude 2009 LTD Dynamic adaptation of interactive video players using behavioral analytics
US12047637B2 (en) 2020-07-07 2024-07-23 JBF Interlude 2009 LTD Systems and methods for seamless audio and video endpoint transitions
JP7550572B2 (ja) 2020-08-28 2024-09-13 日本放送協会 受信端末、配信サーバ、受信方法及び受信プログラム
CN111935436B (zh) * 2020-09-15 2021-02-19 杭州盖视科技有限公司 多视频流在播放端的无缝切换方法与系统
CN115223579A (zh) * 2021-04-20 2022-10-21 华为技术有限公司 一种编解码器协商与切换方法
US11882337B2 (en) 2021-05-28 2024-01-23 JBF Interlude 2009 LTD Automated platform for generating interactive videos
CN113630572B (zh) * 2021-07-09 2022-10-14 荣耀终端有限公司 帧率切换方法和相关装置
US11934477B2 (en) 2021-09-24 2024-03-19 JBF Interlude 2009 LTD Video player integration within websites
US11632413B1 (en) * 2022-07-18 2023-04-18 Rovi Guides, Inc. Methods and systems for streaming media content
US12063260B2 (en) 2022-08-31 2024-08-13 Rovi Guides, Inc. Intelligent delivery and playout to prevent stalling in video streaming

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288444A (ja) * 1994-04-18 1995-10-31 Sony Corp 信号処理装置
CN1286575A (zh) * 1999-08-25 2001-03-07 松下电器产业株式会社 噪声检测方法、噪声检测装置及图象编码装置
JP2001204029A (ja) * 1999-08-25 2001-07-27 Matsushita Electric Ind Co Ltd ノイズ検出方法、ノイズ検出装置及び画像復号化装置
JP3596770B2 (ja) * 2001-12-28 2004-12-02 ソニー株式会社 記憶装置、データ処理装置およびデータ処理方法、プログラムおよび記録媒体、並びにデータ処理システム
JP2004147095A (ja) * 2002-10-24 2004-05-20 Canon Inc 復号方法
JP2006237656A (ja) * 2003-02-28 2006-09-07 Secom Co Ltd 符号化信号分離・合成装置、差分符号化信号生成装置、差分符号化信号抽出装置、符号化信号分離・合成方法、符号化信号分離・合成プログラム
EP1634458B1 (en) * 2003-06-16 2011-08-17 Thomson Licensing Decoding method and apparatus enabling fast channel change of compressed video
JP4007331B2 (ja) * 2004-02-24 2007-11-14 ソニー株式会社 再生装置および方法
WO2005099271A1 (en) * 2004-04-06 2005-10-20 Koninklijke Philips Electronics N.V. Device and method for receiving video data
KR100679011B1 (ko) * 2004-07-15 2007-02-05 삼성전자주식회사 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
US8254707B2 (en) * 2005-12-07 2012-08-28 Sony Corporation Encoding device, encoding method, encoding program, decoding device, decoding method, and decoding program in interlace scanning
CN101133649B (zh) * 2005-12-07 2010-08-25 索尼株式会社 编码装置、编码方法以及解码装置、解码方法
CA2669153A1 (en) * 2006-11-15 2008-05-22 Qualcomm Incorporated Systems and methods for applications using channel switch frames
JP4795208B2 (ja) * 2006-11-28 2011-10-19 キヤノン株式会社 画像処理装置及び方法
JP2008178075A (ja) * 2006-12-18 2008-07-31 Sony Corp 表示制御装置、表示制御方法、及びプログラム
CN101237303A (zh) * 2007-01-30 2008-08-06 华为技术有限公司 数据传送的方法、系统以及发送机、接收机
US8396118B2 (en) * 2007-03-19 2013-03-12 Sony Corporation System and method to control compressed video picture quality for a given average bit rate
JP2009206694A (ja) * 2008-02-27 2009-09-10 Pioneer Electronic Corp 受信装置、受信方法、受信プログラムおよび受信プログラムを格納した記録媒体
ES2624910T3 (es) * 2008-06-06 2017-07-18 Amazon Technologies, Inc. Conmutación de secuencia de lado de cliente
WO2010100089A1 (en) * 2009-03-02 2010-09-10 Thomson Licensing Method and device for displaying a sequence of pictures
US20110013766A1 (en) * 2009-07-15 2011-01-20 Dyba Roman A Method and apparatus having echo cancellation and tone detection for a voice/tone composite signal
GB2476041B (en) * 2009-12-08 2017-03-01 Skype Encoding and decoding speech signals
EP2517469A4 (en) * 2009-12-22 2014-01-15 Vidyo Inc SYSTEM AND METHOD FOR INTERACTIVE SYNCHRONIZED VIDEO VISUALIZATION
US20110176496A1 (en) * 2010-01-15 2011-07-21 Roy Rabinda K On-the-fly video quality switching for video distribution networks and methods therefor
US8918533B2 (en) * 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
WO2012046487A1 (ja) * 2010-10-05 2012-04-12 シャープ株式会社 コンテンツ再生装置、コンテンツ配信システム、コンテンツ再生装置の同期方法、制御プログラム、および、記録媒体
EP2625867A1 (en) * 2010-10-05 2013-08-14 Telefonaktiebolaget L M Ericsson (publ) A client, a content creator entity and methods thereof for media streaming
CA2773924C (en) * 2011-04-11 2020-10-27 Evertz Microsystems Ltd. Methods and systems for network based video clip generation and management

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021201307A1 (ko) * 2020-03-30 2021-10-07 엘지전자 주식회사 차량에 의해 기록되는 비디오를 전송하는 방법 및 장치

Also Published As

Publication number Publication date
CN104509119A (zh) 2015-04-08
TWI605699B (zh) 2017-11-11
JP2015518350A (ja) 2015-06-25
WO2013163224A1 (en) 2013-10-31
TW201414254A (zh) 2014-04-01
JP2017005725A (ja) 2017-01-05
KR20150004394A (ko) 2015-01-12
KR101622785B1 (ko) 2016-05-20
US20130282917A1 (en) 2013-10-24
JP6378260B2 (ja) 2018-08-22
EP2842338A1 (en) 2015-03-04

Similar Documents

Publication Publication Date Title
KR101622785B1 (ko) Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치
US10880349B2 (en) Quality-driven streaming
US11516485B2 (en) Power aware video decoding and streaming
KR102266325B1 (ko) 비디오 품질 향상
US20140019635A1 (en) Operation and architecture for dash streaming clients

Legal Events

Date Code Title Description
A107 Divisional application of patent
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid