DE112011101908T5

DE112011101908T5 - Qualitätseinstellung unter Verwendung eines fragmentierten Medienstroms

Info

Publication number: DE112011101908T5
Application number: DE112011101908T
Authority: DE
Inventors: Anders Odlund; Kent Karlsson
Original assignee: MobiTv Inc
Current assignee: MobiTv Inc
Priority date: 2010-06-04
Filing date: 2011-05-19
Publication date: 2013-03-28
Also published as: US20110299586A1; GB201300028D0; GB2495867A; WO2011153001A1

Abstract

Mediendateien, wie z. B. MPEG-4-Dateien, werden fragmentiert, um eine Erstellung, Lieferung, Qualitätsanpassung und Ortsverschiebung von Medien zu ermöglichen. Eine Wiedergabe auf einer Vorrichtung kann bei Empfang eines ersten MPEG-4-Dateifragments beginnen. Ein Wiedergabestopp wird detektiert, und Medienstrom-Positionsinformationen zusammen mit Qualitätsniveauinformationen werden auf einem Inhaltsserver festgehalten. Die Wiedergabe kann unter Verwendung derselben Vorrichtung und derselben Medienstromqualität, einer anderen Medienstromqualität oder mit einer anderen Vorrichtung und einer anderen Medienstromqualität fortgesetzt werden. Weitere angeforderte MPEG-4-Dateifragmente können Fragmente sein, die einem Strom mit einer höheren oder niedrigeren Bitrate entsprechen und die für eine andere dem Benutzer zugeordnete Vorrichtung konfiguriert sind, um es einem Benutzer zu ermöglichen, die Wiedergabe an einer anderen Vorrichtung wiederaufzunehmen.

Description

DATEN ZU VERWANDTER ANMELDUNG
Die vorliegende Anmeldung beansprucht Priorität der der US-Patentanmeldung Nr. 12/794,600 bezüglich QUALITÄTSEINSTELLUNG UNTER VERWEN-DUNG EINES FRAGMENTIERTEN MEDIENSTROMS, eingereicht am 4. Juni 2010 (Anwaltsaktenzeichen Nr. MOBIP051US), deren gesamter Inhalt hiermit für sämtliche Zwecke zum Gegenstand der vorliegenden Offenbarung gemacht ist.
TECHNISCHES SACHGEBIET
Die vorliegende Offenbarung betrifft eine Qualitätseinstellung unter Verwendung eines fragmentierten Medienstroms.
BESCHREIBUNG DER VERWANDTEN TECHNIK
Eine bekannte Medienübertragung umfasst das Verwenden von Real-Time Streaming Protocol (RTSP)/Real-Time Transport Protocol (RTP) über das User Data Protocol (UDP) zum Liefern von Audio- und Videodaten.
Eine separate Sitzung wird angewendet, um einen Inhaltsstrom, der Video- und Audiodaten umfasst, zu transportieren. RTP spezifiziert ein Standardpaketformat, das zum Transportieren von Audio- und Videodaten verwendet wird, wie z. B. Moving Picture Expert Group-(MPEG-)Videodaten, die MPEG-2- und MPEG-4-Videoframes umfassen. In vielen Fällen sind mehrere Frames in einem einzelnen RTP-Paket enthalten. Die MPEG-Frames selbst können Referenzframes sein oder können Frames sein, die relativ zu einem Referenzframe kodiert sind.
Ein bekanntes RTSP/RTP wird über UDP übertragen. Anders als das Transport Control Protocol (TCP) ist UDP ein unzuverlässiger Transportmechanismus, umfasst jedoch nicht den zusätzlichen Aufwand zum Unterstützen eines Framework zum erneuten Übertragen, das in dem TCP enthalten ist. Folglich wird, obwohl das TCP für eine Vielzahl von Datentypen eine größere Anwendung findet, UDP immer noch in großem Umfang für einen Echtzeit-Medientransport verwendet, da zum Maximieren von Durchsatz und Zuverlässigkeit ein minimaler Übertragungsaufwand gewünscht ist. Ein erneutes Übertragen von verlorenen Frames kann zu Störungen führen.
Bekannte Techniken und Mechanismen zum Übertragen von Echtzeitmedien weisen Einschränkungen auf. Folglich ist es wünschenswert, verbesserte Techniken und Mechanismen zum Übertragen von Medienströmen von Inhaltsservern zu Clientservern bereitzustellen.
KURZBESCHREIBUNG DER ZEICHNUNGEN
Die Offenbarung ist am besten mit Bezug auf die folgende Beschreibung in Zusammenhang mit den beiliegenden Zeichnungen verständlich, die bestimmte Ausführungsformen zeigen.
1 zeigt ein Beispiel für ein Fragmentierungssystem.
2 zeigt ein weiteres Beispiel für ein Fragmentierungssystem.
3 zeigt Beispiele für Kodierungsströme.
4 zeigt ein Beispiel für einen Austausch, bei dem ein Fragmentierungssystem verwendet wird.
5 zeigt eine Technik für die Lieferung von fragmentierten Medienströmen.
6 zeigt eine Technik zum Implementieren einer Qualitätsanpassung mit einem fragmentierten Medienstrom.
7 zeigt ein Beispiel für ein System zum Implementieren einer fragmentierten Medienlieferung.
BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
Es wird jetzt genauer auf einige spezifische Beispiele der Erfindung Bezug genommen, einschließlich der besten Methoden, die die Erfinder zum Ausführen der Erfindung in Betracht ziehen. Beispiele für diese spezifischen Ausführungsformen sind in den beiliegenden Zeichnungen dargestellt. Obwohl die Erfindung in Zusammenhang mit diesen spezifischen Ausführungsformen beschrieben wird, sei darauf hingewiesen, dass die Erfindung nicht auf die beschriebenen Ausführungsformen beschränkt ist. Sie deckt im Gegenteil Alternativen, Modifikationen und Äquivalente ab, die in den Geist und Umfang der Erfindung fallen, wie sie in den beiliegenden Patentansprüchen definiert ist.
Zum Beispiel werden die Techniken der vorliegenden Erfindung im Zusammenhang mit der MPEG-4-Kodierung beschrieben. Es sei jedoch darauf hingewiesen, dass die Techniken nach der vorliegenden Erfindung Varianten von MPEG-4 betreffen. In der folgenden Beschreibung sind zahlreiche spezifische Details dargelegt, um ein gründliches Verständnis der vorliegenden Erfindung zu ermöglichen. Besondere Ausführungsbeispiele der vorliegenden Erfindung können ohne einige oder sämtliche dieser spezifischen Details implementiert werden. In anderen Fällen sind bekannte Prozesse nicht detailliert beschrieben, um die vorliegende Erfindung nicht unnötig kompliziert darzustellen.
Verschiedene Techniken und Mechanismen der vorliegenden Erfindung werden aus Gründen der Klarheit manchmal im Singular beschrieben. Es sei jedoch darauf hingewiesen, dass einige Ausführungsformen mehrere Wiederholungen einer Technik oder mehrere Instanziierungen eines Mechanismus umfassen, sofern nichts anderes angegeben ist. Zum Beispiel wird bei einem System ein Prozessor in einer Vielzahl von Kontexten verwendet. Es sei jedoch angemerkt, dass bei einem System auch mehrere Prozessoren verwendet werden können, wobei dies in den Umfang der vorliegenden Erfindung fällt, sofern nichts anderes angegeben ist. Ferner werden bei den Techniken und Mechanismen der vorliegenden Erfindung manchmal zwei Entitäten als miteinander verbunden beschrieben. Es sei darauf hingewiesen, dass eine Verbindung zwischen zwei Entitäten nicht notwendigerweise eine direkte ungehinderte Verbindung bedeutet, da eine Vielzahl von weiteren Entitäten zwischen den zwei Entitäten vorgesehen sein kann. Zum Beispiel kann ein Prozessor mit einem Speicher verbunden sein, es sei jedoch angemerkt, dass eine Vielzahl von Brücken und Steuereinrichtungen zwischen dem Prozessor und dem Speicher vorgesehen sein kann. Folglich bedeutet eine Verbindung nicht notwendigerweise eine direkte ungehinderte Verbindung, sofern nichts anderes angegeben ist.
Überblick
Mediendateien, wie z. B. MPEG-4-Dateien, werden fragmentiert, um eine Erstellung, Lieferung, Qualitätsanpassung und Ortsverschiebung von Live-Medien zu ermöglichen. Eine Wiedergabe auf einer Vorrichtung kann bei Empfang eines ersten MPEG-4-Dateifragments beginnen. Ein Wiedergabestopp wird detektiert, und Medienstrom-Positionsinformationen zusammen mit Qualitätsniveauinformationen werden auf einem Inhaltsserver festgehalten. Die Wiedergabe kann unter Verwendung derselben Vorrichtung und derselben Medienstromqualität, einer anderen Medienstromqualität oder mit einer anderen Vorrichtung und einer anderen Medienstromqualität fortgesetzt werden. Weitere angeforderte MPEG-4-Dateifragmente können Fragmente sein, die einem Strom mit einer höheren oder niedrigeren Bitrate entsprechen und die für eine andere dem Benutzer zugeordnete Vorrichtung konfiguriert sind, um es einem Benutzer zu ermöglichen, die Wiedergabe an einer anderen Vorrichtung wiederaufzunehmen.
Ausführungsbeispiele
Eine Vielzahl von Mechanismen wird verwendet, um Medienströme zu Vorrichtungen zu liefern. Bei bestimmten Beispielen erstellt ein Client eine Sitzung, wie z. B. eine Real-Time Streaming Protocol-(RTSP-)Sitzung. Ein Servercomputer empfängt eine Verbindung für einen Medienstrom, erstellt eine Sitzung und liefert einen Medienstrom zu einer Clientvorrichtung. Der Medienstrom umfasst Pakete, in denen Frames, wie z. B. MPEG-4-Frames, gekapselt sind. Die MPEG-4-Frames selbst können Schlüsselframes oder Differenzframes sein. Die spezifische Kapselungsmethodik, die von dem Server angewendet wird, ist abhängig vom Typ des Inhalts, vom Format dieses Inhalts, vom Format der Nutzdaten und von den Anwendungs- und Übertragungsprotokollen, die zum Senden der Daten verwendet werden. Wenn die Clientvorrichtung den Medienstrom empfangen hat, entkapselt die Clientvorrichtung die Pakete, um die MPEG-Frames zu erhalten, und dekodiert die MPEG-Frames, um die eigentlichen Mediendaten zu erhalten.
Bekannte MPEG-4-Dateien machen es erforderlich, dass ein Abspielgerät den gesamte Header parst, bevor die Daten dekodiert werden können. Das Parsen des gesamten Header kann eine beträchtliche Zeit dauern, insbesondere bei Vorrichtungen mit begrenzten Netzwerk- und Verarbeitungsressourcen. Folglich stellen die Techniken und Mechanismen der vorliegenden Erfindung ein fragmentiertes MPEG-4-Framework bereit, das eine Wiedergabe bei Empfang eines ersten MPEG-4-Dateifragments ermöglicht. Ein zweites MPEG-4-Dateifragment kann unter Verwendung von Informationen angefordert werden, die in dem ersten MPEG-4-Dateifragment enthalten sind. Bei verschiedenen Ausführungsformen kann das angeforderte zweite MPEG-4-Dateifragment ein Fragment sein, das einem Strom mit einer höheren oder niedrigeren Bitrate als der dem ersten Dateifragment zugeordneten Bitrate entspricht.
MPEG-4 ist ein erweiterbares Containerformat, das keine feste Struktur zum Beschreiben von Medientypen aufweist. Stattdessen weist MPEG-4 eine Objekthierarchie auf, die es ermöglicht, Individualstrukturen für jedes Format zu definieren. Die Formatbeschreibung wird in der Musterbeschreibungs-('stsd'-) Box für jeden Strom gespeichert. Die Musterbeschreibungsbox kann Informationen enthalten, die erst bekannt werden, wenn sämtliche Daten kodiert sind. Zum Beispiel kann die Musterbeschreibungsbox eine durchschnittliche Bitrate enthalten, die vor dem Kodieren nicht bekannt ist.
Bei verschiedenen Ausführungsformen sind MPEG-4-Dateien fragmentiert, so dass ein Live Stream nahezu live aufgezeichnet und wiedergegeben werden kann. MPEG-4-Dateien können erstellt werden, ohne dass gewartet werden muss, bis der gesamte Inhalt geschrieben ist, um die Filmheaders zu erzeugen. Damit eine MPEG-4-Fragmentierung ohne eine bandexterne Signalgebung erfolgen kann, wird eine Boxstruktur geschaffen, die Synchronisierungsinformationen, Dateiendeinformationen und Kapitelinformationen enthält. Bei verschiedenen Ausführungsformen werden Synchronisierungsinformationen zum Synchronisieren von Audio und Video verwendet, wenn die Wiedergabe in der Mitte eines Stroms beginnt. Dateiendeinformationen signalisieren, wann das aktuelle Programm oder die aktuelle Datei beendet ist. Diese können Informationen zum Fortsetzen des Streaming des nächsten Programms oder der nächsten Datei beinhalten. Kapitelinformationen können für Video-on-demand-Inhalt verwendet werden, der in Kapitel unterteilt ist, die möglicherweise durch Werbeslots voneinander getrennt sind.
Das TCP findet eine größere Anwendung als das UDP, und Netzwerktechnologien, einschließlich Schalter-, Lastverteiler- und Netzwerkkarten-Technologlen werden in größerem Maße für das TCP als für das UDP entwickelt. Folglich werden Techniken und Mechanismen zum Liefern von fragmentierten Live-Medien über das TCP bereitgestellt. Sequenzinformationen werden ebenfalls festgehalten und/oder modifiziert, um eine nahtlose Operation der Clientvorrichtung zu ermöglichen. Zeitsteuerungs-und Sequenzinformationen in einem Medienstrom werden aufbewahrt.
Anforderungen werden Clients als separate Dateien zur Verfügung gestellt, und Dateien sollten auf Abspielgeräten abgespielt werden, die fragmentiertes MPEG-4 verarbeiten. Live- oder Nahezu-Live-, Video-on-demand-(VOD-) und Digital-Videoaufzeichnungs-(digital video record DVR-)Inhalt kann insgesamt unter Anwendung der Fragmentierung verarbeitet werden.
Bei verschiedenen Ausführungsformen wird der Wiedergabestopp an einem Inhaltsserver oder Fragmentierungsserver detektiert. Bei einigen Beispielen sendet eine Vorrichtung eine Wiedergabestopp-Anforderung. Bei anderen Beispielen detektiert ein Inhaltsserver, dass eine nachfolgende Fragment-Anforderung nicht empfangen worden ist. Der Inhaltsserver hält Benutzerinformationen und Medienstrom-Positionsinformationen fest. Bei einigen Beispielen hält der Inhaltsserver ferner Vorrichtungsinformationen und Qualitäts- oder Bitrateninformationen fest. Wenn eine Anforderung bezüglich eines Fragments oder eine Wiederaufnahmeanforderung von derselben Vorrichtung oder von einer anderen demselben Benutzer zugeordneten Vorrichtung kommend empfangen wird, identifiziert der Inhaltsserver die Bitrate und den Medienstrom zusammen mit dem entsprechenden Fragment, das zu dem Benutzer gesendet wird. Das Fragment kann den Mediendaten entsprechen, die in der Vergangenheit als eine Live-Einspeisung übertragen worden sind und nicht länger live sein können, der Benutzer kann jedoch den Medienstrom nahtlos bei einer Auflösung betrachten, die für eine gängige Betrachtungsvorrichtung angemessen ist.
Die Anforderung von der Vorrichtung kann eine Bitrate und Auflösung enthalten, oder ein Inhaltsserver kann unter Verwendung von Vorrichtungsinformationen eine angemessene Bitrate und Auflösung identifizieren. Eine Wiederaufnahmeanforderung zusammen mit einer gewünschten Bitrate kann auch von einer anderen einem Benutzer zugeordneten Vorrichtung kommend empfangen werden. Fragmente, die an einem Inhaltsserver festgehalten werden, können verwendet werden, um auf Anforderungen von zahlreichen Nutzern an einer Vielzahl von Vorrichtungen, die eine Wiedergabe von Medienströmen zu unterschiedlichen Zeitpunkten und bei unterschiedlichen Qualitätsniveaus anfordern, zu reagieren. Bei verschiedenen Ausführungsformen können Fragmente einmal bei unterschiedlichen Qualitätsniveaus festgehalten und auf effiziente Weise zwischengespeichert werden, selbst wenn eine Vielzahl von ungleichen Anforderungen bezüglich desselben oder unterschiedlicher Medienströme empfangen wird.
1 zeigt eine schematische Darstellung eines Beispiels für ein einem Inhaltsserver zugeordnetes Fragmentierungssystem 101, bei dem die Techniken und Mechanismen der vorliegenden Erfindung angewendet werden können. Kodierer 105 empfangen Mediendaten von Satelliten, Inhaltsbibliotheken und anderen Inhaltsquellen und senden RTP-Multicast-Daten zu einem Fragmentschreiber 109. Die Kodierer 105 senden ferner Session Announcement Protocol-(SAP-)Ankündigungen an einen SAP-Empfänger 121. Bei verschiedenen Ausführungsformen erstellt der Fragmentschreiber 109 Fragmente für Live Streaming und schreibt Dateien zu Aufzeichnungszwecken auf eine Diskette. Der Fragmentschreiber 109 empfängt RTP-Multicast-Ströme von den Kodierern 105 und parst die Ströme, um die Audio-/Videodaten als Teil der fragmentierten MPEG-4-Dateien neu zu verpacken. Wenn ein neues Programm beginnt, erstellt der Fragmentschreiber 109 eine neue MPEG-4-Datei im Fragmentspeicher und hängt Fragmente an. Bei bestimmten Ausführungsformen unterstützt der Fragmentschreiber 109 Live- und/oder DVR-Konfigurationen.
Der Fragmentserver 111 versorgt die Caching-Schicht mit Fragmenten für Clients. Durch die Auslegungsphilosophie hinter der Client/Server-API werden soweit wie möglich Umläufe minimiert und die Komplexität reduziert, wenn die Mediendaten zu dem Client 115 geliefert werden. Der Fragmentserver 111 stellt Live Streams und/oder DVR-Konfigurationen bereit.
Der Fragment-Controller 107 ist mit Anwendungsservern 103 verbunden und steuert die Fragmentierung von Live-Kanal-Strömen. Der Fragmentierungs-Controller 107 integriert optional Führungsdaten zum Ansteuern der Aufzeichnungen für eine Global-/Netzwerk-DVR. Bei bestimmten Ausführungsformen bettet der Fragment-Controller 107 eine Logik um die Aufzeichnung ein, um die Fragmentschreiberkomponente 109 zu vereinfachen. Bei verschiedenen Ausführungsformen läuft der Fragment-Controller 107 auf demselben Host wie der Fragmentschreiber 109. Bei bestimmten Ausführungsformen instanziiert der Fragment-Controller 107 Instanzen des Fragmentschreibers 109 und bewirkt eine hohe Verfügbarkeit.
Bei verschiedenen Ausführungsformen verwendet der Client 115 eine Medienkomponente, die fragmentierte MPEG-4-Dateien anfordert, Trickspiel ermöglicht und eine Bandbreitenanpassung bewirkt. Die Client kommuniziert mit den Anwendungsdiensten, die HTTP Proxy 113 zugeordnet sind, um Führer zu erhalten und dem Benutzer den verfügbaren aufgezeichneten Inhalt zu präsentieren.
2 zeigt ein Beispiel für ein Fragmentierungssystem 201, das für Video-on-demand-Inhalt verwendet werden kann. Ein Fragger 203 nimmt eine kodierte Videoclip-Quelle. Der handelsübliche Kodierer erstellt jedoch keine Ausgangsdatei mit Headers eines minimal objektorientierten Framework (MOOF) und bettet stattdessen sämtliche Inhalts-Headers in die Filmdatei (MOOV) ein. Der Fragger liest die Eingangsdatei und erstellt einen alternativen Ausgang, der mit MOOF-Headers fragmentiert und mit Individual-Headers erweitert worden ist, die das Erlebnis optimieren und als Hinweise an Server dienen.
Der Fragmentserver 211 versorgt die Caching-Schicht mit Fragmenten für Clients. Durch die Auslegungsphilosophie hinter der Client/Server-API werden soweit wie möglich Umläufe minimiert und die Komplexität reduziert, wenn die Mediendaten zu dem Client 215 geliefert werden. Der Fragmentserver 211 stellt VoD-Inhalt bereit.
Bei verschiedenen Ausführungsformen verwendet der Client 215 eine Medienkomponente, die fragmentierte MPEG-4-Dateien anfordert, Trickspiel ermöglicht und eine Bandbreitenanpassung bewirkt. Die Client kommuniziert mit den Anwendungsdiensten, die HTTP Proxy 213 zugeordnet sind, um Führer zu erhalten und dem Benutzer den verfügbaren aufgezeichneten Inhalt zu präsentieren.
3 zeigt Beispiele für von dem Fragmentschreiber gespeicherte Dateien. Bei verschiedenen Ausführungsformen ist der Fragmentschreiber eine Komponente in dem Gesamtfragmentierer. Er ist eine Zweiheit, die Befehlszeilenargumente verwendet, um ein bestimmtes Programm entweder auf der Basis der NTP-Zeit von dem kodierten Strom oder der Wanduhrzeit aufzuzeichnen. Bei bestimmten Ausführungsformen ist dies als Teil der Argumente konfigurierbar und hängt von dem Eingangsstrom ab. Wenn der Fragmentschreiber das Aufzeichnen eines Programms beendet, verlässt er dieses. Bei Live Streams werden Programme künstlich erstellt, um Kurzzeitintervalle mit einer Länge von z. B. 5–15 Minuten zu sein.
Bei verschiedenen Ausführungsformen sind die Fragmentschreiber-Befehlszeilenargumente die SDP-Datei des aufzuzeichnenden Kanals, die Startzeit, die Endzeit, der Name der aktuellen und der nächsten Ausgangsdateien. Der Fragmentschreiber hört auf den RTP-Verkehr von den Live-Video-Kodierern und schreibt die Mediendaten erneut als fragmentiertes MPEG-4 auf eine Diskette. Bei verschiedenen Ausführungsformen werden Mediendaten als fragmentiertes MPEG-4 geschrieben, wie in MPEG-4 Teil 12 (ISO/IEC 14496-12) definiert ist. Jede gesendete Show wird auf eine Diskette geschrieben, und zwar als eine separate Datei, die durch die Show-ID (abgeleitet von EPG) gekennzeichnet ist. Clients schließen die Show-ID als Teil des Kanalnamens ein, wenn sie das Betrachten einer voraufgezeichneten Show anfordern. Der Fragmentschreiber verbraucht jede der unterschiedlichen Kodierungen und speichert sie als ein unterschiedliches MPEG-4-Fragment.
Bei bestimmten Ausführungsformen schreibt der Fragmentschreiber die RTP-Daten für eine bestimmte Kodierung und das Show-ID-Feld in eine einzelne Datei. In dieser Datei befinden sich Metadateninformationen, die die gesamte Datei (MOOV-Blöcke) beschreiben. Atome sind als Gruppen von MOOF/MDAT-Paaren gespeichert, die es ermöglichen, dass eine Show als eine einzelne Datei gespeichert wird. Am Ende der Datei befinden sich Direktzugriffinformationen, die dazu verwendet werden können, es einem Client zu ermöglichen, eine Bandbreitenanpassungs- und Trickspielfunktionalität auszuführen.
Bei verschiedenen Ausführungsformen weist der Fragmentschreiber eine Option auf, die Fragmente verschlüsselt, um eine Stromsicherheit während des Aufzeichnungsprozesses sicherzustellen. Der Fragmentschreiber fordert einen Kodierungsschlüssel von dem Lizenzmanager an. Die verwendeten Schlüssel sind demjenigen für DRM im Wesentlichen gleich. Das Kodierungsformat unterscheidet sich geringfügig dort, wo MOOF kodiert ist. Die Verschlüsselung erfolgt einmal, so dass bei Lieferung zu Clients keine außerordentlich hohen Kosten entstehen.
Der Fragmentserver reagiert auf HTTP-Anforderungen bezüglich Inhalt. Bei verschiedenen Ausführungsformen stellt er APIs bereit, die von Clients verwendet werden können, um erforderliche Header zu erhalten, die zum Dekodieren des Videos, Suchen nach einem gewünschten Zeitrahmen innerhalb des Fragments und APIs zum Live-Betrachten von Kanälen benötigt werden. Tatsächlich werden Live-Kanäle von den zuletzt geschriebenen Fragmenten für die Show auf diesem Kanal bedient. Der Fragmentserver sendet den Medien-Header (erforderlich zum Initialisieren von Dekodierern), bestimmte Fragmente und den Direktzugriffsblock zu den Clients zurück. Bei verschiedenen Ausführungsformen ermöglichen die unterstützten APIs eine Optimierung dort, wo die Metadaten-Header-Informationen zusammen mit dem ersten Fragment zu dem Client zurückgesendet werden. Der Fragmentschreiber erstellt eine Reihe von Fragmenten innerhalb der Datei. Wenn ein Client einen Strom anfordert, erstellt er Anforderungen für jedes dieser Fragmente, und der Fragmentserver liest den Bereich der Datei, der zu diesem Fragment gehört, und sendet es zu dem Client zurück.
Bei verschiedenen Ausführungsformen verwendet der Fragmentserver eine REST-API, die cachefreundlich ist, so dass die meisten an den Fragmentserver gestellten Anforderungen zwischengespeichert können. Der Fragmentserver verwendet Cache-Steuerungs-Headers und ETag-Headers zum Erzeugen der korrekten Hinweise an Cachespeicher. Diese API bewirkt ferner ein Verständnis dafür, wo ein bestimmter Benutzer das Abspielen gestoppt hat, und für das Starten des Abspielens von diesem Punkt aus (bietet die Möglichkeit zu einer Pause an einer Vorrichtung und der Wiederaufnahme an einer anderen).
Bei bestimmten Ausführungsformen folgen Clientanforderungen bezüglich Fragmenten dem folgenden Format:
http://{HOSTNAME}/frag/{CHANNEL}/{BITRATE}/[{ID}/]{COMMAND}[/{ARG}] z. B. http://frag.hosttv.com/frag/1/H8QVGAH264/1270059632.mp4 fragment/42.
Bei verschiedenen Ausführungsformen ist der Kanalname der gleiche wie der des Backend-Kanals, der als der Kanalbereich der SDP-Datei genutzt wird. VOD verwendet einen Kanalnamen mit ”vod”. Die BITRATE sollte dem für RTP-Ströme verwendeten BITRATEN/AUFLÖSUNGS-Identifizererschema folgen. Die ID wird dynamisch zugewiesen. Bei Live Streams kann diese der UNIX-Zeitstempel sein; bei DVR ist diese eine einzigartige ID für die Show; bei VoD ist diese die Asset-ID. Die ID ist optional und nicht in LIVE-Befehl-Anforderungen enthalten. Der Befehl und das Argument werden verwendet, um den genauen gewünschten Befehl und Argumente anzuzeigen. Zum Beispiel wäre zum Anfordern von Segment 42 dieser Bereich ”fragment/42”.
Das URL-Format macht die Anforderungen Inhaltliefernetzwerk-(content delivery network = CDN-)freundlich, da sich die Fragmente nach diesem Punkt nie verändern, so dass zwei separate Clients, die den gleichen Strom betrachten, unter Verwendung eines Cachespeichers bedient werden können. Insbesondere setzt die Headend-Architektur dies wirksam ein um zu verhindern, dass zu viele dynamische Anforderungen an dem Fragmentserver eintreffen, und zwar durch Verwenden eines HTTP-Proxy am Headend zum Zwischenspeichern von Anforderungen.
Bei verschiedenen Ausführungsformen ist der Fragment-Controller ein Daemon, der auf dem Fragmentierer läuft und die Fragmentschreiber-Prozesse verwaltet. Wir schlagen vor, dass er ein konfiguriertes Filter verwendet, das von dem Fragment-Controller ausgeführt wird, um die Liste von aufzuzeichnenden Sendungen zu erzeugen. Dieses Filter integriert externe Komponenten, wie z. B. einen Führungsserver, um zu bestimmen, welche Shows aufgezeichnet werden und welche Sendungs-ID verwendet wird.
Bei verschiedenen Ausführungsformen weist der Client eine Anwendungslogikkomponente und eine Medienwiedergabekomponente auf. Die Anwendungslogikkomponente präsentiert dem Benutzer die UI und kommuniziert ferner mit dem Frontend-Server zwecks Erhalts von für den Benutzer verfügbaren Shows und Authentifizierung. Als Teil dieses Prozesses sendet der Server URLs zu Medienassets zurück, die zu der Medienwiedergabekomponente weitergeleitet werden.
Bei bestimmten Ausführungsformen verlässt sich der Client auf die Tatsache, dass jedes Fragment in einer fragmentierten MP4-Datei eine Sequenznummer aufweist. Unter Verwendung dieses Wissens und einer gut definierten URL-Struktur zum Kommunizieren mit dem Server fordert der Client Fragmente einzeln an, so als ob er separate Dateien von dem Server einfach durch Anfordern von URLs für ansteigenden Sequenznummern zugeordnete Dateien liest. Bei einigen Ausführungsformen kann der Client Dateien anfordern, die in Abhängigkeit von Vorrichtungs- und Netzwerkressourcen höheren oder niedrigeren Bitratenströmen entsprechen.
Da jede Datei die Informationen enthält, die erforderlich sind, um die URL für die nächste Datei zu erstellen, werden keine besonderen Wiedergabelisten-Dateien benötigt, und sämtliche Aktionen (Starten, Kanalwechsel, Suche) können mit einer einzigen HTTP-Anforderung durchgeführt werden. Wenn jedes Fragment heruntergeladen ist, bewertet der Client unter anderem die Größe des Fragments und die zum Herunterladen benötigte Zeit, um zu bestimmen, ob ein Verlangsamen erforderlich ist oder ob genügend Bandbreite verfügbar ist, um eine höhere Bitrate anzufordern.
Da jede Anforderung an den Server wie eine Anforderung an eine separate Datei aussieht, kann die Antwort auf Anforderungen in jedem HTTP-Proxy zwischengespeichert werden oder über jedes HTTP-basierte CDN verteilt werden.
4 zeigt eine Interaktion für einen Client, der einen Live Stream empfängt. Der Client startet die Wiedergabe, wenn ein Fragment 41 von dem Server aus abgespielt wird. Der Client verwendet die Fragmentnummer, so dass er das entsprechende Subsequenz-Dateifragment anfordern kann. Eine Anwendung, wie z. B. eine Abspielanwendung 407, sendet eine Anforderung an ein Mediakit 405. Die Anforderung kann eine Basisadresse und Bitrate enthalten. Das Mediakit 405 sendet eine HTTP-Holanforderung an die Caching-Schicht 403. Bei verschiedenen Ausführungsformen befindet sich die Live-Antwort nicht im Cachespeicher, und die Caching-Schicht 403 leitet die HTTP-Hofanweisung an einen Fragmentserver 401 weiter. Der Fragmentserver 401 führt eine Verarbeitung durch und sendet das entsprechende Fragment an die Caching-Schicht 403, die die Daten zu dem Mediakit 405 weiterleitet.
Das Fragment kann für einen kurzen Zeitraum an der Caching-Schicht 403 zwischengespeichert werden. Das Mediakit 405 identifiziert die Fragmentnummer und stellt fest, ob die Ressourcen ausreichen, um das Fragment abzuspielen. Bei einigen Beispielen reichen die Ressourcen, wie z. B. Verarbeitungs- oder Bandbreitenressourcen, nicht aus. Das Fragment kann nicht schnell genug empfangen werden oder die Vorrichtung kann Schwierigkeiten beim Dekodieren des Fragments mit ausreichender Geschwindigkeit haben. Folglich kann das Mediakit 405 ein nächstes Fragment anfordern, das eine andere Datenrate aufweist. In einigen Fällen kann das Mediakit 405 ein nächstes Fragment anfordern, das eine höhere Datenrate aufweist. Bei verschiedenen Ausführungsformen hält der Fragmentserver 401 Fragmente für eine unterschiedliche Qualität von Service Streams mit Zeitsteuerungs-Synchronisierungsinformationen fest, um eine zeitgenaue Wiedergabe zu ermöglichen.
Das Mediakit 405 fordert ein nächstes Fragment unter Verwendung von Informationen von dem empfangenen Fragment an. Bei verschiedenen Ausführungsformen kann das nächste Fragment für den Medienstrom auf einem anderen Server festgehalten werden, eine andere Bitrate aufweisen oder eine andere Autorisierung serforderlich machen. Die Caching-Schicht 403 stellt fest, dass sich das nächste Fragment nicht im Cachespeicher befindet und leitet die Anforderung an den Fragmentserver 401 weiter. Der Fragmentserver 401 sendet das Fragment zu der Caching-Schicht 403, und das Fragment wird für einen kurzen Zeitraum zwischengespeichert. Das Fragment wird dann an das Mediakit 405 gesendet.
5 zeigt ein Beispiel für eine Technik zum Liefern von Medienstromfragmenten. Bei verschiedenen Ausführungsformen wird bei 501 eine Anforderung bezüglich eines Medienstroms von einer Clientvorrichtung kommend empfangen. Bei bestimmten Ausführungsformen ist die Anforderung eine HTTP-HOL-Anforderung mit einer Basis-URL, einer Bitrate und einem Dateinamen. Bei 503 wird festgestellt, ob den angeforderten Medienströmen zugeordnete aktuelle Fragmente verfügbar sind. Bei verschiedenen Ausführungsformen werden Fragmente mehrere Minuten lang in einer Caching-Schicht zwischengespeichert, um eine Nahezu-Live-Verteilung von Medienströmen zu ermöglichen. Bei 505 wird die der Anforderung zugeordnete Bitrate identifiziert. Bei verschiedenen Ausführungsformen wird ein aktuelles Fragment für den Medienstrom erhalten und bei 507 mit einer Fragmentnummer und einer Boxstruktur, die Synchronisierungsinformationen, Kapitelinformationen und Dateiendeinformationen unterstützt, gesendet. Es sei angemerkt, dass nicht jedes Fragment Synchronisierungs-, Kapitel- und Dateiendeinformationen enthält.
Bei verschiedenen Ausführungsformen werden Synchronisierungsinformationen zum Synchronisieren von Audio und Video verwendet, wenn die Wiedergabe in der Mitte eines Stroms beginnt. Dateiendeinformationen signalisieren, wann das aktuelle Programm oder die aktuelle Datei beendet ist. Diese können Informationen zum Fortsetzen des Streaming des nächsten Programms oder der nächsten Datei beinhalten. Kapitelinformationen können für Video-on-demand-Inhalt verwendet werden, der in Kapitel unterteilt ist, die möglicherweise durch Werbeslots voneinander getrennt sind.
Bei 509 wird das übertragene Fragment für einen begrenzten Zeitraum in dem Cachespeicher festgehalten. Bei 511 wird eine Anforderung bezüglich eines nachfolgenden Fragments empfangen. Bei verschiedenen Ausführungsformen weist das nachfolgende Fragment eine Fragmentnummer auf, die direkt auf das zuvor übertragene Fragment bezogen ist. Bei einigen Beispielen kann die Clientvorrichtung eine andere Bitrate anfordern oder die gleiche Bitrate anfordern. Bei 513 wird festgestellt, ob ein Fragment mit der entsprechenden Fragmentnummer in dem Cachespeicher verfügbar ist. Andernfalls werden bei 515 die Bitrate und Fragmentnummer bestimmt, um das entsprechende Fragment zu erhalten. Bei einigen Beispielen ist die Fragmentnummer um eins größer als die Fragmentnummer für das zuvor übertragene Fragment.
Bei einigen Beispielen kann die Clientvorrichtung eine signifikant andere Fragmentnummer anfordern, die einem anderen Zeitindex entspricht. Dies ermöglicht es einer Clientvorrichtung, nicht nur eine Qualitätsverschiebung durch Anfordern einer anderen Bitrate zu bewirken, sondern auch eine Zeitverschiebung durch Anfordern eines zuvor bereits übertragenen früheren Segments. Bei verschiedenen Ausführungsformen wird ein aktuelles Fragment für den Medienstrom erhalten und bei 517 mit einer Fragmentnummer und einer Boxstruktur, die Synchronisierungsinformationen, Kapitelinformationen und Dateiendeinformationen unterstützt, gesendet.
Das System kann dann auf Anforderungen bezüglich weiterer Fragmente warten, die Nahezu-Live Streams zugeordnet sind.
6 zeigt eine Technik zum Durchführen einer Qualitätsanpassung unter Verwendung eines fragmentierten Medienstroms. Bei 601 wird eine Anforderung bezüglich eines Medienfragments von einer Clientvorrichtung kommend empfangen. Die Anforderung kann eine HTTP-HOL-Anforderung sein, die eine bestimmte Bitrate und einen Medienidentifizierer enthält. Bei 605 identifiziert ein Inhaltsserver oder Fragmentserver die Bitrate und das Medium. Bei verschiedenen Ausführungsformen identifiziert der Inhaltsserver ferner den Benutzer und die Vorrichtung, um zu prüfen, ob der Benutzer autorisiert ist, den Medieninhalt auf der bestimmten Vorrichtung zu betrachten. Bei einigen Beispielen werden der Benutzer und die Vorrichtung identifiziert, um die angemessene Qualität des Medienstroms oder die Version des Medienstroms, der der Clientvorrichtung zugeführt wird, festzustellen. Bei 607 wird ein Fragment mit einer Fragmentnummer und einer Boxstruktur, die Synchronisierungsinformationen, Kapitelinformationen und Dateiendeinformationen unterstützt, gesendet.
Bei verschiedenen Ausführungsformen werden Synchronisierungsinformationen zum Synchronisieren von Audio und Video verwendet, wenn die Wiedergabe in der Mitte eines Stroms beginnt. Dateiendeinformationen signalisieren, wann das aktuelle Programm oder die aktuelle Datei beendet ist. Diese können Informationen zum Fortsetzen des Streaming des nächsten Programms oder der nächsten Datei beinhalten. Kapitelinformationen können für Video-on-demand-Inhalt verwendet werden, der in Kapitel unterteilt ist, die möglicherweise durch Werbeslots voneinander getrennt sind.
Bei 609 wird ein Wiedergabestopp identifiziert. Der Wiedergabestopp kann durch eine Anforderung der Clientvorrichtung zum Stoppen der Wiedergabe identifiziert werden. Bei anderen Ausführungsformen kann der Wiedergabestopp identifiziert werden, wenn ein Inhaltsserver innerhalb eines vorbestimmten Zeitraums keine Anforderung bezüglich weiterer Medienfragmente von einer Clientvorrichtung empfängt. Bei noch weiteren Ausführungsformen kann der Wiedergabestopp identifiziert werden, wenn ein Inhaltsserver keine entsprechende Bestätigung von einer Clientvorrichtung empfängt. Bei 611 werden Benutzer- und Medienpositionsinformationen festgehalten. Bei einigen Ausführungsformen können Bitraten-, Versions-, Vorrichtungs- und andere Qualitäts- und Speicherstelleninformationen festgehalten werden.
Bei 613 wird eine Anforderung bezüglich eines nachfolgenden Medienfragments von einem Benutzer kommend empfangen. Bei verschiedenen Ausführungsformen wird die Anforderung von einer anderen Vorrichtung kommend empfangen, oder sie kann über Netzwerkbedingungen empfangen werden, die jetzt eine andere Bitrate unterstützen. Bei 615 werden der autorisierte Benutzer, die autorisierte Vorrichtung und die autorisierte Bitrate identifiziert. Bei verschiedenen Ausführungsformen werden Benutzer- und Medienpositionsinformationen erhalten. Bei 617 wird das Fragment mit einer folgenden Fragmentnummer, die den festgehaltenen Medienpositionsinformationen entspricht, mit einer Boxstruktur, die Synchronisierungsinformationen, Kapitelinformationen und Dateiendeinformationen unterstützt, gesendet. Bei einigen Beispielen brauchen nicht sämtliche der Synchronisierungsinformationen, Kapitelinformationen und Dateiendeinformationen gesendet zu werden. Bei einigen Beispielen kann die Boxstruktur nur Synchronisierungsinformationen enthalten, wobei anderer Arten von Informationen unterstützt werden, jedoch nicht enthalten sind.
7 zeigt ein Beispiel für einen Fragmentserver. Bei bestimmten Ausführungsformen weist ein System 700, das zum Implementieren von bestimmten Ausführungsformen der vorliegenden Erfindung geeignet ist, einen Prozessor 701, einen Speicher 703, eine Schnittstelle 711 und einen Bus 715 (z. B. einen PCI-Bus oder eine andere Zwischenverbindungsstruktur) auf und fungiert als ein Streaming Server. Wenn der Prozessor 701 unter der Steuerung einer geeigneten Software oder Firmware arbeitet, ist er zuständig für das Modifizieren und Übertragen von Live-Mediendaten zu einem Client. Verschiedene speziell ausgestaltete Vorrichtungen können anstelle eines Prozessors 701 oder zusätzlich zu dem Prozessor 701 ebenfalls verwendet werden. Die Schnittstelle 711 ist typischerweise dazu ausgebildet, Datenpakete oder Datensegmente über ein Netzwerk zu senden und zu empfangen.
Bestimmte Beispiele für Schnittstellenunterstützungen umfassen Ethernet-Schnittstellen, Frame Relay-Schnittstellen, Kabelschnittstellen, DSL-Schnittstellen, Token Ring-Schnittstellen und dergleichen. Ferner können verschiedene Höchstgeschwindigkeits-Schnittstellen vorgesehen sein, wie z. B. schnelle Ethernet-Schnittstellen, Gigabit-Ethernet-Schnittstellen, ATM-Schnittstellen, HSSI-Schnittstellen, POS-Schnittstellen, FDDI-Schnittstellen und dergleichen. Generell können diese Schnittstellen Ports aufweisen, die für eine Kommunikation mit den entsprechenden Medien geeignet sind. In einigen Fällen können sie ferner einen unabhängigen Prozessor und in einigen Fällen einen flüchtigen RAM aufweisen. Die unabhängigen Prozessoren können solche kommunikationsintensiven Aufgaben, wie z. B. Paketvermittlung, Medienkontrolle und -verwaltung, steuern.
Bei verschiedenen Ausführungsformen ist das System 700 ein Fragmentserver, der ferner einen Sendeempfänger, Streaming-Puffer und eine Programmführer-Datenbank umfasst. Dem Fragmentserver können ferner Abonnementverwaltungs-, Protokollierungs- und Berichterzeugungs- sowie Überwachungsfunktionen zugeordnet sein. Bei bestimmten Ausführungsformen gibt es eine Funktionalität, die eine Operation mit mobilen Vorrichtungen, wie z. B. Mobiltelefonen, die in einem bestimmten Mobilfunknetz arbeiten, ermöglicht und eine Abonnementverwaltung bietet. Bei verschiedenen Ausführungsformen prüft ein Authentifizierungsmodul die Identität von Vorrichtungen, einschließlich mobiler Vorrichtungen. Ein Protokollierungs- und Berichterzeugungsmodul verfolgt Anfragen von mobilen Vorrichtungen und dazugehörige Antworten. Ein Monitorsystem ermöglicht es einem Administrator, Nutzungsverhalten und Systemverfügbarkeit zu überprüfen. Bei verschiedenen Ausführungsformen verarbeitet der Fragmentserver 791 Anfragen und Antworten für medieninhaltsbezogene Transaktionen, während ein separater Streaming Server die eigentlichen Medienströme liefert.
Obwohl ein bestimmter Fragmentserver 791 beschrieben worden ist, sei darauf hingewiesen, dass eine Vielzahl von alternativen Konfigurationen möglich ist. Zum Beispiel sind einige Module, wie z. B. ein Bericht- und Protokollierungsmodul 753 und ein Monitor 751, möglicherweise nicht bei jedem Server erforderlich. Alternativ können die Module in einer anderen mit dem Server verbundenen Vorrichtung implementiert sein. Bei einem weiteren Beispiel weist der Server 791 möglicherweise keine Schnittstelle zu einer abstrakten Kaufmaschine auf und kann vielmehr die abstrakte Kaufmaschine selbst aufweisen. Eine Vielzahl von Konfigurationen ist möglich.
In der vorstehenden Beschreibung ist die Erfindung mit Bezug auf spezifische Ausführungsformen dargestellt worden. Ein Fachmann auf dem Sachgebiet erkennt jedoch, dass verschiedene Modifikationen und Änderungen durchgeführt werden können, ohne dass dadurch vom Umfang der Erfindung abgewichen wird, wie sie in den nachstehenden Patentansprüchen dargelegt ist. Entsprechend müssen die Beschreibung und die Figuren im erläuternden und nicht im einschränkenden Sinne ausgelegt werden, und sämtliche solcher Modifikationen gelten als in den Umfang der Erfindung fallend.
ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Nicht-Patentliteratur

ISO/IEC 14496-12 [0035]

Claims

Verfahren, das umfasst: Empfangen einer ersten Anforderung von einem Benutzer zum Abspielen eines Medienprogramms auf einer ersten Vorrichtung, die ein erstes Qualitätsniveau unterstützt; Übertragen eines ersten Fragments, das dem bei dem ersten Qualitätsniveau kodierten Medienprogramm zugeordnet ist, zu der ersten Vorrichtung, wobei das erste Fragment eine erste Fragmentnummer und eine Boxstruktur aufweist, die Synchronisierungsinformationen und Dateiendeinformationen unterstützt; Empfangen einer zweiten Anforderung von dem Benutzer zum Abspielen des Medienprogramms auf einer zweiten Vorrichtung, die ein zweites Qualitätsniveau unterstützt, das sich von dem ersten Qualitätsniveau unterscheidet; Identifizieren einer Medienprogrammposition, die zum Wiederaufnehmen des Abspielens an einem Server festgehalten wird; Übertragen eines zweiten Fragments, das dem Live-Medien-Programm zugeordnet ist, zu der zweiten Vorrichtung, wobei das zweite Fragment eine zweite Fragmentnummer aufweist, die unter Verwendung der Medienprogrammposition abgeleitet wird.
Verfahren nach Anspruch 1, bei dem die Boxstruktur ferner Kapitelinformationen unterstützt.
Verfahren nach Anspruch 1, bei dem die Fragmentnummer einem Zeitindex entspricht.
Verfahren nach Anspruch 1, bei dem die erste Anforderung eine HTTP-HOL-Anforderung ist.
Verfahren nach Anspruch 1, bei dem die Synchronisierungsinformationen zum Synchronisieren von Audio und Video verwendet werden, wenn die Wiedergabe in der Mitte eines Stroms beginnt.
Verfahren nach Anspruch 1, bei dem das erste Fragment und das zweite Fragment unterschiedliche Bereiche des Nahezu-Live-Medienprogramms aufweisen.
Verfahren nach Anspruch 6, bei dem die Clientvorrichtung mit der Wiedergabe des Nahezu-Live-Programms vor Empfangen des zweiten Fragments beginnt.
Verfahren nach Anspruch 6, bei dem die Dateiendeinformationen signalisieren, wann das Nahezu-Live-Medienprogramm beendet ist.
Verfahren nach Anspruch 8, bei dem die Dateiendeinformationen Informationen zum Fortsetzen des Streaming eines nächsten Programms oder einer nächsten Datei enthalten.
Verfahren nach Anspruch 2, bei dem die Kapitelinformationen für Videoon-demand-Inhalt verwendet werden, der in Kapitel unterteilt ist.
Verfahren nach Anspruch 1, bei dem der Server ein Inhaltsserver ist.
Einrichtung, die aufweist: eine Eingangsschnittstelle, die dazu ausgebildet ist, eine erste Anforderung von einem Benutzer zum Abspielen eines Medienprogramms auf einer ersten Vorrichtung, die ein erstes Qualitätsniveau unterstützt, und eine zweite Anforderung von dem Benutzer zum Abspielen des Medienprogramms auf einer zweiten Vorrichtung, die ein zweites Qualitätsniveau unterstützt, das sich von dem ersten Qualitätsniveau unterscheidet, zu empfangen; einen Speicher, der dazu ausgebildet ist, eine Medienprogrammposition zum Wiederaufnehmen des Abspielens für den Benutzer festzuhalten; eine Ausgangsschnittstelle, die dazu vorgesehen ist, ein erstes Fragment, das dem bei dem ersten Qualitätsniveau kodierten Medienprogramm zugeordnet ist, zu der ersten Vorrichtung zu übertragen, wobei das erste Fragment eine erste Fragmentnummer und eine Boxstruktur aufweist, die Synchronisierungsinformationen und Dateiendeinformationen unterstützt; wobei ein zweites Fragment, das dem Live-Medienprogramm zugeordnet ist, zu der zweiten Vorrichtung übertagen wird, wobei das zweite Fragment eine zweite Fragmentnummer aufweist, die unter Verwendung der Medienprogrammposition abgeleitet wird.
Einrichtung nach Anspruch 12, bei der die Boxstruktur ferner Kapitelinformationen unterstützt.
Einrichtung nach Anspruch 12, bei der die Fragmentnummer einem Zeitindex entspricht.
Einrichtung nach Anspruch 12, bei der die erste Anforderung eine HTTP-HOL-Anforderung ist.
Einrichtung nach Anspruch 12, bei der die Synchronisierungsinformationen zum Synchronisieren von Audio und Video verwendet werden, wenn die Wiedergabe in der Mitte eines Stroms beginnt.
Einrichtung nach Anspruch 12, bei der das erste Fragment und das zweite Fragment unterschiedliche Bereiche des Nahezu-Live-Medienprogramms aufweisen.
Einrichtung nach Anspruch 17, bei der die Clientvorrichtung mit der Wiedergabe des Nahezu-Live-Programms vor Empfangen des zweiten Fragments beginnt.
Einrichtung nach Anspruch 17, bei der die Dateiendeinformationen signalisieren, wann das Nahezu-Live-Medienprogramm beendet ist.
Computerlesbares Speichermedium, das aufweist: einen Computercode zum Empfangen einer ersten Anforderung von einem Benutzer zum Abspielen eines Medienprogramms auf einer ersten Vorrichtung, die ein erstes Qualitätsniveau unterstützt; einen Computercode zum Übertragen eines ersten Fragments, das dem bei dem ersten Qualitätsniveau kodierten Medienprogramm zugeordnet ist, zu der ersten Vorrichtung, wobei das erste Fragment eine erste Fragmentnummer und eine Boxstruktur aufweist, die Synchronisierungsinformationen und Dateiendeinformationen unterstützt; einen Computercode zum Empfangen einer zweiten Anforderung von dem Benutzer zum Abspielen des Medienprogramms auf einer zweiten Vorrichtung, die ein zweites Qualitätsniveau unterstützt, das sich von dem ersten Qualitätsniveau unterscheidet; einen Computercode zum Identifizieren einer Medienprogrammposition, die zum Wiederaufnehmen des Abspielens an einem Server festgehalten wird; einen Computercode zum Übertragen eines zweiten Fragments, das dem Live-Medien-Programm zugeordnet ist, zu der zweiten Vorrichtung, wobei das zweite Fragment eine zweite Fragmentnummer aufweist, die unter Verwendung der Medienprogrammposition abgeleitet wird.