DE60214721T2 - Aufnahmespur für verbesserte videokompression - Google Patents

Aufnahmespur für verbesserte videokompression Download PDF

Info

Publication number
DE60214721T2
DE60214721T2 DE60214721T DE60214721T DE60214721T2 DE 60214721 T2 DE60214721 T2 DE 60214721T2 DE 60214721 T DE60214721 T DE 60214721T DE 60214721 T DE60214721 T DE 60214721T DE 60214721 T2 DE60214721 T2 DE 60214721T2
Authority
DE
Germany
Prior art keywords
video
track
data
edit
video data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60214721T
Other languages
English (en)
Other versions
DE60214721D1 (de
Inventor
F. Michael Monte Sereno CULBERT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Computer Inc filed Critical Apple Computer Inc
Application granted granted Critical
Publication of DE60214721D1 publication Critical patent/DE60214721D1/de
Publication of DE60214721T2 publication Critical patent/DE60214721T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Color Television Image Signal Generators (AREA)
  • Color Television Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Picture Signal Circuits (AREA)

Description

  • Hintergrund der Erfindung
  • Rechnersysteme werden für die Bearbeitung (Editierung) von Videodaten eingesetzt. Rechnersysteme werden ebenso zur Komprimierung von Videodaten verwendet. Die Moving Picture Experts Group (MPEG) hat die Videokomprimierungsstandards MPEG-1, MPEG-2 und MPEG-4 definiert. MPEG-1 ist ein Standard zum Speichern und Abrufen von Bewegtbildern und Audiodaten auf Speichermedien. MPEG-2 ist ein Standard zur Videokomprimierung für Produkte wie dem Digitalfernsehen und DVDs. MPEG-4 ist ein Standard für Multimediainhalte für das Web. Solche Komprimierungsprozesse bedingen im Allgemeinen den Verlust an Videoqualität, um die gewünschte Videokomprimierung zu erzielen.
  • Die zur Komprimierung von Videodaten mit MPEG-2 verwendeten Prozesse bedingen, dass eine Videokomprimierung der Videodaten, die mit bestimmten Spezialeffekten bearbeitet wurden, länger dauert als die Komprimierung von Videodaten ohne bestimmte Spezialeffekte, und dies kann zu einer schlechteren Qualität des komprimierten Videos führen. Im Allgemeinen erfordern die Prozesse, die zur Komprimierung der Videodaten unter MPEG-2 verwendet werden, die Verwendung eines Komprimierungsalgorithmus zur Komprimierung der Videodaten. Die komprimierten Videodaten können dann dekomprimiert und mit den Originalvideodaten verglichen werden. Wenn der Fehler zwischen den daraus entstehenden Videodaten und den Originalvideodaten zu groß ist, wird der Algorithmus angepasst oder ein anderer Algorithmus zur Komprimierung der Videodaten verwendet. Der Fehler wird dann erneut geprüft, bis ein Algorithmus gefunden wird, der einen zufriedenstellenden Fehler bietet. Solche iterative Prozesse des Ausprobierens verschiedener Algorithmen, um einen akzeptablen Fehler zu erhalten, beanspruchen sehr viel Verarbeitungszeit und mindern die Videoqualität. Solch ein Prozess kann mit einem 733 MHz Power Mac G4TM von Apple Computer Inc.TM mit Sitz in Cupertino CA mit 8 Gigaflops zweimal die Echtzeit für die Videokomprimierung benötigen, d.h. 60 Minuten zur Komprimierung eines Films mit 30 Minuten Länge.
  • Es wäre erstrebenswert, ein Rechnersystem zur Verfügung zu stellen, das in der Lage ist, die Videokomprimierung in höherer Geschwindigkeit zu liefern, oder das eine höhere Qualität und eine verbesserte Videokomprimierung bieten kann.
  • WO-A-01/93594, ein Teil des Stands der Technik unter Artikel 54(3) EPC, beschreibt ein Verfahren zur Bildkomprimierungskodierung, das aufgezeichnete Hilfsdaten verwendet. Hilfsdaten umfassen Informationen, die sich auf Kodierungsparameter beziehen, die während einer vorhergehenden Kodierung der Bilddaten verwendet wurden, und die einem weiteren Kodierer gestatten können, die vom vorherigen Kodierer verwendeten Kodierungsparameter wiederzuverwenden. Die Hilfsdaten können selektiv wiederverwendet werden, indem eine elektronische Signatur hinzugefügt wird, die die Beschränkungen des Kodierers angibt. Es ist somit möglich festzustellen, ob die Hilfsdaten für die nachfolgende Kodierung mit anderen Beschränkungen wiederverwendbar sind oder nicht.
  • Gemäß dem ersten Aspekt der Erfindung wird ein rechnerlesbares Medium zur Verfügung gestellt, das Programmanweisungen zur Komprimierung von Videodaten mit einer Bearbeitungsspur enthält, wobei die Videodaten bearbeitet wurden und Videoeffekte enthalten, und die Bearbeitungsspur die zu den Videoeffekten gehörigen Videobearbeitungsdaten speichert und einen Bereich eines Rahmens, in dem eine Videobearbeitung stattgefunden hat, und die Art der Bearbeitung, die in diesem Bereich auftrat, angibt, wobei die Programmanweisungen umfassen:
    einen rechnerlesbaren Code für den Zugriff auf einen Rahmen von Videodaten;
    einen rechnerlesbaren Code für den Zugriff auf Videobearbeitungsdaten, die in der Bearbeitungsspur gespeichert sind und dem Rahmen der Videodaten entsprechen; und
    einen rechnerlesbaren Code zur Komprimierung der Videodaten mit Hilfe der Videobearbeitungsdaten in der Bearbeitungsspur während der Komprimierung der Videodaten.
  • Gemäß eines weiteren Aspekts der Erfindung ist ein Verfahren zur Komprimierung von Videodaten mit einer Bearbeitungsspur vorgesehen, wobei die Videodaten bearbeitet wurden und Videoeffekte enthalten, und die Bearbeitungsspur die zu den Videoeffekten gehörigen Videobearbeitungsdaten speichert und einen Bereich eines Rahmens, in dem eine Videobearbeitung aufgetreten ist und die Art der in diesem Bereich aufgetretenen Bearbeitung angibt, so dass ein Komprimierungsprogramm darauf zugreifen kann, wobei das Verfahren umfasst:
    Zugriff auf einen Rahmen von Videodaten;
    Zugriff auf Videobearbeitungsdaten in der Bearbeitungsspur entsprechend dem Rahmen der Videodaten; und
    Komprimierung der Videodaten mit den Videobearbeitungsdaten in der Bearbeitungsspur während der Komprimierung der Videodaten.
  • Nach einem weiteren Aspekt der Erfindung ist ein System zur Komprimierung von bearbeiteten Videodaten vorgesehen, um Videoeffekte mit einer bearbeiteten Videospur, einer Audiospur und einer Bearbeitungsspur aufzunehmen, die zu den Videoeffekten gehörige Videobearbeitungsdaten speichert, und die einen Bereich eines Rahmens, in dem eine Videobearbeitung auftrat und die Art der Bearbeitung, die in diesem Bereich auftrat, in einem Format angibt, auf das ein Komprimierungsprogramm zugreifen kann, wobei das System umfasst:
    einen Bearbeitungsspurleser für den Zugriff auf die Videobearbeitungsdaten in der Bearbeitungsspur und zum Generieren von Anweisungen auf der Basis der Videobearbeitungsdaten in der Bearbeitungsspur; und
    eine Videokomprimierungseinrichtung, die Anweisungen von dem Bearbeitungsspurleser und die bearbeitete Videospur und Audiospur empfängt, und die mit einem Komprimierungsprogramm das bearbeitete Video gemäß den Anweisungen vom Bearbeitungsspurleser komprimiert.
  • Diese und andere Funktionen der vorliegenden Erfindung werden im Folgenden ausführlicher in der detaillierten Beschreibung der Erfindung und in Verbindung mit den folgenden Abbildungen beschrieben.
  • Die vorliegende Erfindung wird beispielhaft in den Abbildungen der begleitenden Zeichnungen veranschaulicht, was nicht als Einschränkung zu verstehen ist, wobei die Referenzziffern auf dieselben Elemente verweisen, in denen:
  • 1A und 1B ein an einem Camcorder angeschlossenes Rechnersystem darstellen, das für die Implementierung von Ausführungsformen der vorliegenden Erfindung geeignet ist.
  • 2 ein übersichtsmäßiges Flussdiagramm eines Prozesses ist, der die Erfindung verwendet.
  • 3 ein detaillierteres Flussdiagramm eines Beispiels eines Videobearbeitungsprozesses ist, der während des Videobearbeitungsschritts auftreten kann.
  • 4 eine schematische Illustration eines Beispiels bearbeiteter Videodaten und den resultierenden komprimierten Videodaten ist.
  • 5 ein detaillierteres Flussdiagramm eines Beispiels eines Videokomprimierungsschritts ist.
  • 6 ein detaillierteres Flussdiagramm zur Kodierung von Rahmen in ein komprimiertes Format wie MPEG-2 ist.
  • 7 ein detaillierteres Flussdiagramm des Textverarbeitungsschritts ist.
  • 8 ein detailliertes Flussdiagramm des Verarbeitungsschritts der Überblendung ist.
  • 9 ein detaillierteres Flussdiagramm der Überlagerungsverarbeitungsschritts des Bewegtvideos ist.
  • 10 eine schematische Ansicht einer Ausführungsform des Farbstanzprozesses (Chroma Key-Prozesses) der Erfindung ist.
  • 11 eine schematische Illustration des Komprimierungssystems ist, das in einer Ausführungsform der Erfindung verwendet werden kann.
  • Detaillierte Beschreibung der bevorzugten Ausführungsformen
  • Die vorliegende Erfindung wird im Folgenden detailliert mit Bezug auf einige der hier bevorzugten Ausführungsformen beschrieben, wie in den begleitenden Zeichnungen veranschaulicht. In der folgenden Beschreibung werden viele spezielle Details dargelegt, um ein fundiertes Verständnis der vorliegenden Erfindung zu ermöglichen. Es ist aber für Kenner der Technik offensichtlich, dass die vorliegende Erfindung ohne einige oder alle dieser speziellen Details ausgeführt werden kann. In anderen Beispielen wurden weithin bekannte Prozessschritte und/oder Strukturen nicht beschrieben, um die vorliegende Erfindung nicht unnötigerweise zu vernebeln.
  • Zur einfacheren Erörterung veranschaulichen 1A und 1B ein mit einem Camcorder verbundenes Rechnersystem 900, das für die Implementierung der Ausführungsformen der vorliegenden Erfindung geeignet ist. 1A zeigt eine mögliche physische Form des Rechnersystems 900, das mit einem Camcorder 901 verbunden ist. Natürlich kann das Rechnersystem viele physische Formen annehmen, von einer integrierten Schaltung, einer Leiterplatte oder einem kleinen tragbaren Gerät bis hin zu einem riesigen Supercomputer. Das Rechnersystem 900 umfasst einen Monitor 902, eine Anzeige 904, ein Gehäuse 906, ein Plattenlaufwerk 908, eine Tastatur 910 und eine Maus 912. Die Platte 914 ist ein rechnerlesbares Medium, das zur Datenübertragung zu und von dem Rechnersystem 900 verwendet wird.
  • 1B ist ein Beispiel eines Blockdiagramms für das Rechnersystem 900. An den Systembus 920 sind eine große Vielzahl von Subsystemen angeschlossen. Der/die Prozessoren) 922 (auch als Central Processing Units oder CPUs bezeichnet) sind mit einem Speichergerät mit dem Speicher 924 gekoppelt. Der Speicher 924 umfasst Speicher mit Zufallszugriff (RAM, Random Access Memory) und Festspeicher (ROM, Read-only Memory). Wie in der Technik wohlbekannt dient ROM der Übertragung von Daten und Anwendungen in einer Richtung, und RAM wird üblicherweise zur bidirektionalen Übertragung von Daten und Anweisungen eingesetzt. Beide Speicherarten können beliebige geeignete rechnerlesbaren Medien umfassen, wie im Folgenden beschrieben. Eine Festplatte 926 ist ebenso bidirektional mit der CPU 922 gekoppelt. Sie bietet zusätzliche Speicherkapazität und kann auch beliebige der im Folgenden beschriebenen rechnerlesbaren Medien umfassen. Die Festplatte 926 kann zur Speicherung von Programmen, Daten und Ähnlichem verwendet werden und ist in der Regel ein sekundäres Speichermedium (wie ein Platte), die langsamer ist als der primäre Speicher. Es ist wünschenswert, dass die Informationen, die sich auf der Festplatte 926 befinden, in den entsprechenden Fällen in standardmäßiger Weise als virtueller Speicher in den Speicher 924 integriert werden. Die entfernbare Platte 914 kann die Form eines beliebigen im Folgenden beschriebenen rechnerlesbaren Mediums aufweisen.
  • CPU 922 ist auch mit einer Vielzahl von Eingangssignal-/Ausgangssignalgeräten gekoppelt, wie der Anzeige 904, der Tastatur 910, der Maus 912 und den Lautsprechern 930. Im Allgemeinen kann ein Eingangssignal-/Ausgangssignalgerät eines der folgenden Geräte sein: Videobildschirm, Trackball, Maus, Tastatur, Mikrofon, Touch-Screen, Wandler-Kartenleser, Magnetband- oder Papierbandleser, Tablett, Stylus, Sprach- oder Handschriftenerkennungsgerät, biometrisches Lesegerät oder andere Rechner. CPU 922 kann optional mit einem anderen Rechner- oder Telekommunikationsnetzwerk über die Netzwerkschnittstelle 940 gekoppelt sein. Mit solch einer Netzwerkschnittstelle wird beabsichtigt, dass die CPU Informationen aus dem Netzwerk empfängt, oder während der Durchführung der oben beschriebenen Verfahrensschritte Informationen an das Netzwerk ausgeben.
  • Darüber hinaus können Verfahrensausführungsformen der vorliegenden Erfindung nur auf der CPU 922 oder über ein Netzwerk wie das Internet in Verbindung mit einer entfernten CPU, die einen Teil der Verarbeitung mit übernimmt, ausgeführt werden.
  • Darüber hinaus beziehen sich die Ausführungsformen der vorliegenden Erfindung auf Rechnerspeicherprodukte mit einem rechnerlesbaren Medium, das hier Rechnercode zur Durchführung verschiedener im Rechner implementierter Operationen aufweist. Die Medien und der Rechnercode können für die Zwecke der vorliegenden Erfindung speziell entworfen und gestaltet sein, oder sie können von der Art sein, die Kennern der Technik wohlbekannt und dafür verfügbar ist. Zu den Beispielen von rechnerlesbaren Medien gehören, sind aber nicht darauf beschränkt: Magnetische Medien wie Festplatten, Disketten und Magnetbänder; optische Medien wie CD-ROMs und DVDs sowie holographische Geräte; magneto-optische Medien wie Floptical Disks; und Hardware-Geräte, die speziell zur Speicherung und Ausführung von Programmcode ausgebildet sind, wie anwendungsspezifische integriertes Schaltungen (Application-specific Integrated Circuits, ASICs), programmierbare Logikgeräte (Programmable Logic Devices, PLDs) sowie ROM- und RAM-Geräte. Beispiele des Rechnercodes umfassen, Maschinencode, wie er von einem Compiler erzeugt wird, und Dateien mit höherstufigem Code, die von einem Rechner mit Hilfe eines Interpreters ausgeführt werden.
  • Zur einfacheren Erörterung ist 2 ein übersichtsmäßiges Flussdiagramm eines Prozesses, der die Erfindung verwendet. Als Erstes werden dem Rechnersystem 900 Videodaten bereitgestellt (Schritt 206). Die Videodaten können eine Video- und Audiospur sein, die von einem Camcorder aufgenommen wurde oder von einem Videorekorder von einer Fernsehsendung aufgezeichnet wurden. Solche Videodaten können vom Camcorder 901 oder einem Videorekorder an das Rechnersystem 900 durch eine Verbindung 950 übertragen werden, wie eine FirewireTM-Verbindung (auch als IEEE 1394 bezeichnet), oder können über einen Medienkonvertierer angeschlossen werden. Die Videodaten können auf Speichermedien gespeichert werden, auf die das Rechnersystem 900 zugreifen kann. Solche Videodaten können nur eine Videospur und eine Audiospur aufweisen und können in Formaten wie dem Digital Video (DV)-Format gespeichert sein.
  • Als Nächstes werden die Videodaten bearbeitet, indem eine Videospur, eine Audiospur und eine Bearbeitungsspur erstellt wird (Schritt 208). Eine Videobearbeitungssoftware, wie iMovieTM oder Final Cut ProTM, die beide von Apple Computer Inc.TM stammen, kann zur Bearbeitung der Videodaten verwendet werden.
  • Diese Videobearbeitungssoftware kann Benutzern ermöglichen, Bearbeitungstechniken zur Erstellung von Videoeffekten zu verwenden, wie beispielsweise, was aber nicht darauf beschränkt ist, das Einfügen von Text in das Video, Überblendungen, Farbkorrekturen, Videoüberlagerungen, Kanteneffekte, Übergänge oder Farbstanzen (Chroma Key; auch Blue Screening, Blauflächentechnik) hinzufügen oder statische Bildüberblendung und statischen Bildüberlagerung durchführen. Jeder Bearbeitungsschritt der Videodaten führt zu Daten, die in einer Bearbeitungsspur gespeichert werden, die den Bearbeitungsschritt aufzeichnet. Herkömmliche Bearbeitungssoftware muss eventuell abgeändert werden, um Daten in der Bearbeitungsspur dergestalt zu speichern, dass die Komprimierungssoftware auf die Bearbeitungsspur zugreifen kann. Die Bearbeitungssoftware speichert auch die bearbeiteten Videodaten in einer Videospur und einer Audiospur.
  • Als Nächstes werden die bearbeiteten Videodaten vom Rechnersystem komprimiert (Schritt 212). Die Komprimierungssoftware, die auf dem Rechnersystem 900 gespeichert sein kann, greift auf die Videospur, die Audiospur und die Bearbeitungsspur zu, um Informationen in der Videospur, der Audiospur und der Bearbeitungsspur zur Komprimierung der Videodaten zu verwenden. In der bevorzugten Ausführungsform werden die Videodaten in ein MPEG-Format komprimiert. Die bevorzugtere Lösung ist, die Videodaten im MPEG-2-Format zu komprimieren.
  • Die komprimierten Videodaten können dann gespeichert werden (Schritt 216). In der bevorzugten Ausführungsform werden die komprimierten Videodaten auf einer DVD gespeichert, so dass sie mit einem DVD-Spieler angezeigt werden können. Es können aber auch andere Medienspeicherverfahren und Anzeigeverfahren verwendet werden.
  • 3 ist ein detaillierteres Flussdiagramm eines Beispiels eines Videobearbeitungsprozesses, der während des Videobearbeitungsschritts erfolgen kann (Schritt 212). Obwohl diese Schritte chronologisch beschrieben werden, können sie in unterschiedlichen Reihenfolgen oder gleichzeitig auftreten. Für jede durch die Bearbeitungssoftware durchgeführte Bearbeitung des Videos werden Videodaten in der Form eines Objekt, wie einer Aufzeichnung, in der Datenspur abgelegt (Schritt 308). In jedem Objekt wird der Bereich des bearbeiteten Rahmens angegeben (Schritt 312). Dieser Bereich ist ein Feld, das die Begrenzungspunkte angibt, die eine beliebige Form definieren, in der die Bearbeitung stattfindet. Die Bearbeitungsart im Grenzbereich wird ebenso angegeben (Schritt 316). Die Bearbeitungsspur wird in einem Format gespeichert, so dass die Komprimierungssoftware auf das Objekt zugreifen kann (Schritt 318).
  • 4 ist eine schematische Illustration eines Beispiels bearbeiteter Videodaten und den resultierenden komprimierten Videodaten. Ein Rahmen von Videodaten 404 umfasst Pixel in der x-Richtung und der y-Richtung. Ein Objekt kann für eine Videoüberlagerung 405 erstellt werden (Schritt 308). Ein Bereich, der wie in 4 ein Oval bildet, wird im Objekt für die Videoüberlagerung angegeben (Schritt 312). Für einen Effekt, wie die Platzierung einer Video-Einfügung und einer ovalen Bewegung, wird angegeben, dass diese im ovalen Grenzbereich stattfindet (Schritt 316). Das Objekt wird dann in der Bearbeitungsspur gespeichert, so dass die Komprimierungssoftware auf das Objekt zugreifen kann (Schritt 318). Ein Objekt kann auch für den hinzugefügten Text 406 erstellt werden. Ein Bereich, der einen Umriss für das Wort "TEXT" 406 bildet, kann in dem Objekt angegeben werden (Schritt 312). Ein Effekt, wie die Angabe, dass die Schrift des Textes Times 24 Punkt in Schwarz mit Kantenglättung (Antialiasing) ist, wird ebenso im definierten Bereich angegeben (Schritt 316). Das hinzugefügte Textobjekt wird ebenso in der Bearbeitungsspur in einem Format gespeichert, auf das die Komprimierungssoftware durch das Ausgabeergebnis der Bearbeitungssoftware zugreifen kann (Schritt 318).
  • 5 ist ein detaillierteres Flussdiagramm eines Beispiels eines Videokomprimierungsschritts (Schritt 212). Zuerst kann ein Intracode-Rahmen (I-Rahmen) 412 aus dem bearbeiteten Videodatenrahmen 404 erzeugt werden (Schritt 508). Die I-Rahmen 412 wird als intrakodierter Rahmen bezeichnet, da der ursprüngliche Rahmen aus dem I-Rahmen ohne andere Rahmen rekonstruiert werden kann. MPEG-2 führt diese Konvertierung mit einer diskreten Kosinustransformation (DKT) und anderen Komprimierungsprozessen durch. Für die diskrete Kosinustransformation werden die Pixel im Rahmen 404 in Blöcke 408 aufgeteilt. Die Intensität und Position der Pixel in jedem Block werden dann an den I-Rahmen 412 übertragen, wo die Intensität und Position der Pixel in einem Block in eine Reihe von Frequenzen und Zeitwerten in einem Block 416 mit Hilfe der diskreten Kosinustransformation umgewandelt werden. DKT transformiert einen Block mit Pixel-Intensitäten in einen Block von Frequenztransformationskoeffizienten. Die Transformation wird dann auf die neuen Blöcke angewendet, bis das gesamte Bild transformiert ist. Ein Teil des Komprimierungsprozesses der Daten wird durch Bildaufrasterung (Dithering) implementiert, wodurch ein einzelner Frequenzwert 420 eine Pixel-Gruppe darstellen kann. Während der Erstellung des I-Rahmens kann die Komprimierungssoftware auf die Bearbeitungsspur zugreifen, um die Anzahl der Bit zu ermitteln, die für die Quantisierung verwendet werden sollen. Das ist die Anzahl der Bit, die zur Darstellung dieses Teils des komprimierten Bildes zugeordnet werden.
  • Als Nächstes wird ein vorwärts-prädizierter Rahmen (P-Rahmen) 432 aus dem nachfolgenden Rahmen von Videodaten 448 und dem I-Rahmen 412 erzeugt (Schritt 512). Im Allgemeinen werden P-Rahmen aus den vorhergehenden I-Rahmen oder vorhergehenden prädizierten Rahmen vorhergesagt. Diese Prädiktionen können zwei Formen aufweisen: Bewegungsvektoren und Differenzvektoren. Bewegungsvektoren 436 geben an, dass ein Punkt von einem Ort an einen anderen verschoben wurde. Differenzvektoren 440 geben an, wie sich ein Punkt verändert hat. Diese vorwärtsprädizierten Rahmen werden dekodiert, indem die Differenzvektoren und Bewegungsvektoren auf einen I-Rahmen angewendet werden und dann eine Dekomprimierung und inverse DKT zur Erzeugung eines Rahmens von Videodaten durchgeführt wird. Algorithmen für die Erzeugung prädiktiver Bewegungsvektoren und Differenzvektoren können auf Grund falscher Prädiktionen erhebliche Fehler verursachen. Auf Grund der Natur der Bearbeitungen können die größten Fehler ein Ergebnis der bearbeiteten Funktionen in. den bearbeiteten Bereichen sein. Daher greift die Komprimierungssoftware der Erfindung auf Bearbeitungsinformationen in der Bearbeitungsspur zu und bildet prädiktive Bewegungsvektoren und Differenzvektoren. Die Verwendung von Bearbeitungsinformationen transformiert die bearbeiteten Bereiche von Stellen, an denen die größten Vorhersagefehler auftreten können, in Bereiche, in denen die Möglichkeit besteht, dass keine Vorhersagefehler vorliegen, da in einigen Fällen keine Vorhersage erforderlich ist, da die Bewegung oder Differenzen zwischen den Rahmen durch das Bearbeitungsobjekt angegeben werden können.
  • Als Nächstes kann ein B-Rahmen aus den bearbeiteten Videodaten, dem I-Rahmen und dem P-Rahmen erstellt werden (Schritt 516). B-Rahmen, aus dem letzten/nächsten I-Rahmen oder P-Rahmen sowohl vorwärts-prädiziert als auch rückwärts-prädiziert, werden auch unter MPEG-2 angegeben. B-Rahmen sind interkodierte Rahmen und benötigt zwei weitere Rahmen, um die Videodaten zu rekonstruieren. Differenzvektoren und Bewegungsvektoren werden auch verwendet, um den B-Rahmen aus den P-Rahmen und I-Rahmen vorherzusagen. Aus diesem Grund sind die Informationen in der Bearbeitungsspur auch zu einer schnelleren Erstellung von B-Rahmen mit weniger Fehlern nützlich.
  • Die Verwendung von Bewegungsvektoren und Differenzvektoren zur Erstellung von P-Rahmen und B-Rahmen ermöglicht eine erhebliche Reduzierung der Datengröße für eine verbesserte Komprimierung. Das Problem bei der Verwendung dieser Bewegungs- und Differenzvektoren zur Datenkomprimierung ist, dass Fehler in den Prädiktionen auftreten können. Da sich die zur Verarbeitung dieser Komprimierungen verwendete CPU-Zeit erhöht, wird auch die Qualität der sich daraus ergebenden Videokomprimierung erhöht.
  • 6 ist ein detaillierteres Flussdiagramm zur Kodierung von Rahmen in ein komprimiertes Format wie MPEG-2, das für die Schritte 508, 512 und 516 verwendet werden kann. Für einen Block in einem Rahmen eines bearbeiteten Videos wird auf Informationen aus der Videospur des Rahmens der bearbeiteten Videodaten zugegriffen (Schritt 608). Auf eine entsprechende Aufzeichnung für den Videorahmen in der Bearbeitungsspur (Bearbeitungsrahmen) wird zugegriffen (Schritt 612). Der Bearbeitungsrahmen wird darauf geprüft, ob es ein Bearbeitungsobjekt im aktuellen Pixel-Block gibt (Schritt 616). Wenn kein Bearbeitungsobjekt im aktuellen Pixel-Block vorliegt, wird die normale MPEG-Komprimierung für den aktuellen Pixel-Block (Schritt 620) verwendet und dann geht der Prozess weiter zum nächsten Pixel-Block (Schritt 648) oder hält an, wenn kein weiterer Pixel-Block mehr vorliegt (Schritt 652). Wenn ein Bearbeitungsobjekt im Pixel-Block vorliegt, wird die Art des Bearbeitungsobjekts bestimmt (Schritt 624). Es gibt viele mögliche Arten von Bearbeitungsobjekten. Wie bereits erwähnt, können zu den möglichen Bearbeitungsobjekten gehören, sind aber nicht darauf beschränkt, das Einfügen von wiedergegebenem (gerendertem) Text in das Video, Überblendung von zwei unterschiedlichen Video-Strömen, Einfügen von Kanteneffekten, das Hinzufügen von Übergängen, Farbstanzen (Blauflächentechnik), statischer Bildüberblendung und statischer Bildüberlagerung. Wenn die Bearbeitungsobjektart bestimmt ist, wird gemäß diesem ein Bearbeitungsverarbeitungsschritt implementiert. Die Verarbeitungsschritte für die Beispielsbearbeitung, die sich auf die Bearbeitung der Objekttypen beziehen, die vor allem in 6 dargestellt werden, sind das Hinzufügen von Text, was zu einem Textverarbeitungsschritt (Schritt 628) weitergeht, die Überblendung, die zu einem Überblendungsverarbeitungsschritt weitergeht (Schritt 632), und das Verschieben der Videoüberlagerungen, das zu einem Videoüberlagerungsschritt weitergeht (Schritt 640). Obwohl in dem in 6 gezeigten Beispiel das Hinzufügen von Text, das Überblenden und Verschieben von Videoüberlagerungen speziell veranschaulicht werden, weisen die Punkte darauf hin, dass eine beliebige Anzahl von zusätzlichen Bearbeitungsobjekttypen hinzugefügt werden kann. Nachdem der Bearbeitungsverarbeitungsschritt abgeschlossen ist, wird der Pixel-Block durchsucht, um festzustellen, ob ein weiteres Objekt im Pixel-Block vorhanden ist (Schritt 616). Wenn ein weiteres Objekt im Pixel-Block vorliegt, wird es wie oben beschrieben verarbeitet. Wenn kein weiteres Bearbeitungsobjekt im Pixel-Block vorliegt, wird die normale MPEG-Komprimierung des aktuellen Pixel-Blocks (Schritt 644) durchgeführt und dann geht der Prozess weiter zum nächsten Pixel-Block (Schritt 648) oder hält an, wenn kein anderer Pixel-Block vorliegt (Schritt 652).
  • 7 ist ein detaillierteres Flussdiagramm des Textverarbeitungsschritts (Schritt 628). Der Grenzbereich um ein Bearbeitungsobjekt wird bestimmt (Schritt 704). Es wird bestimmt, ob der Pixel-Block sich im Grenzbereich um das Bearbeitungsobjekt befindet (Schritt 708). Dieser Schritt ermittelt, ob der Pixel-Block nur einen Teil einer Umrandung des Grenzbereichs enthält oder ob ein Teil des Bearbeitungsobjekts innerhalb des Grenzbereichs im Pixel-Block liegt. Wenn ein Teil des Bearbeitungsobjekts innerhalb des Grenzbereichs im Pixel-Block liegt, dann wird die Bitauflösung der Quantisierung für den Pixel-Block erhöht (Schritt 712). Die Bitauflösung der Quantisierung wird erhöht, indem die Anzahl der Bit erhöht wird, die zur Darstellung des Pixel-Blocks in dem komprimierten Bild verwendet werden. Durch Erhöhung der Bitauflösung der Quantisierung für den aktuellen Pixel-Block wird eine verbesserte Auflösung für Text geliefert, indem der Text vom Video abgehoben werden kann, wobei einige der aktuellen Versuchs- und Irrtumstechniken vermieden werden, bei denen mehrere Kodier- und Dekodierzyklen erforderlich sind, bevor ermittelt wird, dass die Bitauflösung der Quantisierung für den aktuellen Block erhöht werden sollte oder die Texterkennung nicht erfolgreich ist und die Erhöhung der Quantisierungsauflösung nicht gelingt. Bei großem Text kann die Bitauflösungs-Quantisierung um den Textkanten erhöht und in der Textmitte reduziert werden.
  • 8 ist ein detaillierteres Flussdiagramm des Überblendungsverarbeitungsschritts (Schritt 632). Der Grenzbereich um ein Bearbeitungsobjekt wird bestimmt (Schritt 804). Es wird dann bestimmt, ob der Pixel-Block sich im Grenzbereich um das Bearbeitungsobjekt befindet (Schritt 808). Dieser Schritt ermittelt, ob der Pixel-Block nur einen Teil einer Umrandung des Grenzbereichs enthält, oder ob ein Teil des Bearbeitungsobjekts innerhalb des Grenzbereichs im Pixel-Block liegt. Wenn ein Teil des Bearbeitungsobjekts innerhalb des Grenzbereichs im Pixel-Block liegt, dann wird die Bitauflösung der Quantisierung für den Pixel-Block reduziert (Schritt 812). Die Bitauflösung der Quantisierung wird reduziert, indem die Anzahl der Bit reduziert wird, die zur Darstellung des Pixel-Blocks in dem komprimierten Bild verwendet werden. durch die Reduzierung der Bitauflösung der Quantisierung für den aktuellen Pixel-Block wird die Auflösung für die Überblendung reduziert, wobei einige der aktuellen Versuchs- und Irrtumstechniken vermieden werden, bei denen mehrere Kodier- und Dekodierzyklen erforderlich sind, bevor ermittelt wird, dass die Bitauflösung der Quantisierung für den aktuellen Block reduziert werden sollte oder die Überblendungserkennung nicht erfolgreich ist und die Reduzierung der Auflösung der Quantisierung nicht gelingt.
  • 9 ist ein detaillierteres Flussdiagramm des Überlagerungsverarbeitungsschritts des Bewegtvideos (Schritt 640). Der Grenzbereich um ein Bearbeitungsobjekt wird bestimmt (Schritt 964). Es wird dann bestimmt, ob der Pixel-Block sich im Grenzbereich um das Bearbeitungsobjekt befindet (Schritt 968). Dieser Schritt ermittelt, ob der Pixel-Block nur einen Teil einer Umrandung des Grenzbereichs enthält, oder ob ein Teil des Bearbeitungsobjekts innerhalb des Grenzbereichs im Pixel-Block liegt. Wenn ein Teil des Bearbeitungsobjekts innerhalb des Grenzbereichs im Pixel-Block liegt, dann wird ein Bewegungsvektor aus der Bewegungsinformation im Bearbeitungsobjekt abgeleitet (Schritt 972). Die Videoüberlagerung 405 in 4 ist ein Beispiel einer Bewegtvideoüberlagerung.
  • Zwischen dem Videorahmen 404 und dem nachfolgenden Videorahmen 448 bewegt sich die Videoüberlagerung 405 nach rechts, wie gezeigt, I-Rahmen 412 liefert die Videoüberlagerung 405. Zur Erzeugung des P-Rahmens 432 wird auf die Bearbeitungsspur zugegriffen und ermittelt, dass eine Bewegtvideoüberlagerung 405 zu den Videorahmen 404, 448 hinzugefügt wurde. Daraus wird ein Bewegungsvektor 452 zum P-Rahmen hinzugefügt (Schritt 912). Ein sich veränderndes Videobild kann in die Videoüberlagerung 405 eingefügt werden. Das Bearbeitungsobjekt für die Videoüberlagerung gibt an, dass das sich verändernde Videobild in die Videoüberlagerung eingefügt wird, so dass eine Komprimierung im Bereich in der Videoüberlagerung 405 durchgeführt werden kann. Durch Zugriff auf das Bearbeitungsobjekt kann das Komprimierungsprogramm automatisch einen exakten Bewegungsvektor von exakt der Größe der Videoüberlagerung generieren und auch wissen, dass eine Videokomprimierung erfolgen sollte, wenn möglich separat, für den Bereich innerhalb der Videoüberlagerung. Dies ermöglicht eine exaktere und schnellere Komprimierung als der Prozess, bei dem anhand von Versuch und Irrtum die Bewegung und der Bereich der Videoüberlagerung bestimmt und ermittelt wird, dass ein separates Videobild innerhalb der Videoüberlagerung auftritt. Videoüberlagerungen können sich in Größe und Form ändern, was in der Bearbeitungsspur aufgezeichnet werden kann.
  • Bei anderen Bearbeitungsarten können andere Korrekturen bereitgestellt werden. Bei der Farbkorrektur, bei der ein Teil des Videobilds farbkorrigiert wird, kann die Farbkorrektur einige der Farbdetails entfernen. Eine nachfolgende Komprimierung kann den dynamischen Bereich des farbkorrigierten Bildes ändern, so dass das daraus entstehende Bild flach aussieht. Obwohl die Farbkorrektur vor der Komprimierung zufriedenstellend aussehen kann, kann das farbkorrigierte Bild durch die Komprimierung vollkommen unakzeptabel werden. Die Erfindung kann die Auflösung der Quantisierung für den Bereich erhöhen, in dem eine Farbkorrektur stattgefunden hat, um eine exaktere Frequenzkonstante über kleinere Bildbereiche zu liefern.
  • Für Kanteneffekte kann eine Überlagerung oder ein anderes Objekt mit einer Kante versehen werden. Ein Beispiel hierfür ist die Verwendung einer Kanteneffekts für Text, um geprägten Text zu erstellen. Bei Kanteneffekten kann die Erfindung die Auflösung nur um die Kante des Kanteneffektbereichs erhöhen.
  • Es gibt viele verschiedene Übergänge, mit denen ein Videoclip durch ein anderes ersetzt werden kann. Die von der Erfindung bereitgestellte Art der Verarbeitung hängt von der Art des Übergangs ab. Bei einem Übergang in Form des Umblätterns einer Seite kann die Erfindung mehrere I-Rahmen benötigen. In dieser Übergangsart des Umblätterns von Seiten verschwinden Pixel aus einem Video, wenn sie durch Bilder aus einem anderen Video während des Übergangs des Umblätterns der Seite ersetzt werden. Da die Pixel durch ein anderes Bild ersetzt werden, treffen Bewegungs- und Differenzvektoren für solch einen Übergang eventuell nicht zu. Ein Komprimierungsalgorithmus würde dies von sich aus nicht wissen und würde durch Versuch und Irrtum verschiedene Bewegungs- und Differenzalgorithmen ausprobieren, um einen P-Rahmen auszuprobieren und vorherzusagen. Die Erfindung nutzt in diesem Fall die Bearbeitungsspur, um der Komprimierungsmaschine mitzuteilen, keine Vorhersage zu versuchen, sondern stattdessen mehrere I-Rahmen aus den bearbeiteten Videodaten zu generieren.
  • Farbstanzen ist ein Prozess, bei dem eine Farbe in einem ersten Videobild durch ein zweites Videobild ersetzt werden kann. Oftmals wird eine blaue Leinwand (Schablone) als Hintergrund verwendet. Die blaue Farbe der blauen Leinwand wird mit einem zweiten Videobild gefüllt, was auch als Blauflächentechnik (Blue Screening) bezeichnet wird. Im Wetterbericht im Fernsehen ist es üblich, dass der Wettersprecher vor einer blauen Leinwand steht. Ein zweites Video mit verschiedenen Karten wird dazu verwendet, das Blau der blauen Leinwand hinter dem Wettersprecher im ersten Video zu füllen. Es besteht die Möglichkeit, dass etwas Licht von der blauen Leinwand auf den Wettersprecher überstrahlt, so dass ein Kanteneffekt um diese Person entsteht, was zu einem Überblendungsbereich um den Wettersprecher führt. Komprimierungsprogramme erkennen diesen Überblendungsbereich als Kante und können versuchen, diesen Überblendungsbereich mit einer höheren Auflösung zu versehen, wobei es erstrebenswerter sein kann, die Auflösung zu reduzieren, so dass der Überblendungsbereich nicht bemerkt werden kann. Die Erfindung liefert in diesem Fall Anweisungen, die dazu führen, dass die Kante zwischen den beiden Farbstanzbildern bei der Komprimierung eine geringere Auflösung erhält, indem die Anzahl der zur Darstellung der Pixel-Blöcke um die Kanten verwendeten Bit reduziert wird, um eine bessere Überblendung der Bilder zu ermöglichen. Um solch eine Überblendung zu erzielen, zeichnet die Bearbeitungssoftware die Grenzen zwischen den Bildern in der Bearbeitungsspur auf. 10 ist eine schematische Darstellung einer Ausführungsform des Farbstanzprozesses der Erfindung. Die Videospur 1 1004 und Videospur 2 1008 und eine Audiospur 1012 werden an den Farbstanzprozess 1016 übergeben. Die Audiospur 1012 kann eine Audiospur bis Videospur 1 1004, Videospur 2 1008, eine andere Quelle oder eine Kombination daraus sein. Der Farbstanzprozess kombiniert Videospur 1 1004 mit Videospur 2 1008, um die Videospur 3 1020 zu erstellen. Die Eingangsaudiospur 1012 kann unverändert bleiben und die Ausgangsaudiospur 1024 bilden. Ein Bearbeitungsobjekt wird in der Bearbeitungsspur 1028 platziert. Das Bearbeitungsobjekt kann die Grenze zwischen den Videobildern von Videospur 1 1004 und Videospur 2 1008 definieren und einen Kennzeichner definieren, um das Bearbeitungsobjekt als einen Farbstanzprozess zu identifizieren. Wenngleich als Schlüsselfarbe im obigen Beispiel Blau verwendet wird, kann beim Farbstanzverfahren eine beliebige Farbe als Schlüsselfarbe verwendet werden.
  • Eine statische Bildüberblendung verwendet ein statisches Bild, wie ein Farbbild, das in einem Teil des Videobilds eingeblendet wird, so dass das statische Bild und der Teil des Videobilds zur selben Zeit am selben Ort gesehen werden können. Da das statische Bild statisch ist, bewegt es sich nicht. Daher weist die Erfindung den Videokomprimierer an, keine Bewegung des statischen Bildes vorherzusagen. Hierdurch kann der Videokomprimierer bestimmen, dass das Bild statisch ist, ohne Kodierung und Dekodierung nach dem Versuchs- und Irrtumsverfahren.
  • Eine statische Bildüberlagerung ist das Platzieren eines Bilds über einen Teil eines Videobilds, so dass ein Teil des Videobilds, über den das statische Bild platziert wird, verborgen wird. Das statische Bild kann verschoben und im Bildausschnitt vergrößert oder verkleinert werden, bleibt aber ansonsten statisch. Das gesamte statische Bild kann durch einen einzelnen Bewegungsvektor dargestellt werden. Die Kenntnis, dass das gesamte statische Bild durch einen einzelnen Bewegungsvektor dargestellt werden kann, erlaubt einem Videokomprimierer, eine viel schnellere, exaktere und kompakte Komprimierung zu liefern. Der Videokomprimierer kann auch angewiesen werden, bei der Quantisierung mehr Bit zu verwenden, da es erstrebenswerter ist, ein statisches Bild in höherer Auflösung zu haben, während weniger Bit für den Bewegungsvektor verwendet werden.
  • Die Erfindung kann dann über Software implementiert werden, wobei nur die CPU zur Verarbeitung verwendet wird, oder man kann speziell dafür bestimmte Chips oder andere Kombinationen verwenden. 11 ist eine schematische Darstellung des Komprimierungssystems 1100, das in einer Ausführungsform der Erfindung verwendet werden kann. Ein Bearbeitungsspurleser 1104 empfängt Bearbeitungsinformationen von der Bearbeitungsspur 1112, und verarbeitet die Informationen, um einen Videokomprimierer 1108 Anweisungen zu liefern. Der Videokomprimierer empfängt die Daten aus der bearbeiteten Videospur 1116 und der bearbeiteten Audiospur 1120 und komprimiert die Daten aus der bearbeiteten Videospur 1116 und der bearbeiteten Audiospur 1120 gemäß den Anweisungen aus dem Bearbeitungsspurleser 1104.
  • In einer bevorzugten Implementierung der Erfindung ist kein Versuch-und-Irrtumsverfahren erforderlich, um eine MPEG-2-Komprimierung zu liefern. Statt der herkömmlichen MPEG-2-Kodierung und darauffolgenden Dekodierung zur Bestimmung, ob der verwendete Komprimierungsalgorithmus eine ausreichend exakte Komprimierung liefert, verwendet die bevorzugte Ausführungsform der Erfindung die Bearbeitungsspur, um Anweisungen für eine MPEG-2-Komprimierung zu liefern, die ausreichend zuverlässig ist, um keine darauffolgende Dekodierung zu benötigen, um festzustellen, ob der Komprimierungsalgorithmus ausreichend exakt ist. Daher ist die bevorzugte Ausführungsform in der Lage, eine MPEG-2-Komprimierung mit einer einzelnen Kodierung zu liefern, anstelle mehrerer Kodierungen und Dekodierungen nach dem Versuchs- und Irrtumsverfahren.
  • Wenngleich diese Erfindung anhand mehrerer bevorzugter Ausführungsformen beschrieben wurde, gibt es Abänderungen, Modifikationen, Permutationen und gleichwertigen Ersatz, die in den Geltungsbereich dieser Erfindung fallen. Es sollte beachtet werden, dass es viele alternative Möglichkeiten der Implementierung der Verfahren und Vorrichtungen der vorliegenden Erfindung gibt. Es ist daher vorgesehen, dass die folgenden beigefügten Ansprüche so interpretiert werden sollen, dass sie alle Abänderungen, Permutationen und gleichwertige Ersatzlösungen enthalten, die im echten Geltungsbereich der Erfindung liegen.

Claims (21)

  1. Rechnerlesbares Medium, das Programmanweisungen zur Komprimierung von Videodaten mit einer Bearbeitungsspur enthält, wobei die Videodaten zur Aufnahme von Videoeffekten bearbeitet wurden, und die Bearbeitungsspur die zu den Videoeffekten gehörigen Videobearbeitungsdaten speichert und einen Bereich eines Rahmens, in dem eine Videobearbeitung aufgetreten ist, und die Art der Bearbeitung, die in diesem Bereich auftrat, angibt, wobei die Programmanweisungen umfassen: einen rechnerlesbaren Code für den Zugriff (608) auf einen Rahmen von Videodaten; einen rechnerlesbaren Code für den Zugriff (612) auf Videobearbeitungsdaten, die in der Bearbeitungsspur gespeichert sind, die dem Videodaten-Rahmen entspricht; und einen rechnerlesbaren Code zur Komprimierung (212) der Videodaten mit Hilfe der Videobearbeitungsdaten in der Bearbeitungsspur während der Komprimierung der Videodaten.
  2. Rechnerlesbares Medium gemäß Anspruch 1, wobei der rechnerlesbare Code zur Komprimierung der Videodaten weiterhin einen rechnerlesbaren Code zur Verwendung von Informationen in der Bearbeitungsspur umfasst, um die Bitauflösung der Quantisierung (712, 812) für einen Bereich zu bestimmen, der in der Bearbeitungsspur definiert ist.
  3. Rechnerlesbares Medium gemäß einem der Ansprüche 1 und 2, wobei der rechnerlesbare Code zur Komprimierung der Videodaten weiterhin einen rechnerlesbaren Code zur Verwendung von Bewegungsinformationen in der Bearbeitungsspur umfasst, um einen Bewegungsvektor (972) zu erstellen.
  4. Rechnerlesbares Medium gemäß einem der Ansprüche 1–3, wobei der rechnerlesbare Code zur Komprimierung der Videodaten weiterhin einen rechnerlesbaren Code zur Verwendung von Informationen in der Bearbeitungsspur umfasst, um einen Differenzvektor zu erstellen.
  5. Rechnerlesbares Medium gemäß einem der Ansprüche 1–4, wobei der rechnerlesbare Code zur Komprimierung der Videodaten weiterhin einen rechnerlesbaren Code zur Verwendung von Informationen in der Bearbeitungsspur umfasst, um die Anzahl der für die Komprimierung zu verwendenden I-Rahmens zu bestimmen.
  6. Rechnerlesbares Medium gemäß einem der Ansprüche 1–5, weiterhin umfassend einen rechnerlesbaren Code zur Bearbeitung von Videodaten, umfassend: einen rechnerlesbaren Code, um dem Benutzer die Bearbeitung von Videodaten zu ermöglichen, um Videoeffekte bereitzustellen; einen rechnerlesbaren Code für die Erstellung einer Videospur von bearbeiteten Videodaten; und einen rechnerlesbarer Code für die Erstellung von mindestens einem Bearbeitungsobjekt, das Videobearbeitungsdaten in der Bearbeitungsspur bereitstellt, wobei das Bearbeitungsobjekt einen bearbeiteten Bereich und die Art der Bearbeitung definiert und wobei die Videobearbeitungsdaten Bearbeitungsschritte aufzeichnen, die vom Benutzer ausgeführt wurden.
  7. Rechnerlesbares Medium gemäß einem der Ansprüche 1–6, wobei der rechnerlesbare Code zur Komprimierung der Videodaten weiterhin einen rechnerlesbaren Code zur Verwendung von Textinformationen in der Bearbeitungsspur umfasst, um die Bitauflösung der Quantisierung eines Pixel-Blocks zu erhöhen.
  8. Rechnerlesbares Medium gemäß einem der Ansprüche 1–7, wobei der rechnerlesbare Code zur Komprimierung der Videodaten weiterhin einen rechnerlesbaren Code zur Verwendung von Mischinformationen in der Bearbeitungsspur umfasst, um die Bitauflösung der Quantisierung eines Pixel-Blocks zu reduzieren.
  9. Verfahren zur Komprimierung von Videodaten mit einer Bearbeitungsspur, wobei die Videodaten bearbeitet wurden, um Videoeffekte aufzunehmen und die Bearbeitungsspur die zu den Videoeffekten gehörigen Videobearbeitungsdaten speichert und einen Bereich eines Rahmens, in dem eine Videobearbeitung aufgetreten ist und die Art der Bearbeitung, die in diesem Bereich auftrat, angibt, so dass ein Komprimierungsprogramm darauf zugreifen kann, wobei das Verfahren umfasst: Zugriff (608) auf einen Rahmen von Videodaten; Zugriff (612) auf Videobearbeitungsdaten in der Bearbeitungsspur entsprechend dem Rahmen der Videodaten; und Komprimierung (212) der Videodaten mit den Videobearbeitungsdaten in der Bearbeitungsspur während der Komprimierung der Videodaten.
  10. Verfahren gemäß Anspruch 9, wobei die Komprimierung der Videodaten weiterhin die Verwendung von Informationen in der Bearbeitungsspur umfasst, um die Bitauflösung der Quantisierung für einen Bereich zu bestimmen, der in der Bearbeitungsspur definiert ist.
  11. Verfahren gemäß einem der Ansprüche 9–10, wobei die Komprimierung der Videodaten weiterhin die Verwendung von Bewegungsinformationen in der Bearbeitungsspur umfasst, um einen Bewegungsvektor zu erstellen.
  12. Verfahren gemäß einem der Ansprüche 9–11, wobei die Komprimierung der Videodaten weiterhin die Verwendung von Informationen in der Bearbeitungsspur umfasst, um einen Differenzvektor zu erstellen.
  13. V erfahren gemäß einem der Ansprüche 9–12, wobei die Komprimierung der Videodaten weiterhin die Verwendung von Informationen in der Bearbeitungsspur umfasst, um die Anzahl von für die Komprimierung zu verwendenden I-Rahmens zu bestimmen.
  14. Verfahren gemäß einem der Ansprüche 9–13, weiterhin umfassend den Schritt der Videodatenbearbeitung, umfassend: Erstellen einer Videospur von bearbeiteten Videodaten, und Erstellen von mindestens einem Bearbeitungsobjekt in der Bearbeitungsspur, die die Videobearbeitungsdaten bereitstellt, wobei das Bearbeitungsobjekt einen bearbeiteten Bereich und die Art der Bearbeitung definiert.
  15. System (1100) zur Komprimierung von bearbeiteten Videodaten, um Videoeffekte mit einer bearbeiteten Videospur, einer Audiospur und einer Bearbeitungsspur aufzunehmen, die zu den Videoeffekten gehörigen Videobearbeitungsdaten speichert und das einen Bereich eines Rahmens, in dem eine Videobearbeitung aufgetreten ist und die Art der Bearbeitung, die in diesem Bereich auftrat, in einem Format angibt, auf das ein Komprimierungsprogramm zugreifen kann, wobei das System umfasst: einen Bearbeitungsspurleser (1104) für den Zugriff auf die Videobearbeitungsdaten in der Bearbeitungsspur und zur Generierung von Anweisungen auf der Basis der Videobearbeitungsdaten in der Bearbeitungsspur; und eine Videokomprimierungseinrichtung (1108), die Anweisungen von dem Bearbeitungsspurleser und die bearbeitete Videospur und Audiospur empfängt, und die mit einem Komprimierungsprogramm das bearbeitete Video gemäß den Anweisungen vom Bearbeitungsspurleser komprimiert.
  16. System gemäß Anspruch 15, wobei die Videokomprimierungseinrichtung eine MPEG-Videokomprimierungseinrichtung ist, die die Videodaten im MPEG-Format komprimiert.
  17. System gemäß Anspruch 15, wobei die Videokomprimierungseinrichtung eine MPEG-2-Videokomprimierungseinrichtung ist, die die Videodaten im MPEG-2-Format komprimiert.
  18. System gemäß einem der Ansprüche 15 bis 17, wobei das Videokomprimierungssystem in der Lage ist, die Videokomprimierung mit einer einzigen Kodierung bereitzustellen.
  19. Rechnerlesbares Medium gemäß Anspruch 1, wobei die Bearbeitungsspur die Bearbeitungsschritte aufzeichnet, die ein Benutzer mit einer Videobearbeitungs-Software durchgeführt hat.
  20. Verfahren gemäß Anspruch 9, wobei die Bearbeitungsspur die Bearbeitungsschritte aufzeichnet, die ein Benutzer mit einer Videobearbeitungs-Software durchgeführt hat.
  21. System gemäß Anspruch 15, wobei die Bearbeitungsspur die von einem Benutzer mit einer Videobearbeitungs-Software durchgeführten Bearbeitungsschritte aufzeichnet.
DE60214721T 2001-03-21 2002-03-11 Aufnahmespur für verbesserte videokompression Expired - Lifetime DE60214721T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US816290 2001-03-21
US09/816,290 US7982796B2 (en) 2001-03-21 2001-03-21 Track for improved video compression
PCT/US2002/007384 WO2002078354A2 (en) 2001-03-21 2002-03-11 Track for improved video compression

Publications (2)

Publication Number Publication Date
DE60214721D1 DE60214721D1 (de) 2006-10-26
DE60214721T2 true DE60214721T2 (de) 2007-09-06

Family

ID=25220189

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60214721T Expired - Lifetime DE60214721T2 (de) 2001-03-21 2002-03-11 Aufnahmespur für verbesserte videokompression

Country Status (8)

Country Link
US (2) US7982796B2 (de)
EP (1) EP1407611B1 (de)
JP (1) JP4703097B2 (de)
KR (1) KR100603097B1 (de)
AT (1) ATE339853T1 (de)
DE (1) DE60214721T2 (de)
HK (1) HK1064546A1 (de)
WO (1) WO2002078354A2 (de)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7982796B2 (en) 2001-03-21 2011-07-19 Apple Inc. Track for improved video compression
US20040002993A1 (en) * 2002-06-26 2004-01-01 Microsoft Corporation User feedback processing of metadata associated with digital media files
US8612628B1 (en) * 2003-01-07 2013-12-17 Novell, Inc. Method and system for transferring repetitive images over computer networks
US7391913B2 (en) * 2003-09-18 2008-06-24 Arcsoft, Inc. JPEG processing engine for low profile systems
US20050206751A1 (en) * 2004-03-19 2005-09-22 East Kodak Company Digital video system for assembling video sequences
US7643694B2 (en) * 2004-12-31 2010-01-05 Zoran Corporation Method and apparatus for processing a compressed image in an order other than the order in which it was compressed
US20060217027A1 (en) * 2005-03-25 2006-09-28 Martuccio Michael C Method and apparatus for fan expressing participation in sporting events
US8437392B2 (en) * 2005-04-15 2013-05-07 Apple Inc. Selective reencoding for GOP conformity
US20060233237A1 (en) * 2005-04-15 2006-10-19 Apple Computer, Inc. Single pass constrained constant bit-rate encoding
US7669130B2 (en) 2005-04-15 2010-02-23 Apple Inc. Dynamic real-time playback
US7885338B1 (en) 2005-04-25 2011-02-08 Apple Inc. Decoding interdependent frames of a video for display
US7912349B1 (en) 2005-04-25 2011-03-22 Apple Inc. Validating frame dependency information
US7710426B1 (en) 2005-04-25 2010-05-04 Apple Inc. Buffer requirements reconciliation
US8442126B1 (en) 2005-06-14 2013-05-14 Apple Inc. Synchronizing audio and video content through buffer wrappers
US7653248B1 (en) * 2005-11-07 2010-01-26 Science Applications International Corporation Compression for holographic data and imagery
US8375302B2 (en) * 2006-11-17 2013-02-12 Microsoft Corporation Example based video editing
KR20100016741A (ko) * 2008-08-05 2010-02-16 삼성전자주식회사 영상처리장치 및 그 제어 방법
US20100039536A1 (en) * 2008-08-14 2010-02-18 Sony Ericsson Mobile Communications Ab Video recording device and method
US20120294353A1 (en) * 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
US9208819B1 (en) * 2012-06-20 2015-12-08 Google Inc. Dynamic split-frame preview of video editing effects
US9082198B2 (en) 2012-10-19 2015-07-14 Qualcomm Technologies, Inc. Method for creating automatic cinemagraphs on an imagine device
US10755744B2 (en) * 2014-06-06 2020-08-25 Fuji Xerox Co., Ltd. Systems and methods for direct video retouching for text, strokes and images
US10672089B2 (en) * 2014-08-19 2020-06-02 Bert L. Howe & Associates, Inc. Inspection system and related methods

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS583384A (ja) * 1981-06-29 1983-01-10 Fuji Photo Film Co Ltd スチル/ム−ビ−兼用電子カメラ
US5649171A (en) * 1991-04-12 1997-07-15 Accom, Inc. On-line video editing system
DE69225859T2 (de) * 1991-10-02 1998-12-03 Matsushita Electric Industrial Co., Ltd., Kadoma, Osaka Orthogonaltransformationskodierer
US5377014A (en) * 1992-01-06 1994-12-27 At&T Corp. Apparatus and method for displaying recorded compressed digital high definition video information
US5404316A (en) * 1992-08-03 1995-04-04 Spectra Group Ltd., Inc. Desktop digital video processing system
US6195461B1 (en) * 1992-12-17 2001-02-27 Sony Corporation Dynamic image processing apparatus and method
JP3954656B2 (ja) * 1994-09-29 2007-08-08 ソニー株式会社 画像符号化装置及び方法
US5802361A (en) * 1994-09-30 1998-09-01 Apple Computer, Inc. Method and system for searching graphic images and videos
JP3700195B2 (ja) 1995-01-10 2005-09-28 ソニー株式会社 復号化装置、再生装置、記録再生装置、画像処理システム、復号化方法、再生方法、記録再生方法及び画像処理方法
JP3594355B2 (ja) 1995-03-28 2004-11-24 三菱電機株式会社 映像信号蓄積伝送方法および装置
JP3280546B2 (ja) 1995-09-01 2002-05-13 日本電信電話株式会社 画像編集・符号化装置および画像復号装置
JPH09168148A (ja) 1995-09-20 1997-06-24 Sony Corp 動画像符号化方法及び装置、並びに記録媒体
EP0765082A3 (de) * 1995-09-25 1999-04-07 Sony Corporation Kodierung/Dekodierung eines Untertitelsignals
JP3956394B2 (ja) * 1995-10-17 2007-08-08 ソニー株式会社 音声・映像データ符号化装置およびその方法
US6466209B1 (en) * 1995-12-07 2002-10-15 Ncr Corporation Method for transparent marking of digital images for storage, retrieval and processing within a computer database
FR2743246B1 (fr) * 1995-12-29 1998-01-23 Thomson Broadcast Systems Procede et dispositif de compression de donnees numeriques
US5903261A (en) * 1996-06-20 1999-05-11 Data Translation, Inc. Computer based video system
US6337879B1 (en) 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
US5995672A (en) * 1996-11-08 1999-11-30 Hughes Electronics Corporation Method for reducing alpha plane bit mask size
US6038256A (en) * 1996-12-31 2000-03-14 C-Cube Microsystems Inc. Statistical multiplexed video encoding using pre-encoding a priori statistics and a priori and a posteriori statistics
US6459459B1 (en) * 1998-01-07 2002-10-01 Sharp Laboratories Of America, Inc. Method for detecting transitions in sampled digital video sequences
US6115499A (en) * 1998-01-14 2000-09-05 C-Cube Semiconductor Ii, Inc. Repeat field detection using checkerboard pattern
US6100940A (en) * 1998-01-21 2000-08-08 Sarnoff Corporation Apparatus and method for using side information to improve a coding system
JP2000013737A (ja) 1998-06-25 2000-01-14 Sony Corp 編集装置および方法、並びに提供媒体
JP4131300B2 (ja) * 1998-06-26 2008-08-13 ソニー株式会社 編集リスト作成装置
US6442331B1 (en) * 1998-07-08 2002-08-27 Lsi Logic Corporation Optical disk system incorporating computer graphics rendering capability to create and display three-dimensional (3-D) objects synchronized with 3-D sound
US6452969B1 (en) * 1998-09-28 2002-09-17 Thomson Licensing S.A. Transform domain inverse motion compensation having fractional pel accuracy
JP2000102007A (ja) 1998-09-28 2000-04-07 Matsushita Electric Ind Co Ltd マルチメディア情報合成装置、及び圧縮映像信号生成装置
KR100331332B1 (ko) 1998-11-02 2002-06-20 윤종용 비디오 데이터 송신 장치와 수신장치 및 그 방법
JP2000152243A (ja) 1998-11-09 2000-05-30 Nippon Hoso Kyokai <Nhk> 動きベクトル検出装置
BR0004370A (pt) * 1999-02-05 2000-12-19 Sony Corp Aparelhos e processos de codificação e de decodificação e sistema e método de codificação
US6462754B1 (en) * 1999-02-22 2002-10-08 Siemens Corporate Research, Inc. Method and apparatus for authoring and linking video documents
JP3934274B2 (ja) 1999-03-01 2007-06-20 三菱電機株式会社 動画要約装置および動画要約作成プログラムを記録したコンピュータ読み取り可能な記録媒体および動画再生装置および動画再生プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001025024A (ja) 1999-07-12 2001-01-26 Matsushita Electric Ind Co Ltd マルチメディア情報変換方法、及び装置
US6525746B1 (en) * 1999-08-16 2003-02-25 University Of Washington Interactive video object processing environment having zoom window
US6507618B1 (en) * 2000-04-25 2003-01-14 Hewlett-Packard Company Compressed video signal including independently coded regions
FR2809573B1 (fr) * 2000-05-26 2002-08-16 Thomson Broadcast Systems Procede de codage d'un flux d'images video
US7982796B2 (en) 2001-03-21 2011-07-19 Apple Inc. Track for improved video compression
US7649947B2 (en) * 2001-06-05 2010-01-19 Qualcomm Incorporated Selective chrominance decimation for digital images
KR20030031029A (ko) 2003-02-26 2003-04-18 정민우 화장실 절수 시설

Also Published As

Publication number Publication date
KR100603097B1 (ko) 2006-07-20
DE60214721D1 (de) 2006-10-26
US7982796B2 (en) 2011-07-19
JP4703097B2 (ja) 2011-06-15
HK1064546A1 (en) 2005-01-28
WO2002078354A3 (en) 2004-02-12
JP2004532553A (ja) 2004-10-21
EP1407611B1 (de) 2006-09-13
WO2002078354A2 (en) 2002-10-03
US20020136294A1 (en) 2002-09-26
US8605796B2 (en) 2013-12-10
EP1407611A2 (de) 2004-04-14
KR20030085564A (ko) 2003-11-05
ATE339853T1 (de) 2006-10-15
US20100220231A1 (en) 2010-09-02

Similar Documents

Publication Publication Date Title
DE60214721T2 (de) Aufnahmespur für verbesserte videokompression
DE69809289T2 (de) Verfahren zum hierarchischen zusammenfassen und schnellen durchsehen einer digitalen videosequenz
DE69936264T2 (de) Verfahren und vorrichtung zur verwaltung einer multimediadatei
DE69834029T2 (de) Bedeutsame szenenfeststellung und rahmenfilterung für ein visuelles indexierungssystem
DE69807452T2 (de) Rechnersystem und -verfahren zur aufnahme, nachbearbeitung und wiedergabe von mittels interframe- und intraframe-techniken komprimiertem bewegtbildvideo
DE69622518T2 (de) Verfahren und Vorrichtung zur Nachbearbeitung von Bildern
DE69737824T2 (de) Video-wiederauffinden von mpeg-komprimierten sequenzen unter verwendung von dc- und bewegungssignaturen
DE602004009591T2 (de) Differenz-codierung durch verwendung eines 3d-graphikprozessors
DE69417778T2 (de) Vorrichtung und Methode zur Wiedergabe von Bildern
DE69622878T2 (de) Verfahren und anlage zur anwendung von wiedergabebesonderheiten für komprimierte videodaten
DE69609141T2 (de) Interaktive bildmanipulation
DE19626985C1 (de) Verfahren und Anordnung zur Reduktion von Codierungsartefakten von blockbasierten Bildcodierungsverfahren und objektbasierten Bildcodierungsverfahren
DE69524896T2 (de) Wiedergabe von Videobildern mit erhöhter Geschwindigkeit
DE60033485T2 (de) Formatierung und Speicherung von Videodaten
DE69632419T2 (de) Digitaler Videokopierschutz
DE10219132A1 (de) System und Verfahren zum Verbessern der Bildqualität bei verarbeiteten Bildern
DE69521255T2 (de) Verfahren zum betrieb eines interaktiven bildanzeigesystems und bildanzeigesystem zur durchführung des verfahrens
DE69937833T2 (de) Verfahren und vorrichtung zur skalierbaren formkodierung
DE69915843T2 (de) Teilbandkodierung/-dekodierung
DE60312711T2 (de) Verfahren und vorrichtung zur codierung von bild- und/oder audiodaten
DE69528853T2 (de) System und Verfahren zum Editieren bewegter Bilder
DE69520845T2 (de) Vorrichtung und Verfahren zur Videoverarbeitung
DE69616889T2 (de) Kompression von Bewegtbildern
DE19680974B3 (de) Vorrichtung und Verfahren zum Komprimieren von Audio- und/oder Videodaten
DE60210080T2 (de) Vorrichtung zur Detektion eines Wasserzeichens

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: APPLE INC., CUPERTINO, CALIF., US