-
Die Erfindung betrifft ein Verfahren nach dem Oberbegriff des Anspruchs 1.
-
Es ist bekannt, bewegte Bilder, wie etwa Spiel- oder Dokumentarfilme, Videos oder ähnliches teilweise mit erläuternden, eingesprochenen Texten zu versehen, die Blinden oder Sehbehinderten die Möglichkeit geben sollen, zusätzlich zu der im Film ohnehin gesprochenen Sprache oder Musik weitere Informationen zu erhalten, insbesondere über die Szenerie in den Bildern und die Dinge, die sich gerade dort abspielen, ohne in den Dialogen oder anderen gesprochenen Texten aufgegriffen worden zu sein. So kann zum Beispiel eine stehende Szenerie nach Art eines Bühnenbilds erklärt werden, oder es können schnell bewegte Szenen, wie etwa Autofahrten, erläutert werden, um den Sehgeschädigten die Möglichkeit zu geben, der Handlung besser folgen zu können und/oder zusätzliche Informationen zu erhalten.
-
Diese Unterlegung mit eingesprochenen Texten (Audiodescription) kann nur an solchen Stellen vorgenommen werden, in denen die eingesprochenen Texte nicht mit ansonsten im Film gesprochener Sprache oder Vordergrundmusik kollidiert. Es müssen daher in den bewegten Filmen sprachlich zumindest im Wesentlichen ruhige Zeitfenster gefunden werden, in denen dann der Zusatztext störungsfrei eingesprochen werden kann. Dieses Zuordnen von Sprache zu Zeitfenstern im Film geschieht bisher rein manuell, indem die Zeitfenster beim Anschauen des Films mit ihren Anfangs- und Endzeiten (eine Zeitleiste läuft bei der Filmspur mit) ermittelt und notiert werden. Die so erhaltenen Zeitfenster werden dann mit Text gefüllt, und es wird ausprobiert, ob der vorgesehene Text in das Zeitfenster passt oder möglicherweise zu lang ist. Dieses Vorgehen ist eine reine Erfahrungssache.
-
Der Erfindung liegt das Problem zugrunde, hier eine Vereinfachung und zumindest Teilautomatisierung zu erreichen.
-
Die Erfindung löst dieses Problem durch ein Verfahren mit den Merkmalen des Anspruchs 1. Zu weiteren vorteilhaften Ausgestaltungen der Erfindung wird auf die Ansprüche 2 bis 9 verwiesen.
-
Dadurch, dass nach dem erfindungsgemäßen Verfahren in dem Verfahren Bilder abgespielt werden und dabei eine Zeiterfassung aus den bewegten Bildern parallel in einen synchron geöffneten und angesteuerten Texteditor übertragen wird, wird automatisch ein Zeitablauf für die Texte generiert, der auf die bewegten Bilder synchronisiert ist. Das parallele Einbinden eines Texteditors an den Bildlauf sichert die Möglichkeit, dass ohne weitere Notierungen im Texteditor alle die im Film gesetzten Zeitmarken für Anfang und Ende von Textabschnitten automatisch im Editor enthalten sind. Ein manueller Abgleich ist dann nicht mehr erforderlich.
-
Insbesondere werden Zeitmarkierungen für den Anfang und das Ende eines jeweiligen Zeitfensters in den bewegten Bildern automatisch in den Texteditor übernommen. Der Bearbeiter muß dann nur Anfangs- und Endmarken im laufenden Film setzen und bekommt diese ebenso als Anfangs- und Endmarken in seinen Editor übertragen. Falschübertragungen sind damit ausgeschlossen.
-
Besonders günstig wird im Verfahren aus den Zeitmarkierungen für den Anfang und das Ende des Zeitfensters automatisch die Dauer des Zeitfensters berechnet, so dass auch hier Falschberechnungen vermieden sind.
-
Wenn besonders günstig aus den Zeitmarkierungen für den Anfang und das Ende des Zeitfensters automatisch die Anzahl der in das Zeitfenster passenden Zeichen berechnet wird, kann beim Eingeben des Textes in den Texteditor automatisch die Zeitleiste herunterlaufen, bis das Ende erreicht ist. Der Schreibende bekommt damit vom Programm angezeigt, ob bei seinem Text noch Restzeit im jeweiligen Zeitfenster verbleibt oder ob der gewünschte Text möglicherweise schon das Zeitfenster überschreitet.
-
Vorteilhaft wird bei Eingabe eines die Zeichenanzahl überschreitenden Textes automatisch ein Warnsignal ausgegeben, so dass der Schreibende nicht auf die ablaufende Anzeige schauen muss, sondern unbeeinflusst seinen jeweiligen Text schreiben kann und dabei ggf. durch das akustische oder optische Warnsignal merkbar unterbrochen wird.
-
Weiter ist es günstig möglich, die Vorgabe von Zeichen pro Zeiteinheit je nach Sprecher und/oder Texttypus unterschiedlich vorwählen zu können. In schnell zu sprechenden Szenen in spannenden Spielfilmen wird der Sprecher durch eine Markierung auf die Notwendigkeit einer Beschleunigung hingewiesen.
-
Sofern am Texteditor zeitlich benachbarte Texte automatisch angezeigt werden, können daraus auch Stichwörter generiert werden, an denen sich die Sprecher beim Aufsprechen der Texte dann orientieren können. Überlappungen und Dopplungen können so zudem vermieden werden.
-
In einer Weiterbildung der Erfindung ist es auch möglich, dass am Texteditor unterschiedliche Markierungen zum Zwecke der Nachbearbeitung, zum Beispiel für weitere Sprecherstimmen, Benennung von Örtlichkeiten, für erstmaliges Auftauchen von Protagonisten oder für noch zu klärende Unstimmigkeiten setzbar sind.
-
Insgesamt ist mit der Erfindung eine hohe und reproduzierbare Zuverlässigkeit durch die automatische und zwangsweise Synchronisierung des Texteditors zu einem laufenden Film erreicht.
-
Weitere Vorteile und Merkmale der Erfindung ergeben sich aus in der Zeichnung dargestellten und nachfolgend beschriebenen Ausführungsbeispielen des Gegenstandes der Erfindung.
-
In der Zeichnung zeigt:
-
1 eine schematische Filmszene mit einem fahrenden Auto mit einer entsprechenden, zugeordneten Editoranzeige mit automatisch eingefügten Zeitmarkern,
-
2 eine ähnliche Ansicht wie 1, jedoch bei Ablauf der Szene und Setzen der nächsten Zeitmarke,
-
3 eine ähnliche Ansicht wie 1 mit einem eingefügten Text,
-
4 eine ähnliche Ansicht wie 3, jedoch mit einer Alarmanzeige bei zuviel im Zeitfenster eingegebenem Text.
-
Mit dem erfindungsgemäßen Verfahren soll die Einspielung von gesprochenen Texten in insbesondere bewegte Bilder 1, wie in Filme oder Videos, Übertragungen, Dokumentationen oder ähnliches, effektiver werden und einen höheren Automatisierungsgrad erhalten. Eine solche Texteinspielung wird auch als Audiodescription bezeichnet. Die Bilder 1 können dabei insbesondere als Datei ablaufen und angezeigt werden.
-
Insgesamt soll Blinden und/oder Sehgeschädigten ein möglichst gutes Verständnis der gezeigten Bilder unter Ausnutzung der zwischen Sprach- und/oder Musikphasen verbleibenden Ruhepausen vermittelt werden. Dabei soll der Film an sich jedoch in seiner Wirkung erhalten werden, ohne dass eine Hörspielfassung erstellt würde. Entsprechend sollen sich in der Regel die eingespielten Textanteile im Wesentlichen auf erklärende Hilfestellungen, die das gezeigte Bild beschreiben, beschränken.
-
In den Figuren ist beispielhaft hierfür nur ein sehr kleiner Ausschnitt aus einer möglichen Filmszene gezeigt, in der ein Auto auf eine Brücke zufährt. Die sehgeschädigten Zuschauer hören im Extremfall nur das Motorgeräusch, benötigen also eine Erklärung, was gerade passiert, zum Beispiel über die Örtlichkeiten.
-
Gemäß dem Verfahren laufen zum Beispiel auf einem (virtuellen) Bildschirm im Verfahren die bewegten Bilder 1 ab, wobei parallel und maschinell ein Editor 2 interaktiv angesteuert und automatisch synchronisiert wird, der zum Beispiel auf einem zweiten (virtuellen) Bildschirm läuft und auf dem Texte erstellt werden, die zu den Bildern 1 passen und die nachfolgend maschinell oder über Sprecher vertont werden.
-
Durch das automatisierte Verfahren wird eine dort mitlaufende Zeiterfassung 3 während des Abspielens der Bilder 1 automatisch aus den bewegten Bildern 1 parallel in einen synchron geöffneten und angesteuerten Texteditor 2 übertragen.
-
Damit wird eine Zwangssynchronisierung erreicht, die ihrerseits ermöglicht, dass beim Ansehen der Bilder 1 gesetzte Zeitmarkierungen 4, 5, ... automatisch in den geöffneten und angesteuerten Texteditor 2 übertragen werden. Zum Setzen der Zeitmarkierungen müssen keinerlei Notizen oder ähnliches mehr erstellt werden, sondern es reicht, den Film o. ä. anzusehen und dabei zum Beispiel durch Mausklicks die entsprechenden Markierungen 4, 5, ... zu setzen. Dabei ist 4 eine Anfangsmarkierung für ein jeweiliges Zeitfenster und 5 eine Endmarkierung für ein jeweiliges Zeitfenster. Diese werden dann maschinell und ohne Beeinflussungsmöglichkeit in den Editor 2 übertragen, in den eine Texteingabe, zum Beispiel über Tastatur oder Spracheingabe, möglich ist.
-
Dabei werden mit dem Verfahren nicht nur die Zeitmarkierungen (Timecodes) 4, 5 für den Anfang und das Ende des jeweiligen Zeitfensters automatisch übernommen, sondern es wird ebenso automatisch auch die Dauer 6 des Zeitfensters berechnet.
-
In 1 und 2 ist beispielhaft eine Anfangsmarkierung 4 bei Filmlaufzeit 10:14:44:02 und eine Endmarkierung 5 bei Filmlaufzeit 10:15:02:05 gesetzt worden. Dieses Zeitfenster steht als akustisch ruhige Phase mit dem passenden Bild des fahrenden Autos zur Verfügung. Hieraus wird maschinell automatisch die Intervalldauer 6 von 18 Sekunden und 3 frames (Bildern) berechnet und im Editor 2 angezeigt.
-
Weiter wird ebenfalls automatisch aus den Zeitmarkierungen 4 und 5 für den Anfang und das Ende des jeweiligen Zeitfensters automatisch die Anzahl der in das Zeitfenster passenden Zeichen 7 berechnet, hier 326 Zeichen gemäß 1 und 2. Dabei wird zum Beispiel von einem Wert von 18 Zeichen pro Sekunde ausgegangen. Die Angabe von Zeichen pro Zeiteinheit ist je nach Sprecher und/oder Texttypus unterschiedlich vorwählbar.
-
Im hier gezeichneten Beispiel ist in 1 für das Zeitfenster von 18 Sekunden und 3/25 Sekunden die Unterbringung von 326 Zeichen möglich. Bei der in 3 vorgenommenen Eingabe „Kurz vor einer Kreuzung hält der Bus. Youssef und Anne schauen durch die Windschutzscheibe zu einer weiß verputzten Stadtvilla mit” wurden 196 Zeichen verbraucht, die mit der genannten Zeichenanzahl pro Zeit eine Sprechzeit von 7:06 Sekunden benötigen. Somit liegt dieser Wert bei 39% und damit innerhalb des vorgegebenen Zeitintervalls von 18:03 Sekunden.
-
Hingegen wird bei Eingabe eines die mögliche Zeichenanzahl für das jeweilige Zeitfenster überschreitenden Textes automatisch ein Warnsignal 9 ausgegeben.
-
Dies ist in 4 gezeigt: Hier ist in dem errechneten Zeitfenster zwischen den Markierungen 4 und 5, nämlich 18:03 Sekunden, die Unterbringung von 326 Zeichen möglich. Bei der hier vorgenommenen Eingabe „mit weiß verputzten Stadtvilla mit dreigeschossigen, rot verklinkertem Fabrikanbau. An der Fassade des Anbaus hängen einige Banner.
'Dieses Haus stand leer – jetzt nicht mehr'.
'Paläste für alle' und
'Gegen Staat und Repression'”
wurden jedoch 653 Zeichen verbraucht, die mit der genannten Zeichenanzahl pro Zeit eine Sprechzeit von 36:57 Sekunden benötigen würden. Somit liegt dieser Wert deutlich außerhalb des vorgegebenen Zeitintervalls, nämlich bei etwa der doppelten Zeit. Entsprechend wird automatisch eine optische Warnung 9, hier in Form einer Warnmarkierung, ausgegeben. Auch eine akustische Warnung ist zusätzlich oder alternativ natürlich möglich. Der eingegebene Text sollte daher gekürzt werden, weil er ansonsten beispielsweise in den nächsten Dialog ragen würde.
-
Weitere Alarme sind im Rahmen von automatisiert ablaufenden Prüfroutinen möglich, wenn zum Beispiel Zeitmarkierungen einander überlappend gelegt würden, was zum Beispiel beim mehrmaligen Überarbeiten der Texte eines Films 1 leicht passieren kann.
-
Weiter können am Texteditor 2 zeitlich benachbarte Texte automatisch angezeigt werden (hier nicht dargestellt). Wenn der Text für das Bild nach 3 eingegeben werden sollte, würde daher automatisch der vorherige Text mit angezeigt werden. Damit ist dann für den Textersteller klar, was als letztes erwähnt wurde, so dass er direkt darauf Bezug nehmen kann.
-
Ebenso ist eine Suchfunktion möglich, mit der beispielsweise ein Begriff wie „Brücke” nach seinem ersten Auftauchen in der textlichen Beschreibung gesucht werden kann. Gleiches gilt auch für Namen der im Film auftauchenden Personen. Dies erleichtert die Rückbeziehung und vermeidet Doppelerklärungen.
-
Weiter können am Texteditor 2 unterschiedliche Markierungen 10 zum Zwecke der Nachbearbeitung, zum Beispiel für weitere Sprecherstimmen, Benennung von Örtlichkeiten, für erstmaliges Auftauchen von Protagonisten oder für noch zu klärende Unstimmigkeiten setzbar sein. Hier ist beispielhaft im unteren Teil des Editors jeweils die Markierung „2” für eine zweite Sprechstimme gesetzt.
-
Ferner ermöglicht es der Editor auch, den Text „barrierefrei” auszugeben, das heißt in Einzelzeilen, die maschinell in für Sehbehinderte geeignete Formate übersetzbar sind.
-
Zudem ist vom Programm ein Stichwort ausgebbar, das dem jeweiligen Sprecher seinen Einsatz anzeigt.
-
Insgesamt ist damit ein hoher Automatisierungsgrad der Audiodeskription erreicht, die Fehlermöglichkeiten sind gegenüber einer manuellen Bearbeitung deutlich minimiert; es kann zudem erheblich Personal eingespart werden, da große Anteile der Arbeit maschinell durchgeführt werden.
-
Bezugszeichenliste
-
- 1
- Bewegte Bilder,
- 2
- Editor,
- 3
- Zeiterfassung,
- 4
- Zeitmarkierung: Anfang,
- 5
- Zeitmarkierung: Ende,
- 6
- Zeitfenster: Dauer,
- 7
- Zeitfenster: Zeichenanzahl,
- 9
- Warnung,
- 10
- Markierung für Sprecher