DE69937001T2 - Bereitstellung von nach benutzer-interesse gefilterten werken - Google Patents

Bereitstellung von nach benutzer-interesse gefilterten werken Download PDF

Info

Publication number
DE69937001T2
DE69937001T2 DE69937001T DE69937001T DE69937001T2 DE 69937001 T2 DE69937001 T2 DE 69937001T2 DE 69937001 T DE69937001 T DE 69937001T DE 69937001 T DE69937001 T DE 69937001T DE 69937001 T2 DE69937001 T2 DE 69937001T2
Authority
DE
Germany
Prior art keywords
audio
concept
rate
zmm
tsm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69937001T
Other languages
English (en)
Other versions
DE69937001D1 (de
Inventor
Donald J. Jr. Los Altos Hejna
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEJNA JUN
Hejna jun Donald J Los Altos
Original Assignee
HEJNA JUN
Hejna jun Donald J Los Altos
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22613999&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69937001(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by HEJNA JUN, Hejna jun Donald J Los Altos filed Critical HEJNA JUN
Application granted granted Critical
Publication of DE69937001D1 publication Critical patent/DE69937001D1/de
Publication of DE69937001T2 publication Critical patent/DE69937001T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Information Transfer Between Computers (AREA)
  • Stereophonic System (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

  • Technisches Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft das Gebiet der Sprach-, Audio- und audio-visuellen Arbeiten. Insbesondere betrifft die vorliegende Erfindung ein Verfahren und eine Vorrichtung zum Erhalten einer Hörer-Eingabe bezüglich einer gewünschten Wiedergabegeschwindigkeit für Abschnitte einer Sprach-, Audio- und/oder audio-visuellen Arbeit und zum Entwickeln einer "Geschwindigkeitskontur-" oder "konzeptuellen Geschwindigkeitszuordnungs"-Datenstruktur, welche die Hörer-Eingabe darstellt. Die Hörer-Eingabe dient als ein Ausdruck für das Interesse des Hörers an der Sprach-, Audio- und/oder audio-visuellen Arbeit und/oder für die Fähigkeit des Hörers, die Sprach-, Audio- und/oder audio-visuelle Arbeit zu verstehen (und/oder mitzuschreiben), und wird im vorliegenden Text als "Hörer-Interesse" bezeichnet. Zum Beispiel kann es sein, dass der Hörer einen Abschnitt der Sprach-, Audio- und/oder audio-visuellen Arbeit verlangsamen möchte, wenn der Hörer ihn vollständiger genießen möchte, oder wenn es dem Hörer zu schwer fiel, den Abschnitt zu verstehen, oder wenn der Hörer Informationen mitschrieb, die in dem Abschnitt enthalten waren. Des Weiteren betrifft die vorliegende Erfindung insbesondere ein Verfahren und eine Vorrichtung zum erneuten Wiedergeben der Sprach-, Audio- und/oder audio-visuellen Arbeit gemäß der Geschwindigkeitskontur oder der konzeptuellen Geschwindigkeitszuordnungsdatenstruktur, um eine "gemäß dem Hörerinteresse gefilterte" Arbeit ("HIG"-Arbeit) zu erzeugen. Die HIG-Arbeit ist in einer Reihe von Anwendungen nützlich, wie zum Beispiel im Schul- und Bildungswesen, in der Werbung, für Nachrichtensendungen, in der Unterhaltung, für öffentliche Sicherheitsdurchsagen und dergleichen.
  • Allgemeiner Stand der Technik
  • Derzeit bekannte Verfahren zur Zeitmaßstabsmodifikation ("ZMM") ermöglichen es, digital aufgezeichnetes Audio so zu modifizieren, dass eine wahrgenommene Artikulationsrate gesprochener Passagen, d. h. eine Sprechrate, dynamisch während der Wiedergabe modifiziert werden kann. Zu typischen Anwendungen solcher ZMM-Verfahren gehören beispielsweise, ohne darauf beschränkt zu sein, schnelles Lesen (Speed Reading) für Blinde, Sprechbücher, digital aufgezeichnete Unterrichtslektionen, Dia-Shows, Multimedia-Präsentationen und Fremdsprachenlernen. In einer solchen typischen Anwendung, die im vorliegenden Text als eine "auf den Hörer gerichtete Zeitmaßstabsmodifikations-Anwendung" ("HG-ZMM") bezeichnet wird, kann ein Hörer während der Wiedergabe die Sprechrate eines zuvor aufgezeichneten Sprechers steuern. Dadurch wird es dem Hörer möglich, die Artikulationsrate und somit die Informationsübermittlungsrate, die von dem zuvor aufgezeichneten Sprecher ausgeht, zu "beschleunigen" oder zu "verlangsamen". Wie dem Fachmann allgemein bekannt ist, ermöglicht es die Verwendung des ZMM-Verfahrens in der oben beschriebenen. HG-ZMM-Anwendung, die beschleunigte oder verlangsamte Sprache bzw. das beschleunigte oder verlangsamte Audio verständlich mit den erhöhten oder verringerten Wiedergaberaten darzubieten. So kann zum Beispiel ein Hörer problemlos Material verstehen, das er schnell vorlaufen lässt.
  • WO 98/25405 zum Beispiel beschreibt eine Videowiedergabe mit variabler Rate und mit synchronisiertem Audio, wobei zum Beispiel durch eine Benutzeranweisung oder durch Analyse der Audiodaten eine Sollanzeigerate festgelegt werden kann.
  • In einem typischen HG-ZMM-System kann die Eingabe von dem Hörer auf verschiedene Weise spezifiziert werden. Zum Beispiel kann die Eingabe durch Drücken von Tasten oder Knöpfen, Mausbewegungen oder Sprachbefehle spezifiziert werden, was im Weiteren alles als "Tastendrücke" bezeichnet wird. Daraus ergibt sich also klar, dass ein HG-ZMM-System es einem Hörer ermöglicht, die Informationsübermittlungsrate eines digitalen Audio-Mediums an seine Interessen und an sein Verständnistempo anzupassen.
  • Aus dem oben Dargelegten ergibt sich klar, dass es zum Optimieren der Verwendung eines solchen HG-ZMM-Systems notwendig ist festzustellen, wie Hörer mit Audio-Medien, die über ZMM verfügen, interagieren. Insbesondere hängt die tatsächliche Informationsübermittlungsrate, die durch einen Hörer gewählt wird, von diversen Faktoren ab, wie zum Beispiel der Verständlichkeit eines Sprechers, dem Hörer-Interesse an dem Thema, der Vertrautheit des Hörers mit dem Thema, ob der Hörer den Inhalt mitschreibt, und der allgemeinen Zeit, die der Hörer für den Empfang des Inhalts des Materials vorgesehen hat.
  • Zum Stand der Technik gehörende Verfahren zum Feststellen des Hörer-Interesses an Abschnitten von Sprache und/oder Audio sind von sich aus ungenau. Genauer gesagt, beinhalten diese Verfahren das Detektieren von durch Tastendrücke erzeugten Muster des schnellen Vorlaufs und des schnellen Rücklaufs zum Beispiel eines Kassettentonbandes. Die Verwendung solcher Muster des schnellen Vorlaufs und des schnellen Rücklaufs ist mit verschiedenen Nachteilen behaftet. Zum Beispiel wechselt der Hörer im Verlauf eines bestimmten Stücks eines Audio-Materials oft zwischen schnellem Vorlauf und schnellen Rücklauf, weil die Informationen entweder nicht dargeboten werden oder weil sie während des schnellen Vorlaufs oder des schnellen Rücklaufs unverständlich sind. Außerdem wird jedes Mal, wenn eine Wiedergabeposition verändert wird, entweder während des Bewegens durch das Audio-Material die Wiedergabe unterbrochen, oder es werden unverständliche Versionen des Audio-Materials dargeboten ("Eichhörnchen-Laute" beim Beschleunigen usw.). Insofern sind die derzeitigen Verfahren zum Bestimmen des Hörer-Interesses beim Ermitteln einer optimalen Informationsübermittlungsrate nur von geringem Nutzen.
  • Aus dem oben Dargelegten ergibt sich klar, dass auf diesem technischen Gebiet Bedarf an einem Verfahren und einer Vorrichtung zum Bestimmen eines Hörer-Interesses an Abschnitten von Sprach-, Audio- und/oder audio-visuellen Arbeiten besteht. Des Weiteren besteht auf diesem technischen Gebiet Bedarf an einem Verfahren und einer Vorrichtung zum erneuten Wiedergeben von Sprach-, Audio- und/oder audio-visuellen Arbeiten gemäß der Bestimmung des Hörer-Interesses, um eine gemäß dem Hörerinteresse gefilterte Arbeit ("HIG"-Arbeit) bereitzustellen.
  • Kurzdarstellung der Erfindung
  • Ausführungsformen der vorliegenden Erfindung befriedigen vorteilhafterweise den oben angesprochenen Bedarf auf diesem technischen Gebiet und stellen ein Verfahren und eine Vorrichtung zum Bestimmen eines Hörerinteresses an Abschnitten von Sprach-, Audio- und/oder audio-visuellen Arbeiten und zum Entwickeln von Geschwindigkeitskonturen oder konzeptuellen Geschwindigkeitszuordnungsdatenstrukturen, die einen Grad an Hörer-Interesse darstellen, bereit. Des Weiteren stellen weitere Ausführungsformen der vorliegenden Erfindung ein Verfahren und eine Vorrichtung zum Nutzen der Geschwindigkeitskonturen oder konzeptuellen Geschwindigkeitszuordnungsdatenstrukturen zum Wiedergeben von Sprach-, Audio- und/oder audio-visuellen Arbeiten gemäß den Geschwindigkeitskonturen oder den konzeptuellen Geschwindigkeitszuordnungsdatenstrukturen bereit, um gemäß dem Hörer-Interesse gefilterte Arbeiten ("HIG"-Arbeiten) bereitzustellen.
  • Die Erfindung ist durch die angehängten unabhängigen Ansprüche definiert.
  • Kurze Beschreibung der Figur
  • 1 zeigt ein Blockschaubild einer Ausführungsform eines ersten Aspekts der vorliegenden Erfindung, die eine Geschwindigkeitskontur für eine Audio- oder audio-visuelle Arbeit erzeugt.
  • 2 zeigt ein Flussdiagramm eines Algorithmus', der in einer Ausführungsform eines Geschwindigkeitskonturgenerators, der in 1 gezeigt ist, verwendet wird.
  • 3 zeigt in grafischer Form Geschwindigkeitskonturen für mehrere verschiedene Hörsitzungen derselben Audio- oder audio-visuellen Arbeit.
  • 4 zeigt eine grafische Darstellung von Geschwindigkeitskonturen, die unter Verwendung der ersten mathematischen Ableitung der ZMM-Rate oder der Wiedergaberate, die durch die Benutzer für mehrere verschiedene Hörsitzungen derselben Audio- oder audio-visuellen Arbeit spezifiziert wurden, erzeugt wurden.
  • 5 zeigt ein Blockschaubild einer Ausführungsform eines zweiten Aspekts der vorliegenden Erfindung, die eine Geschwindigkeitskontur für eine Audio- oder audiovisuelle Arbeit erzeugt, wobei Benutzereingaben und eine Wortkarte einer Audio- oder audio-visuellen Arbeit verwendet werden, um eine Geschwindigkeitskontur zu erstellen.
  • 6 zeigt in grafischer Form ein zweidimensionales Diagramm, das eine Sprachwellenform und einen entsprechenden Text für eine Audio- oder audio-visuelle Arbeit anzeigt.
  • 7 zeigt eine Anzeige einer Mitschrift einer Audio- oder audio-visuellen Arbeit.
  • 8 zeigt ein Blockschaubild einer Ausführungsform eines dritten Aspekts der vorliegenden Erfindung, die eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur ("KGZ"-Datenstruktur") für eine Audio- oder audio-visuelle Arbeit erzeugt.
  • 9 zeigt ein Flussdiagramm eines Algorithmus', der in einer Ausführungsform eines KGZDS-Generators, der in 8 gezeigt ist, verwendet wird, um eine KGZ-Datenstruktur zu erzeugen.
  • 10 zeigt ein Blockschaubild einer Ausführungsform eines vierten Aspekts der vorliegenden Erfindung, die eine Geschwindigkeitskontur in Verbindung mit einer Audio- oder audio-visuellen Arbeit nutzt, um eine HIG-Arbeit zu erzeugen.
  • 11 zeigt ein Blockschaubild einer Ausführungsform eines fünften Aspekts der vorliegenden Erfindung, die eine KGZ-Datenstruktur in Verbindung mit einer Audio- oder audio-visuellen Arbeit nutzt, um eine HIG-Arbeit zu erzeugen.
  • 12 zeigt ein Flussdiagramm eines Algorithmus', der in einer Ausführungsform eines ZMM-Raten-Verwalters, der in 11 gezeigt ist, verwendet, um eine ZMM-Rate oder Wiedergaberate zu erzeugen.
  • Detaillierte Beschreibung
  • Ausführungsformen der vorliegenden Erfindung betreffen ein Verfahren und eine Vorrichtung zum Erhalten einer Hörer-Eingabe bezüglich einer gewünschten Wiedergabegeschwindigkeit für Abschnitte einer Sprach-, Audio- und/oder audio-visuellen Arbeit und zum Entwickeln einer "Geschwindigkeitskontur" oder einer "konzeptuellen Geschwindigkeitszuordnungs"-Datenstruktur, welche die Hörer-Eingabe darstellt. Die Hörer-Eingabe dient als ein Ausdruck für das Interesse des Hörers an der Sprach-, Audio- und/oder audio-visuellen Arbeit und/oder fit die Fähigkeit des Hörers, die Sprach-, Audio- und/oder audio-visuelle Arbeit zu verstehen, und wird im vorliegenden Text als "Hörer-Interesse" bezeichnet. Zum Beispiel kann es sein, dass der Hörer einen Abschnitt der Sprach-, Audio- und/oder audio-visuellen Arbeit verlangsamen möchte, wenn der Hörer ihn vollständiger genießen möchte, oder wenn es dem Hörer zu schwer fiel, den Abschnitt zu verstehen. Weitere Ausführungsformen der vorliegenden Erfindung betreffen ein Verfahren und eine Vorrichtung zum erneuten Wiedergeben der Sprach-, Audio- und/oder audio-visuellen Arbeit gemäß der Geschwindigkeitskontur oder der konzeptuellen Geschwindigkeitszuordnungsdatenstruktur, um eine neue Arbeit zu erzeugen, die im vorliegenden Text als eine "gemäß dem Hörerinteresse gefilterte" Arbeit ("HIG"-Arbeit) bezeichnet wird. Wie weiter unten noch eingehender beschrieben wird, ist die HIG-Arbeit zum Beispiel im Schul- und Bildungswesen, in der Werbung, für Nachrichtensendungen, für öffentliche Sicherheitsdurchsagen und dergleichen nützlich.
  • Erzeugen einer Geschwindigkeitskontur und einer konzeptuellen Geschwindigkeitszuordnungsdatenstruktur
  • Gemäß der vorliegenden Erfindung erzeugen Ausführungsformen eines ersten Aspekts der vorliegenden Erfindung eine Geschwindigkeitskontur, wobei diese Geschwindigkeitskontur optional zur späteren Verwendung gespeichert wird.
  • 1 zeigt ein Blockschaubild einer Ausführungsform 1000 eines ersten Aspekts der vorliegenden Erfindung, die eine Geschwindigkeitskontur für eine Audio- oder audio-visuelle Arbeit erzeugt. Wie in 1 gezeigt, umfasst die Ausführungsform 1000 eine Benutzerschnittstelle 100 ("BSS 100"), die Eingaben von einem Benutzer empfängt. Die BSS 100 gibt Ausgangssignale aus, die eine Eingabe von dem Benutzer anzeigen. Die Benutzereingabe wird durch den Benutzereingabeprozessor/die Wiedergabesteuerung 200 ("BEP/WS 200") der Ausführungsform 1000 interpretiert, um die folgenden Optionen zu bezeichnen, die durch den Benutzer ausgewählt werden: (a) Auswählen einer wiederzugebenden Datei, wobei diese Datei einer bestimmten Audio- oder audio-visuellen Arbeit entspricht (die ausgewählte Datei kann direkt in die Ausführungsform 1000 eingegeben werden, oder sie kann eine Datei sein, die durch die Ausführungsform 1000 gespeichert wurde); (b) Initiieren der Wiedergabe der ausgewählten Datei; (c) Anhalten der Wiedergabe der ausgewählten Datei; (d) Pausieren der Wiedergabe der ausgewählten Datei; (e) Modifizieren der Zeitmaßstabsmodifikations ("ZMM")-Rate, d. h. der Wiedergaberate, eines Abschnitts der wiedergegebenen Audio- oder audio-visuellen Arbeit; oder (f) Spezifizieren der Parameter Interval_Size, Speed_Change_Resolution, Average_or_Overwrite und Log_Repeats, die durch die Vorrichtung in einer Weise verwendet werden, die weiter unten beim Erzeugen der Geschwindigkeitskontur noch eingehender erläutert wird. Es gibt viele dem Durchschnittsfachmann vertraute Vorrichtungen zum Erhalten einer Eingabe von einem Benutzer. Zum Beispiel ist es dem Durchschnittsfachmann vertraut, dass handelsübliche Vorrichtungen existieren, um: (a) das Drücken einer Taste; (b) die Aktivierung eines Tasters an einer Maus; (c) die Bewegung eines Schiebereglers oder Positionsanzeigers; und (d) Benutzersprachbefehle zu detektieren und um – in Reaktion darauf – digitale Daten, die den Tastendruck, die Tasteraktivierung, die Bewegung des Schiebereglers oder Positionsanzeigers oder die Sprachbefehle darstellen, an eine Verarbeitungseinheit zu senden.
  • Die BEP/WS 200 empfängt die Benutzereingabe von der BSS 100 und (a) wandelt die Benutzereingabe in numerische Werte um; (b) interpretiert die Benutzereingabe zum Einstellen der Werte von Parametern und zum Steuern der Erstellung, Verwendung, Modifizierung oder Außerkraftsetzung der Geschwindigkeitskontur; und (c) lenkt den Zugriff auf einen Datenstrom und das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit durch Senden einer Stromdatenanforderung an eine digitale Speichervorrichtung 75 oder eine andere Quelle von Audio- oder audio-visuellen Daten (zur Durchführung einer Wiedergabesteuerung). Im Fall der digitalen Speichervorrichtung 75 kann die BEP/WS 200 den Zugriff auf eine Datei aus digitalen Daten anfordern, die eine Audio- oder audio-visuelle Arbeit darstellen, die in einem Dateisystem in der Vorrichtung gespeichert ist. Um den Zugriff auf einen Datenstrom von einer Audio- oder audio-visuellen Arbeit oder das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit zu lenken, interpretiert die BEP/WS 200 die Benutzereingabe und die Position digitaler Abtastungen, welche die Audio- oder audio-visuelle Arbeit darstellen, die in der digitalen Speichervorrichtung 75 gespeichert ist, um Wiedergabepositionen für die ausgewählte Datei bei einer bestimmten Abtastung zu berechnen.
  • Die digitale Speichervorrichtung 75 empfängt Folgendes als Eingabe: (a) Stromdatenanforderungen von der BEP/WS 200; und optional (b) einen zeitmaßstabsmodifizierten Ausgang von dem ZMM-Teilsystem 300; und optional (c) einen Datenstrom, der die Geschwindigkeitskontur darstellt, von dem Geschwindigkeitskonturgenerator 500. Die digitale Speichervorrichtung 75 erzeugt Folgendes als Ausgang: (a) einen Datenstrom, der eine Audio- oder audio-visuelle Arbeit darstellt, und (b) einen Strom aus Positionsinformationen, zum Beispiel die Position in einer Datei, des ausgegebenen Datenstroms. Es gibt viele dem Durchschnittsfachmann vertraute Verfahren zum Verwenden digitaler Speichervorrichtungen, zum Beispiel eine "Festplatte", um Allzweckdaten zu speichern und abzurufen.
  • Die Audio- oder audio-visuelle Arbeit wird in der Regel in digitaler Form in der digitalen Speichervorrichtung 75 gespeichert. Es gibt viele dem Durchschnittsfachmann vertraute handelsübliche Vorrichtungen zur Verwendung als digitale Speichervorrichtung, wie zum Beispiel eine CD-ROM, ein digitales Band oder eine magnetische Disk. Die digitale Speichervorrichtung 75 empfängt Datenanforderungen von der BEP/WS 200 gemäß dem Durchschnittsfachmann vertrauten Verfahren zum Bereitstellen eines Stroms digitaler Abtastungen, welche die Audio- und/oder audio-visuelle Arbeit darstellen. In alternativen Ausführungsformen wird die Audio- oder audio-visuelle Arbeit in analoger Form in einer analogen Speichervorrichtung gespeichert. In einer solchen alternativen Ausführungsform wird ein Strom aus analogen Signalen in eine (nicht gezeigte) Vorrichtung eingespeist, um die analogen Abtastungen in digitale Abtastungen umzuwandeln. Es gibt viele dem Durchschnittsfachmann vertraute handelsübliche Vorrichtungen zum Empfangen eines eingegebenen analogen Signals, wie zum Beispiel eines Sprachsignals, und zum Abtasten des analogen Signals mit einer Rate, die mindestens die Nyquist-Rate ist, um einen Strom digitaler Signale bereitzu stellen, die ohne Qualitätsverlust in ein analoges Signal zurückkonvertiert werden können. Die digitalen Abtastungen werden dann an das ZMM-Teilsystem 300 übertragen.
  • Das ZMM-Teilsystem 300 empfängt als Eingang: (a) einen Strom aus Abtastungen, der Abschnitte der Audio- oder audio-visuellen Arbeit darstellt, von der digitalen Speichervorrichtung 75; (b) Strompositionsinformationen von der digitalen Speichervorrichtung 75, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Datenstrom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert; und (c) eine gewünschte ZMM-Rate oder Wiedergaberate von dem Zeitmaßstabsmodifikationsmonitor 400 ("ZMM-Monitor 400"). Der Ausgang von dem ZMM-Teilsystem 300 wird als Eingang eingespeist in: (a) einen Digital-Analog-Wandler/eine Audio- und/oder audio-visuelle Wiedergabevorrichtung 600 ("DA/AWV 600") und optional in (b) einen digitalen Speicher 75 zum Speichern des zeitmaßstabsmodifizierten Ausgangs, d. h. der HIG-Arbeit, sofern gewünscht. Die DA/AWV 600 ist eine auf diesem technischen Gebiet bestens bekannte Vorrichtung zum Empfangen digitaler Abtastungen und Erzeugen einer Audio- oder audio-visuellen Arbeit. Gemäß der vorliegenden Erfindung ist der Ausgang von dem ZMM-Teilsystem 300 ein Strom digitaler Abtastungen, der eine Audio- oder audio-visuelle Arbeit darstellt, deren Wiedergaberate, die von dem ZMM-Monitor 400 übermittelt wird, dem Benutzer eine Rückmeldung über seine eingegebene ZMM-Raten-Spezifikation gibt. Genauer gesagt, hört sich der Benutzer die zeitmaßstabsmodifizierte Ausgabe an und kann die ZMM-Rate oder Wiedergaberate ändern, indem er mittels der BSS 100 weitere Eingaben tätigt. Genauer gesagt, wenn der Benutzer einen gerade abgespielten Abschnitt der Audio- oder audio-visuellen Arbeit beschleunigen oder verlangsamen möchte, so kann der Benutzer unter Verwendung der BSS 100 eine Eingabe tätigen, um einen schnellen Rücklauf der Audio- oder audio-visuelle Arbeit zu einem gewünschten Abschnitt auszuführen und sie mit einer modifizierten ZMM-Rate oder Wiedergaberate erneut wiederzugeben. Auf diese Weise bestimmt der Benutzer eine gewünschte ZMM-Rate oder Wiedergaberate für jeden Abschnitt der Audio- oder audio-visuellen Arbeit. Das ZMM-Teilsystem 300 modifiziert den Eingangsdatenstrom gemäß vertrauten ZMM-Verfahren, um als Ausgang einen Strom aus Abtastungen zu erzeugen, der ein zeitmaßstabsmodifiziertes Signal darstellt. In einer bevorzugten Ausführungsform der vorliegenden Erfindung ist das verwendete ZMM-Verfahren ein Verfahren, das in dem US-Patent Nr. 5,175,769 (das Patent '769) offenbart ist, wobei der Autor der vorliegenden Erfindung auch ein Miterfinder des Patents '769 ist. Wie dem Durchschnittsfachmann sofort klar ist, beschleunigt oder verlangsamt das ZMM-Teilsystem 300 jedes Mal, wenn die Ausführungsform 1000 eine audio-visuelle Arbeit wiedergibt, visuelle Informationen so, dass sie an das Audio in der audio-visuellen Arbeit angepasst werden. Um dies zu tun, wird in einer bevorzugten Ausführungsform das Videosignal gemäß einem der vielen dem Durchschnittsfachmann bekannten Verfahren "Frame-unterabgetastet" oder "Framerepliziert", um die Synchronität zwischen den Audio- und den visuellen Abschnitten der audio-visuellen Arbeit beizubehalten. Wenn man also das Audio beschleunigt und Abtastungen mit einer schnelleren Rate angefordert werden, so wird der Frame-Strom unterabgetastet, d. h. Frames werden übersprungen.
  • Der ZMM-Monitor 400 empfängt Folgendes als Eingang, um die Ausführungsform 1000 beim Erzeugen einer Geschwindigkeitskontur anzuleiten: (a) Benutzereingaben, die durch die BEP/WS 200 in eine gewünschte ZMM-Rate oder Wiedergaberate umgesetzt wurden (wobei diese gewünschte ZMM-Rate oder Wiedergaberate eine Änderung der ZMM-Rate oder Wiedergaberate für einen wahrgenommenen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit anzeigen kann); (b) einen Strom aus Abtastungen, der Abschnitte der Audio- oder audio-visuellen Arbeit darstellt, von der digitalen Speichervorrichtung 75; (c) aktuelle Strompositionsinformationen von der digitalen Speichervorrichtung 75, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Strom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert des Anfangs der Gruppe von Abtastungen, die von der digitalen Speichervorrichtung 75 übertragen wird; und (d) die Parameter Interval_Size und Speed_Change_Resolution von der BEP/WS 200.
  • Eine Geschwindigkeitskontur sind Informationen zum Beispiel in Form eines Datenstroms, der eine gewünschte ZMM-Rate oder Wiedergaberate für eine Audio- oder audio-visuelle Arbeit für einige oder alle Punkte der Arbeit darstellt. In der Praxis variiert die Zeitauflösung, die benötigt wird, damit die Ausführungsform 1000 die gewünschte ZMM-Rate oder Wiedergaberate für eine Audio- oder audio-visuelle Arbeit wiedergeben kann, langsam im Vergleich zu der Abtastrate des digitalen Signals, das die Audio- oder audio-visuelle Arbeit umfasst. Infolge dessen, und gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung, umfasst die Geschwindigkeitskontur einen einzelnen ZMM-Wert, der einer bestimmten Gruppe von Abtastungen der Audio- oder audio-visuellen Arbeit zugeordnet ist, die einem bestimmten Segment dieser Arbeit entsprechen. Alternativ könnte man jeder Abtastung der eingegebenen audio-visuellen Arbeit einen ZMM-Wert zuordnen.
  • In der Praxis ist die Auflösung, die zum Reproduzieren der ZMM-Rate oder Wiedergaberate benötigt wird, begrenzt. Darum werden in einer bevorzugten Ausführungsform der vorliegenden Erfindung, anstatt einen Bereich kontinuierlicher ZMM-Raten oder Wiedergaberaten zu verwenden, die ZMM-Raten zu festen Intervallen quantisiert, und die Werte dieser quantisierten Pegel werden zum Darstellen der ZMM-Raten verwendet. Das wird weiter unten erklärt.
  • Zwei Parameter leiten die beschriebene Ausführungsform des ZMM-Monitors 400:
    • 1. Interval_Size: Dieser Parameter bestimmt das Zeitintervall, das in Form einer Anzahl von Abtastungen der eingegebenen Audio- oder audio-visuellen Arbeit angegeben ist und das zwischen der Analyse von Änderungen der ZMM-Rate oder Wiedergaberate verstreichen muss.
    • 2. Speed_Change_Resolution: Dieser Parameter gibt die Differenz beim Betrag zwischen den quantisierten Pegeln an, die zum Darstellen der ZMM-Rate oder Wiedergaberate verwendet werden.
  • Der ZMM-Monitor 400 verwendet den Parameter Interval_Size zum Segmentieren des eingegebenen digitalen Stroms und zum Bestimmen einer einzelnen ZMM-Rate für jedes Segment des eingegebenen digitalen Stroms, zum Beispiel der ZMM-Rate am Beginn oder am Ende des Segments oder eines mathematischen Durchschnitts der ZMM-Raten über das Segment hinweg. Es ist zu beachten, dass die Länge jedes Segments durch den Wert des Interval_Size-Parameters gegeben ist.
  • Der ZMM-Monitor 400 verwendet den Parameter Speed_Change_Resolution zum Bestimmen geeigneter ZMM-Raten, die an das ZMM-Teilsystem 300 und den Geschwindigkeitskonturgenerator 500 weiterzuleiten sind. Die eingegebene ZMM-Rate, die vom Benutzer gewünscht wird, wird in einer dem Durchschnittsfachmann vertrauten Weise in einen der quantisierten Pegel umgewandelt. Das heißt, dass die ausgegebene ZMM-Rate oder Wiedergaberate sich nur ändern kann, wenn sich die eingegebene gewünschte ZMM-Rate um einen Betrag ändert, der die Differenz zwischen quantisierten Pegeln übersteigt, d. h. Speed_Change_Resolution. In der Praxis filtert der Parameter Speed_Change_Resolution dann kleine Änderungen der ZMM-Rate oder Wiedergaberate, zu denen es käme, wenn der Benutzer die ZMM-Rate oder Wiedergaberate um einen kleinen Betrag ändern würde und sie dann sofort auf ihren vorherigen Wert zurück ändern würde. Die Parameter Interval_Size und Speed_Change_Resolution können gemäß dem Durchschnittsfachmann vertrauten Verfahren als vorgegebene Parameter für die Ausführungsform 1000 eingestellt werden, oder sie können gemäß dem Durchschnittsfachmann vertrauten Verfahren durch Empfangen von Benutzereingaben über die BSS 100 eingegeben und/oder verändert werden. Die Art und Weise, in der diese Parameter eingestellt und/oder verändert werden, ist jedoch nicht gezeigt, um das Verstehen der vorliegenden Erfindung zu erleichtern.
  • Der ZMM-Monitor 400 erzeugt als Ausgang ein Werte-Paar für jedes Segment des durch Interval_Size spezifizierten Eingangsstroms: (a) eines der Werte-Paare stellt Positionsinformationen in dem eingegebenen digitalen Strom für das Segment dar, und (b) das andere der Werte-Paare stellt die ZMM-Rate oder Wiedergaberate dar, die durch den Benutzer für dieses Segment angefordert wurde. Das Werte-Paar wird als Eingang in den Geschwindigkeitskonturgenerator 500 eingespeist, und das andere der Werte-Paare, das die ZMM-Rate darstellt, wird als Eingang in das ZMM-Teilsystem 300 eingespeist.
  • Der Geschwindigkeitskonturgenerator 500 nimmt als Eingang entgegen: (a) eines der Werte-Paare, das Positionsinformationen in dem eingegebenen digitalen Strom für ein Segment darstellt, von dem ZMM-Monitor 400; (b) das andere der Werte-Paare, das die ZMM-Rate oder Wiedergaberate für das Segment darstellt, von dem ZMM-Monitor 400; und (c) die Parameter Average_or_Overwrite und Log_Repeats von der BEP/WS 200. Der Geschwindigkeitskonturgenerator 500 verwendet eine Datenbank oder einen Notizblockspeicher zum Führen einer Datensatzliste; jeder Datensatz speichert Informationen bezüglich der ZMM-Rate und der Strompositionsinformationen für die ZMM- Rate. 2 zeigt ein Flussdiagramm eines Algorithmus', der in einer Ausführungsform des Geschwindigkeitskonturgenerators 500 verwendet wird, um die Geschwindigkeitskontur zu erzeugen. Die folgenden Felder werden in den Datensätzen verwendet, die durch die Ausführungsform verwendete werden:
    • 1. Rec: eine einmalige Zahl, die jeden Datensatz und seine Zuordnungs/Erstellungsreihenfolge identifiziert.
    • 2. Loc: ein Datenfeld, das Strompositionsinformationen für ein Segment des Eingangsstroms enthält.
    • 3. Play_Cnt: ein Datenfeld, das die Anzahl von Malen enthält, die ein Segment wiedergegeben wurde. Play_Cnt wird auf 1 gesetzt, wenn ein Datensatz erstellt wird.
    • 4. ZMM: ein Datenfeld, das die ZMM-Rate für das Segment darstellt.
  • Zusätzlich zu den oben beschriebenen Datenfeldern leiten zwei Parameter den Geschwindigkeitskonturgenerator 500 beim Erzeugen einer Geschwindigkeitskontur an:
    • 1. Average_or_Overwrite: Dieser Parameter spezifiziert, wie Informationen zu protokollieren sind, wenn der Benutzer den "schnellen Rücklauf" benutzt oder die Wiedergabeposition manuell verschiebt (d. h. mit einer Maus, einem Schieberegler oder einem Positionsanzeiger), so dass ein Bereich der eingegebenen Audio- oder audio-visuellen Arbeit, der schon einmal wiedergegeben wurde, erneut wiedergegeben wird. Wenn der Wert des Parameters "Average" ist, so wird die ZMM-Rate oder Wiedergaberate für das wiederholte Segment durch Mitteln der ZMM-Rate oder Wiedergaberate berechnet, die jedes Mal spezifiziert wurde, wenn das Segment wiedergegeben wurde. Wenn der Wert der Parameter "Overwrite" ist, so wird nur die letzte ZMM-Rate oder Wiedergaberate, die für das wiederholte Segment spezifiziert wurde, für das wiederholte Segment in der Geschwindigkeitskontur verwendet.
    • 2. Log_Repeats: Dieser Parameter ist eine Boolesche Variable, die, wenn sie wahr ist, den Geschwindigkeitskonturgenerator 500 anweist, jedes Mal ZMM-Raten aufzuzeichnen, wenn ein Stuck der eingegebenen Audio- oder audio-visuellen Arbeit durch den Benutzer wiedergegeben wird. Die ZMM-Rate oder Wiedergaberate wird jedes Mal gespeichert, wenn das Segment wiedergegeben wird.
  • Die Parameter Average_or_Overwrite und Log_Repeats können gemäß dem Durchschnittsfachmann vertrauten Verfahren als vorgegebene Parameter für die Ausführungsform 1000 eingestellt werden, oder sie können gemäß dem Durchschnittsfachmann vertrauten Verfahren durch Empfangen von Benutzereingaben über die BSS 100 eingegeben und/oder verändert werden. Die Art und Weise, in der diese Parameter eingestellt und/oder verändert werden, ist jedoch nicht gezeigt, um das Verstehen der vorliegenden Erfindung zu erleichtern.
  • Wie in 2 gezeigt, werden die Segmentposition und die ZMM-Rate als Eingang in das Kästchen 1500 eingespeist. Im Kästchen 1500, wird eine Suche ausgeführt, um alle Datensätze in der Datenbank zu finden, die identische Segmentpositionswerte enthalten. Die Steuerung wird dann an das Kästchen 1510 weitergegeben. Im Kästchen 1510 wird eine Entscheidung getroffen. Wenn ein Datensatz, der identische Segmentpositionsinformationen enthält, gefunden wird, so wird der Datensatz vermerkt, und die Steuerung wird an das Kästchen 1520 weitergegeben. Wenn kein solcher Datensatz gefunden wird, so wird die Steuerung an das Kästchen 1570 weitergegeben.
  • Im Kästchen 1570 wird ein neuer Datensatz in der Datenbank erstellt, und eine interne Variable Record_Count wird aktualisiert, um den Zählwert der Datensätzen in der Datenbank widerzuspiegeln. (Die interne Variable Record_Count wird am Beginn des Erzeugens jeder neuen Geschwindigkeitskontur auf 0 initialisiert.) Dann wird die Steuerung an das Kästchen 1580 weitergegeben. Im Kästchen 1580 werden Datenwerte in Feldern des neu erzeugten Datensatzes gespeichert, und die Steuerung wird an das Kästchen 1550 weitergegeben.
  • Im Kästchen 1520 wird eine Entscheidung getroffen. Wenn ein Parameter Log_Repeats wahr ist, so wird die Steuerung an das Kästchen 1570 weitergegeben, und wenn der Parameter Log_Repeats falsch ist, so wird die Steuerung an das Kästchen 1530 weitergegeben. Im Kästchen 1530 wird eine Entscheidung getroffen. Wenn der Wert des Parameters Average_or_Overwrite gleich "Average" ist, so wird die Steuerung an das Kästchen 1540 weitergegeben. Wenn der Wert des Parameters Average_or_Overwrite gleich "Overwrite" ist, so wird die Steuerung an das Kästchen 1560 weitergegeben.
  • Im Kästchen 1540 werden die Daten in den Feldern ZMM und Play_Cnt ersetzt. Wie in 2 gezeigt, wird der vorherige Wert von Play_Cnt zum Berechnen eines mathematischen Durchschnitts der ZMM-Raten verwendet, und Play_Cnt wird inkrementiert. Dann wird die Steuerung an das Kästchen 1550 weitergegeben. Im Kästchen 1560 werden die Daten in den Feldern ZMM und Play_Cnt ersetzt. Wie in 2 gezeigt, überschreibt die aktuelle ZMM-Rate die vorherige ZMM-Rate, und Play_Cnt wird inkrementiert. Dann wird die Steuerung an das Kästchen 1550 weitergegeben.
  • Im Kästchen 1550 wird der neu erzeugte oder modifizierte Datensatz in der Datenbank gespeichert. Die Steuerung wird dann ausgesetzt, bis neue Datenwerte bei der Geschwindigkeitskontur 500 ankommen, woraufhin die Steuerung an das Kästchen 1500 weitergegeben wird. Bei Vollendung der Wiedergabe einer Audio- oder audio-visuellen Arbeit wird die Datenbank durchsucht, und die ZMM-Raten oder Wiedergaberaten für jedes Segment des Eingangssignals werden extrahiert und zum Erstellen der Geschwindigkeitskontur verwendet. Es ist zu beachten, dass, wenn keine Segmente wiederholt werden und die Arbeit in ihrem ganzen Umfang wiedergegeben wird, die Geschwindigkeitskontur erhalten wird, indem die Datenbank-Datensätze in aufsteigender Reihenfolge entsprechend ihrer Zuordnungsreihenfolge, die in dem Rec-Datenfeld gespeichert ist, sortiert werden. Es ist des Weiteren zu beachten, dass die Geschwindigkeitskontur zur späteren Verwendung gemäß einem der vielen Verfahren, die dem Durchschnittsfachmann vertraut sind, gespeichert werden kann, um einen solchen digitalen Datenstrom zu speichern. Zum Beispiel kann die Geschwindigkeitskontur in der digitalen Speichervorrichtung 75 oder auf einem sonstigen Speichermedium gespeichert werden, oder sie wird mittels eines Übertragungsgerätes, wie zum Beispiel eines Modems, zu einem anderen System übertragen.
  • Obgleich 1 die Ausführungsform 1000 so zeigt, dass sie aus separaten Modulen besteht, sind in einer bevorzugten Ausführungsform die BSS 100, die BEP/WS 200, das ZMM-Teilsystem 300, der ZMM-Monitor 400 und der Geschwindigkeitskonturgenerator 500 als Software-Programme oder -Module verkörpert, die auf einem Allzweckcomputer wie zum Beispiel einem Personalcomputer ablaufen. Des Weiteren ist die digitale Speichervorrichtung 75 als ein Plattenlaufwerk oder Direktzugriffsspeicher verkörpert, und der Digital-Analog-Wandler 600 ist als ein typisches Zubehör eines Allzweckcomputers, wie zum Beispiel einer Soundkarte in einem Personalcomputer, verkörpert. Dem Durchschnittsfachmann dürfte es vor dem Hintergrund der obigen detaillierten Beschreibung klar sein, wie diese Programme oder Module als Software zu implementieren sind.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung können die Daten, die in einer Geschwindigkeitskontur für einen bestimmten Benutzer dargestellt sind, in einem grafischen Format dargestellt werden, um die ZMM-Raten oder Wiedergaberaten anzuzeigen, die durch einen Benutzer oder durch Gruppen von Benutzern ausgewählt wurden, um beim Auffinden von Ähnlichkeiten oder Unterschiede zu helfen. In einer Ausführungsform wird die ZMM-Rate auf der vertikalen Achse eines zweidimensionalen Diagramms angezeigt, und der Segmentanzahl- oder Zeitwert wird auf der horizontalen Achse angezeigt. 3 zeigt in grafischer Form Geschwindigkeitskonturen für mehrere verschiedene Hörsitzungen derselben Audio- oder audio-visuellen Arbeit. Es ist zu beachten, dass durch Anzeigen dieser Geschwindigkeitskonturen in einem grafischen Format Informationen zum Interesse des Benutzers, zum Verstehen des Benutzers und zu Unsicherheiten des Benutzers abgeleitet werden können. Es ist zum Beispiel zu beachten, dass alle drei Benutzer die ZMM-Rate oder Wiedergaberate bei Segment 1000 (Markierung A in 3) verlangsamten und dann die ZMM-Rate oder Wiedergaberate an ungefähr dem gleichen Segment 2200 (Markierung B in 3) in der Audio- oder audio-visuellen Arbeit beschleunigten. Daraus kann abgeleitet werden, dass die Benutzer mehr an dem Material interessiert waren, das in dem Intervall zwischen den Segmenten 1000 und 2200 dargeboten wurde, oder dass die Komplexität des Materials sich in einer solchen Weise veränderte, dass die ZMM-Rate oder Wiedergaberate für die vorherigen Segmente in diesem Intervall zu schnell für ein bequemes und vollständiges Verstehen des Themas war. Dem Durchschnittsfachmann dürfte klar sein, wie eine grafische Anzeige von Geschwindigkeitskonturen, die gemäß der oben beschriebenen Ausführungsform 1000 gespeichert wurden, bereitgestellt wird und wie solche Geschwindigkeitskonturen für mehrere Benutzer und/oder für mehrere Sitzungen für denselben Benutzer mit zugehörigen Identifikationsinformationen gespeichert werden, um es zu ermöglichen, gemäß Verfahren, die dem Durchschnittsfachmann vertraut sind, die Informationen, die sich auf bestimmte der gespeicherten Geschwindigkeitskonturen beziehen, abzurufen.
  • Eine alternative Ausführungsform der vorliegenden Erfindung hat identische Komponenten zu denen, die oben in Verbindung mit der Ausführungsform 1000 beschrieben (und in 1 gezeigt) wurden, mit Ausnahme des Geschwindigkeitskonturgenerators 500. In dieser alternativen Ausführungsform der vorliegenden Erfindung gibt der Geschwindigkeitskonturgenerator 500 eine "abgeleitete" Geschwindigkeitskontur aus, welche die Ableitung der ZMM-Rate oder Wiedergaberate für jedes Segment der eingegebenen Audio- oder audio-visuellen Arbeit umfasst. 4 zeigt eine grafische Darstellung von Geschwindigkeitskonturen, die unter Verwendung der ersten mathematischen Ableitung der ZMM-Rate oder der Wiedergaberate erzeugt wurden, die durch den Benutzer für mehrere verschiedene Hörsitzungen derselben Audio- oder audio-visuellen Arbeit spezifiziert wurde. In den zweidimensionalen Diagrammen, die in 4 gezeigt sind, wird die erste Ableitung der ZMM-Rate auf der vertikalen Achse angezeigt, und die Zeit wird auf der horizontalen Achse angezeigt. Es wurden dieselben Daten, die in 3 gezeigt sind, zum Erstellen der abgeleiteten Geschwindigkeitskontur für jeden Benutzer verwendet. Wie in 4 zu sehen ist, zeigt die abgeleitete Geschwindigkeitskontur Änderungen der ZMM-Raten oder Wiedergaberaten, die durch Benutzer angefordert wurden, in einer ausgeprägten Weise an, die relativ leicht festzustellen ist. Außerdem kann man ohne Weiteres erkennen, dass die abgeleitete Geschwindigkeitskontur weniger Daten als eine Geschwindigkeitskontur umfasst, da es relativ wenige Änderungen an der ZMM-Rate oder Wiedergaberate gibt und nur Segmente, die zu abgeleiteten ZMM-Raten ungleich null gehören, gespeichert zu werden brauchen. Dem Durchschnittsfachmann dürfte klar sein, wie der in 2 veranschaulichte Algorithmus zu modifizieren ist, um unter Verwendung von dem Durchschnittsfachmann vertrauten Verfahren eine abgeleitete Geschwindigkeitskontur zu bestimmen oder eine abgeleitete Geschwindigkeitskontur von einer Geschwindigkeitskontur abzuleiten.
  • Der Begriff "durchschnittliche Geschwindigkeitskontur" bezieht sich auf eine Geschwindigkeitskontur, die für eine bestimmte Audio- oder audio-visuelle Arbeit durch Mitteln mehrerer Geschwindigkeitskonturen erhalten wurde, die unter Verwendung einer Ausführungsform der vorliegenden Erfindung, zum Beispiel der oben eingehend beschriebenen Ausführungsform 1000, erzeugt wurden, wenn ein bestimmter Benutzer sich die Audio- oder audio-visuelle Passage mehrere Male anhört. Der Wert der ZMM- Rate oder Wiedergaberate für ein bestimmtes Segment der durchschnittlichen Geschwindigkeitskontur wird erhalten, indem der mathematische Durchschnitt der ZMM-Rate oder Wiedergaberate in jeder der mehreren Geschwindigkeitskonturen für das entsprechende Segment der Audio- oder audio-visuellen Arbeit berechnet wird. Dem Durchschnittsfachmann dürfte klar sein, wie Geschwindigkeitskonturen, die gemäß der oben beschriebenen Ausführungsform 1000 für mehrere Benutzer und/oder für mehrere Sitzungen für denselben Benutzer erzeugt wurden, mit zugehörigen Identifikationsinformationen zu speichern sind, um es zu ermöglichen, gemäß Verfahren, die dem Durchschnittsfachmann vertraut sind, die Informationen, die sich auf bestimmte der gespeicherten Geschwindigkeitskonturen beziehen, abzurufen. Des Weiteren dürfte für den Durchschnittsfachmann klar sein, wie eine durchschnittliche Geschwindigkeitskontur aus einer beliebigen Zahl gespeicherter Geschwindigkeitskonturen zu berechnen ist. Zu den Verwendern der durchschnittlichen Geschwindigkeitskontur gehören unter anderem jene, die kommerzielle oder Informationszwecken dienende Audio- oder audio-visuelle Arbeiten produzieren, in denen Informationen, zum Beispiel eine Telefonnummer, durch Hörer mitgeschrieben werden. Um eine optimale Informationsübermittlungsrate zu bestimmen, die den Hörer am besten in die Lage versetzt, die gewünschten Informationen erfolgreich mitzuschreiben, würde man eine durchschnittliche Kontur unter Verwendung von Geschwindigkeitskonturen erzeugen, die durch einen repräsentativen Benutzer aus dem Zielpublikum erzeugt wurden. Weitere Anwender der durchschnittlichen Geschwindigkeitskontur sind jene, die Informationen mit einer maximalen Übermittlungsrate für eine Audio- oder audio-visuelle Arbeit bereitstellen möchten, wobei es diese maximale Übermittlungsrate Hörern ermöglicht, die übermittelten Informationen zu verstehen. Zum Beispiel würden die Produzenten von Werbespots eine schnelle Sprechrate oder Informationsübermittlungsrate verwenden, um so viele Informationen wie möglich innerhalb eines vorgegebenen Zeitfensters zu übermitteln. Ein Hörer, der die Ausführungsform der vorliegenden Erfindung nutzt, könnte die ZMM-Rate über Segmente der Audio- oder audio-visuellen Arbeit hinweg verringern, in denen die Sprechrate zu schnell war, als dass der Hörer sie geistig oder akustisch hätte erfassen können.
  • Der Begriff "demokratische Geschwindigkeitskontur" bezieht sich auf eine Geschwindigkeitskontur, die für eine bestimmte Audio- oder audio-visuelle Arbeit erhalten wurde, indem mehrere Geschwindigkeitskonturen oder mehrere durchschnittliche Geschwindigkeitskonturen gemittelt wurden, die von verschiedenen Benutzern erhalten wurden, während sie sich diese bestimmte Audio- oder audio-visuelle Arbeit anhörten. Der Wert der ZMM-Rate oder Wiedergaberate für ein bestimmtes Segment der demokratischen Geschwindigkeitskontur wird erhalten, indem der mathematische Durchschnitt der ZMM-Rate oder Wiedergaberate in jeder der mehreren Geschwindigkeitskonturen (jede zum Beispiel von einem anderen Hörer) für das entsprechende Segment der Audio- oder audio-visuellen Arbeit berechnet wird. Dem Durchschnittsfachmann dürfte klar sein, wie Geschwindigkeitskonturen, die gemäß der oben beschriebenen Ausführungsform 1000 für mehrere Benutzer und/oder für mehrere Sitzungen für denselben Benutzer erzeugt werden, mit zugehörigen Identifikationsinformationen zu speichern sind, um es zu ermöglichen, gemäß Verfahren, die dem Durchschnittsfachmann vertraut sind, die Informationen, die sich auf bestimmte der gespeicherten Geschwindigkeitskonturen beziehen, abzurufen. Zu den Verwendern der demokratischen Geschwindigkeitskontur gehören unter anderem Personen, die Informationen übermitteln. Um eine optimale Informationsübermittlungsrate zu bestimmen, die es einer bestimmten demografischen Gruppe von Hörern am besten ermöglicht, die Informationen zu nutzen, würde man eine demokratische Kontur unter Verwendung von Geschwindigkeitskonturen erzeugen, die durch Mitglieder der bestimmten demografischen Gruppe von Hörern erzeugt wurden. Zum Beispiel kann die Ausführungsform verwendet werden, um eine demokratische Kontur bereitzustellen, die den Umstand ausnutzt, dass Hörer aus einem Teil des Landes eine langsamere Informationsübermittlungsrate brauchen, wenn sie einem Sprecher mit einem Akzent aus einem anderen Teil des Landes zuhören. In einer anderen Verwendung einer demokratischen Kontur werden Informationen über eine bestimmte demografische Hörer-Gruppe erhalten, zum Beispiel durch Fragebogen. Dann werden Zielgruppen auf der Basis von Antworten in den Fragebögen ausgewählt. Zum Beispiel kann eine Gruppe in eine Untergruppe von Hörern, die auf Arbeit einen Personalcomputer verwenden, und in eine Untergruppe von Hörern, die das nicht tun, unterteilt werden. Dann wird eine optimale Informationsübermittlungsrate bezüglich eines Computersoftwareprodukts anhand einer demokratischen Geschwindigkeitskontur, die durch jede Untergruppe erzeugt wurde, erhalten. Auf diese Weise kann die optimale Informationsübermittlungsrate einer kommerziellen oder einer Informationszwecken dienenden Audio- oder audio-visuellen Arbeit für eine bestimmte demografische Gruppe von Hörern erhalten werden.
  • 5 zeigt ein Blockschaubild der Ausführungsform 2000 eines zweiten Aspekts der vorliegenden Erfindung, die eine Geschwindigkeitskontur für eine Audio- oder audio-visuelle Arbeit erzeugt, wobei Benutzereingaben und eine Wortkarte einer Audio- oder audio-visuellen Arbeit zum Bereitstellen einer Geschwindigkeitskontur verwendet werden. In solchen Ausführungsformen kann die Geschwindigkeitskontur erzeugt werden, auch ohne dass sich der Benutzer das Audio oder den Audio-Abschnitt der audio-visuellen Arbeit anhört. Gemäß dem zweiten Aspekt der vorliegenden Erfindung werden keine ZMM-Raten oder Wiedergaberaten abgetastet, wie es oben in Verbindung mit dem ersten Aspekt der vorliegenden Erfindung beschrieben wurde, sondern die Geschwindigkeitskontur wird unter Verwendung eines Editors erhalten, der die Geschwindigkeitskontur in Reaktion auf Benutzereingaben anzeigt und handhabt.
  • Wie in 5 gezeigt, umfasst die Ausführungsform 2000 eine Benutzerschnittstelle 2100 ("BSS 2100"), die Eingaben von einem Benutzer empfängt. Es gibt viele dem Durchschnittsfachmann vertraute Vorrichtungen zum Empfangen einer Eingabe von einem Benutzer. Zum Beispiel ist es dem Durchschnittsfachmann vertraut, dass handelsübliche Vorrichtungen existieren, um: (a) das Drücken einer Taste; (b) die Aktivierung eines Tasters an einer Maus; (c) die Bewegung eines Schiebereglers oder Positionsanzeigers; und (d) Benutzersprachbefehle zu detektieren und um in Reaktion darauf digitale Daten, die den Tastendruck, die Tasteraktivierung, die Bewegung des Schiebereglers oder Positionsanzeigers oder die Sprachbefehle darstellen, an eine zentrale Verarbeitungseinheit zu senden.
  • Wie weiterhin in 5 gezeigt, umfasst die Ausführungsform 2000 einen Benutzereingabeprozessor 2200 ("BEP 2200"), der Benutzereingaben von der BSS 2100 und Daten oder Signale von einer eingegebenen Audio- oder audio-visuellen Arbeit empfängt, die in der digitalen Speichervorrichtung 2075 gespeichert wird. In Reaktion darauf erzeugt der BEP 2200 Daten und gibt diese aus, um ein zweidimensionales Diagramm zu erzeugen, zum Beispiel mit: (a) Zeit und eventuell Text oder phonetischen Wörtern, die auf der horizontalen Achse angezeigt sind, und (b) ZMM-Raten, die auf der vertikalen Achse angezeigt sind. Die Grafikanzeige 2300 empfängt als Eingang von dem BEP 2200 Daten, die ein Grafikschirmanzeigebild liefen. In Reaktion darauf zeigt die Grafikanzeige 2300 eine zweidimensionale Darstellung einer eingegebenen Audio- oder audio-visuellen Arbeit mit Text oder phonetischen Kennzeichnungen an. Zum Beispiel ist es dem Durchschnittsfachmann vertraut, dass Text und/oder phonetische Informationen als eine Überlagerung über einer grafischen Darstellung einer Sprachwellenform auf einem Computerschirm angezeigt werden können. Dann kann der Benutzer gemäß der Ausführungsform 2000 Bereiche des Textes, die auf der Grafikanzeige 2300 angezeigt werden, unter Verwendung zum Beispiel eines Cursors unter der Steuerung der BSS 2100 markieren, um spezielle Abschnitte der eingegebenen Audio- oder audio-visuellen Arbeit, die zu dem markierten Text gehören, festzulegen. Als nächstes wählt und/oder spezifiziert der Benutzer unter Verwendung der BSS 2100 in einer dem Durchschnittsfachmann vertraute Weise eine ZMM-Rate oder Wiedergaberate für den speziellen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit, der zu dem markierten Text gehört. In einer anderen Ausführungsform dieses zweiten Aspekts der vorliegenden Erfindung umfasst der BEP 2200 einen Texteditor, der eine Transkription einer Audio-Arbeit oder des Audio-Abschnitts einer audio-visuellen Arbeit anzeigt. In Reaktion darauf wählt der Benutzer unter Verwendung der BSS 2100 in einer dem Durchschnittsfachmann vertrauten Weise Textbereiche aus und wählt und/oder spezifiziert eine ZMM-Rate oder Wiedergaberate für die ausgewählten Textbereiche. Als nächstes werden Abtastungen oder Segmente der eingegebenen Audio- oder audio-visuellen Arbeit, die Grenzen der ausgewählten Textbereiche entsprechen, bestimmt und zum Erstellen der Geschwindigkeitskontur verwendet. 6 zeigt in grafischer Form ein zweidimensionales Diagramm, das eine Sprachwellenform und entsprechenden Text für eine Audio- oder audio-visuelle Arbeit anzeigt. Wie in 6 gezeigt, hat der Benutzer den Bereich 6100 der eingegebenen Audio- oder audio-visuellen Arbeit markiert, der eine Telefonnummer enthält. Der Benutzer verwendet dann den Schieberegler 6200, um die gewünschte ZMM-Rate für den ausgewählten Bereich der eingegebenen Audio- oder audio-visuellen Arbeit anzuzeigen. Und schließlich zeigt 6 eine Geschwindigkeitskontur 6300, die auf der Basis von ZMM-Raten erzeugt wird, die durch den Benutzer angefordert werden. 7 zeigt eine Anzeige einer Transkription einer Audio- oder audio-visuellen Arbeit. Wie in 7 gezeigt, hat der Benutzer den Bereich 7100 der Transkription der eingegebenen Audio- oder audio-visuellen Arbeit, der eine Telefonnummer enthält, markiert.
  • Der BEP 2200 erstellt eine Geschwindigkeitskontur mittels des gleichen Verfahrens (oder eines Verfahren, das dem Verfahren ähnelt), das oben für die Geschwindigkeitskontur 500 (in Verbindung mit 2) beschrieben wurde. Schließlich speichert der BEP 2200 die Geschwindigkeitskontur zum Beispiel in der digitalen Speichervorrichtung 2075 oder auf einem anderen Speichermedium oder überträgt die Geschwindigkeitskontur mittels eines Übertragungsgerätes wie zum Beispiel eines Modems zu einem anderen System.
  • Obgleich 5 die Ausführungsform 1000 so zeigt, dass sie aus separaten Modulen besteht, sind in einer bevorzugten Ausführungsform die BSS 2100 und der BEP 2200 als Software-Programme oder -Module verkörpert, die auf einem Allzweck-Computer wie zum Beispiel einem Personalcomputer ablaufen. Des Weiteren ist die digitale Speichervorrichtung 2075 als ein Plattenlaufwerk oder ein Direktzugriffsspeicher verkörpert. Vor dem Hintergrund des oben im einzelnen Dargelegten dürfte dem Durchschnittsfachmann klar sein, wie diese Programme oder Module als Software zu implementieren sind. Des Weiteren kann die Audio- oder audio-visuelle Arbeit in analoger Form in der digitalen Speichervorrichtung 2075 gespeichert werden und gemäß vielen Verfahren, die dem Durchschnittsfachmann vertraut sind, in eine digitale Form umgesetzt werden.
  • Gemäß dem oben beschriebenen ersten und zweiten Aspekt der vorliegenden Erfindung ist eine Geschwindigkeitskontur zeitlicher Art, d. h. eine ZMM-Rate oder Wiedergaberate ist jedem Zeitintervall einer Audio- oder audio-visuellen Arbeit zugeordnet. Diese Charakterisierung der Geschwindigkeitskontur erfordert die eine oder andere Art von Vorschau der Audio- oder audio-visuellen Arbeit, entweder durch den Hörer oder einen Editor, um die Geschwindigkeitskontur für die Arbeit zu bestimmen. Um das zu vermeiden, wird in einer Ausführungsform eines dritten Aspekts der vorliegenden Erfindung eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur ("KGZ"-Datenstruktur) zur Verwendung bei der Erstellung eine HIG-Arbeit erzeugt. Eine KGZ-Datenstruktur ist zum Beispiel eine Reihe von Paarungen von Listen mit Konzeptidentifikatoren und Listen mit Geschwindigkeitswertidentifikatoren. Die KGZ-Datenstruktur wird als eine Liste dieser Unterlisten-Paare gespeichert.
  • Ein Konzeptidentifikator umfasst ein Schlüsselwort, eine Kette aus Wörtern oder eine Phrase, das bzw. die ein Konzept wie zum Beispiel "Aktienmarkt", "Wall Street" und "Wirtschaft und Finanzen" zum Ausdruck bringt. Diese Konzeptidentifikatoren werden mit Geschwindigkeitswertidentifikatoren gepaart, die eine ZMM-Rate oder Wiedergaberate darstellen, die von einem Benutzer gewünscht wird, während er sich eine Audio- oder audio-visuelle Arbeit anhört, welche die Konzeptidentifikatoren enthält.
  • Ausführungsformen des dritten Aspekts der vorliegenden Erfindung arbeiten mit einer Detektionsvorrichtung, die konzeptuelle Informationen in einem bestimmten Abschnitt einer Audio- oder audio-visuellen Arbeit detektiert, und eine Abrufvorrichtung, welche die konzeptuellen Informationen zum Abrufen von ZMM-Raten- oder Wiedergaberaten-Informationen von der KGZ-Datenstruktur verwendet, wobei diese abgerufenen Informationen dafür verwendet wenden, um die ZMM-Rate oder Wiedergaberate zu bestimmen, die für den bestimmten Abschnitt zu verwenden ist. Gemäß einer Ausführungsform der vorliegenden Erfindung umfasst die Detektionsvorrichtung dem Durchschnittsfachmann vertraute Spracherkennungstechnik. Gemäß einer anderen Ausführungsform der vorliegenden Erfindung umfasst die Detektionsvorrichtung Technik, die konzeptuelle Informationen detektiert, die in Untertitel-Informationen enthalten sind, die zusammen mit vielen Fernsehsendungen ausgestrahlt werden oder zum Beispiel auf Spielfilmvideos verfügbar sind. Solche Detektionsvorrichtungen zum Detektieren von Untertitel-Informationen sind dem Durchschnittsfachmann vertraut.
  • 8 zeigt ein Blockschaubild einer Ausführungsform 4000 eines dritten Aspekts der vorliegenden Erfindung, die eine KGZ-Datenstruktur für eine Audio- oder audio-visuelle Arbeit erzeugt. Wie in 8 gezeigt, umfasst die Ausführungsform 4000 eine Benutzerschnittstelle 4100 ("BSS 4100"), die Eingaben von einem Benutzer empfängt. Eine Ausführungsform der BSS 4100 ist die gleiche wie die BSS 100, die oben mit Bezug auf 1 beschrieben wurde. Die BSS 4100 gibt Ausgangssignale aus, die eine Eingabe vom Benutzer anzeigen. Die Benutzereingabe wird durch den Benutzereingabeprozessor/die Wiedergabesteuerung 4200 ("BEP/WS 4200") interpretiert, um die folgenden Optionen anzuzeigen, die durch den Benutzer ausgewählt wurden: (a) Auswählen einer wiederzugebenden Datei, wobei diese Datei einer bestimmten Audio- oder audio-visuellen Arbeit entspricht (die ausgewählte Datei kann in die Ausführungs form 4000 direkt eingegeben werden, oder sie kann eine Datei sein, die durch die Ausführungsform 4000 gespeichert wurde); (b) Initiieren der Wiedergabe der ausgewählten Datei; (c) Anhalten der Wiedergabe der ausgewählten Datei; (d) Pausieren der Wiedergabe der ausgewählten Datei; (e) Modifizieren der ZMM-Rate oder Wiedergaberate eines Abschnitts der wiedergegebenen Audio- oder audio-visuellen Arbeit; oder (f) Spezifizieren der Parameter Refine_or_Average, Theta und Sigma, die durch die Vorrichtung in einer Weise, die weiter unten noch eingehender erläutert wird, beim Erzeugen eines KGZ-Datenstruktur verwendet werden.
  • Die BEP/WS 4200 empfängt eine Eingabe von der BSS 4100 und (a) wandelt die Benutzereingabe in numerische Werte um; (b) interpretiert die Benutzereingabe zum Einstellen der Werte von Parametern und zum Steuern der Erstellung, Verwendung, Modifizierung oder Außerkraftsetzung der KGZ-Datenstruktur; und (c) lenkt den Zugriff auf einen Datenstrom und das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit durch Senden von Stromdatenanforderungen an die digitale Speichervorrichtung 4075 (zur Durchführung einer Wiedergabesteuerung). Im Fall der digitalen Speichervorrichtung 4075 kann die BEP/WS 4200 den Zugriff auf eine Datei aus digitalen Daten anfordern, die eine Audio- oder audio-visuelle Arbeit darstellen, die in einem Dateisystem in der Vorrichtung gespeichert ist. Um den Zugriff auf einen Datenstrom von einer Audio- oder audio-visuellen Arbeit oder das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit zu lenken, interpretiert die BEP/WS 4200 die Benutzereingabe und die Position digitaler Abtastungen, welche die Audio- oder audio-visuelle Arbeit darstellen, die in der digitalen Speichervorrichtung 4075 gespeichert ist, um Wiedergabepositionen für die ausgewählte Datei bei einer bestimmten Abtastung zu berechnen.
  • Die digitale Speichervorrichtung 4075 empfängt Folgendes als Eingang: (a) Stromdatenanforderungen von der BEP/WS 4200; und optional (b) einen zeitmaßstabsmodifizierten Ausgang von dem ZMM-Teilsystem 4300; und optional (c) einen Datenstrom, der die KGZ-Datenstruktur von dem KGZ-Datenstrukturgenerator 4500 ("KGZDS-Generator 4500") darstellt. Die digitale Speichervorrichtung 4075 erzeugt Folgendes als Ausgang: (a) einen Datenstrom, der eine Audio- oder audio-visuelle Arbeit darstellt; und (b) einen Strom aus Positionsinformationen, zum Beispiel die Position in einer Datei, des ausgegebenen Datenstroms. Es gibt viele dem Durchschnittsfachmann vertraute Verfahren zum Verwenden digitaler Speichervorrichtungen, zum Beispiel einer "Festplatte", um Allzweckdaten zu speichern und abzurufen.
  • Die Audio- oder audio-visuelle Arbeit wird in der Regel in digitaler Form in der digitalen Speichervorrichtung 4075 gespeichert. Eine Ausführungsform der digitalen Speichervorrichtung 4075 ist die gleiche wie die oben mit Bezug auf 1 beschriebene digitale Speichervorrichtung 75. Die digitale Speichervorrichtung 4075 empfängt Datenanforderungen von der BEP/WS 4200 gemäß dem Durchschnittsfachmann vertrauten Verfahren, um einen Strom digitaler Abtastungen bereitzustellen, welche die Audio- und/oder audio-visuelle Arbeit darstellen. In alternativen Ausführungsformen wird die Audio- oder audio-visuelle Arbeit in analoger Form in einer analogen Speichervorrichtung gespeichert. In einer solchen alternativen Ausführungsform wird ein Strom aus analogen Signalen in eine (nicht gezeigte) Vorrichtung eingespeist, um die analogen Abtastungen in digitale Abtastungen umzuwandeln. Es gibt viele dem Durchschnittsfachmann vertraute handelsübliche Vorrichtungen zum Empfangen eines eingegebenen analogen Signals, wie zum Beispiel eines Sprachsignals, und zum Abtasten des analogen Signals mit einer Rate, die mindestens die Nyquist-Rate ist, um einen Strom digitaler Signale bereitzustellen, die ohne Qualitätsverlust in ein analoges Signal zurückkonvertiert werden können. Die digitalen Abtastungen werden dann an das ZMM-Teilsystem 4300 übertragen.
  • Das ZMM-Teilsystem 4300 empfängt als Eingang: (a) einen Strom aus Abtastungen, der Abschnitte der Audio- oder audio-visuellen Arbeit darstellt, von der digitalen Speichervorrichtung 4075; (b) Strompositionsinformationen von der digitalen Speichervorrichtung 4075, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Datenstrom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert; und (c) eine gewünschte ZMM-Rate oder Wiedergaberate von dem Zeitmaßstabsmodifikationskonzeptmonitor 4400 ("ZMM-Konzeptmonitor 4400"). Der Ausgang von dem ZMM-Teilsystem 4300 wird als Eingang eingespeist in: (a) die Digital-Analog-Wandler/Audio- und/oder audio-visuelle Wiedergabevorrichtung 4600 ("DA/AWV 4600") und optional in (b) den digitalen Speicher 4075 zum Speichern des zeitmaßstabsmodifizierten Ausgangs, d. h. der HIG-Arbeit, sofern gewünscht. Die DA/AWV 4600 ist eine auf diesem technischen Gebiet bestens bekannte Vorrichtung zum Empfangen digitaler Abtastungen und zum Erzeugen einer Audio- oder audio-visuellen Arbeit. Gemäß der vorliegenden Erfindung ist der Ausgang des ZMM-Teilsystems 4300 ein Strom digitaler Abtastungen, der eine Audio- oder audio-visuelle Arbeit darstellt, deren Wiedergaberate von dem ZMM-Konzeptmonitor 4400 übermittelt wird, um dem Benutzer eine Rückmeldung über seine aktuelle ZMM-Raten-Spezifikation zu geben. Der Benutzer hört sich die zeitmaßstabsmodifizierte Ausgabe an und kann die ZMM-Rate oder Wiedergaberate ändern, indem er unter Verwendung der BSS 4100 weitere Eingaben tätigt. Wenn der Benutzer des Weiteren einen gerade abgespielten Abschnitt der Audio- oder audio-visuellen Arbeit beschleunigen oder verlangsamen möchte (oder andere Abschnitte mit dem gleichen Konzeptidentifikator, die noch nicht wiedergegeben wurden, beschleunigen oder verlangsamen möchte), so kann der Benutzer mittels der BSS 4100 eine Eingabe tätigen, um einen schnellen Rücklauf der Audio- oder audio-visuellen Arbeit zu einem gewünschten Abschnitt auszuführen und sie noch einmal mit einer modifizierten ZMM- oder Wiedergaberate wiedergeben (oder die gewünschte ZMM-Rate oder Wiedergaberate für die anderen Abschnitte spezifizieren). Auf diese Weise bestimmt der Benutzer eine gewünschte ZMM-Rate oder Wiedergaberate für jeden Abschnitt der Audio- oder audio-visuellen Arbeit. Ausführungsformen des ZMM-Teilsystems 4300 und der DA/AWV 4600 sind die gleichen wie das ZMM-Teilsystem 300 und die DA/AWV 600, die oben mit Bezug auf 1 beschrieben wurden. Wie dem Durchschnittsfachmann sofort klar ist, beschleunigt oder verlangsamt das ZMM-Teilsystem 4300 jedes Mal, wenn die Ausführungsform 4000 eine audio-visuelle Arbeit wiedergibt, visuelle Informationen, um die an das Audio in der audio-visuellen Arbeit anzupassen. Dafür wird in einer bevorzugten Ausführungsform das Videosignal gemäß einem der vielen dem Durchschnittsfachmann bekannten Verfahren "Frame-unterabgetastet" oder "Frame-repliziert", um die Synchronität zwischen den Audio- und den visuellen Abschnitten der audio-visuellen Arbeit zu wahren. Wenn man also das Audio beschleunigt und Abtastungen mit einer schnelleren Rate angefordert werden, so wird der Frame-Strom unterabgetastet, d. h. Frames werden übersprungen.
  • Der Konzeptdeterminierer 4700 nimmt in Abhängigkeit von bestimmten Optionen als Eingang verschiedene Datensätze entgegen. Gemäß Option 1 umfassen die Eingabedaten einen Datenstrom, der Text oder Konzepte, zum Beispiel Untertitel-Daten oder Textanmerkungen, darstellt und der mit dem aktuellen Segment der eingegebenen Audio- oder audio-visuellen Arbeit, das in das ZMM-Teilsystem 4300 eingespeist wird, gespeichert wird. Für den Fall von Option 1 leitet der Konzeptdeterminierer 4700 den ankommenden Datenstrom, der Text oder Konzepte darstellt, als Ausgang an den Konzeptdecoder 4800 weiter. Gemäß Option 2 umfassen die Eingangsdaten: (a) einen Strom aus Abtastungen, der Abschnitte der Audio- oder audio-visuellen Arbeit darstellt, von der digitalen Speichervorrichtung 4075 und (b) aktuelle Strompositionsinformationen von der digitalen Speichervorrichtung 4075, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Strom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert des Anfangs der Gruppe von Abtastungen, die von der digitalen Speichervorrichtung 4075 übertragen werden. Für den Fall von Option 2 stellt der Konzeptdeterminierer 4700 als Ausgang einen Datenstrom bereit, der Konzepte darstellt, die in dem aktuellen Abschnitt der Audio- oder audio-visuellen Arbeit enthalten sind, der an das ZMM-Teilsystem 4300 übermittelt wird. Die Konzepte und/oder die Texttranskription gesprochener Passagen werden durch Extrahieren von Untertitel-Informationen aus der Audio- oder audio-visuellen Arbeit oder durch Verwendung von Spracherkennungsalgorithmen zum Erhalten eines Textstromes aus der eingegebenen Audio- oder audio-visuellen Arbeit bestimmt. Der Durchschnittsfachmann kennt viel Verfahren zum Extrahieren von Untertitel-Informationen, und der Durchschnittsfachmann kennt viel Verfahren zum Extrahieren von Text unter Verwendung von Spracherkennungsalgorithmen.
  • Der Konzeptinformationsdecoder 4800 nimmt als Eingang von dem Konzeptdeterminierer 4700 einen Datenstrom entgegen, der konzeptuelle Informationen darstellt. Gemäß der vorliegenden Erfindung, und ohne darauf beschränkt zu sein, umfassen die konzeptuellen Informationen: Mitschriften, Rohtext, Schlüsselworte, Phrasen oder sonstige dem Durchschnittsfachmann vertraute Darstellungen von konzeptuellen Informationen. In Reaktion darauf erzeugt der Konzeptinformationsdecoder 4800 als Ausgang einen Datenstrom, der Schlüsselwörter und Konzepte für den aktuellen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit, der an das ZMM-Teilsystem 4300 übermittelt wird, darstellt.
  • Der Konzeptinformationsdecoder 4800 verarbeitet den Eingang, um Konzeptdatendar stellungen des Eingangsdatenstroms zu bilden. Zum Beispiel kann der Konzeptinformationsdecoder 4800 einfach Artikel und Adjektive aus einer Eingabe, die eine Transkription darstellt, entfernen, um einen Ausgang zu erzeugen, der nur aus Substantiven und Substantiv-Phrasen besteht. Alternativ kann der Konzeptinformationsdecoder 4800 eine Verarbeitung natürlicher Sprache ausführen, um konzeptuellen Inhalt aus einem Strom gesprochener Wörter zu extrahieren. Der Durchschnittsfachmann kennt viele Verfahren zum Implementieren von Konzeptinformationsdecodern 4800. Zum Beispiel gibt es viele Systeme, die mit Techniken arbeiten, die als "Clusterbildung" bekannt sind, um Datensätze aus mehrdimensionalen Vektoren zu entwickeln, wobei jedes Element eines Vektors eine bestimmte Eigenschaft oder einen bestimmten Wert darstellt, die bzw. der mit Attributen des Gesamtdatensatzes verknüpft ist. Die Clusterbildung gestattet die Klassifikation und Gruppierung von Konzepten auf der Grundlage der N-dimensionalen Euklidschen Entfernung zwischen Vektoren. Es ist oft der Fall, dass Objekte in einem geclusterten Datensatz nicht explizit zu einem Cluster gehören, wobei in diesem Fall das Objekt mit mehr als einem Cluster verknüpft sein könnte. In solchen Situationen kann die Euklidsche Entfernung zum Darstellen der Wahrscheinlichkeit verwendet werden, dass ein Objekt ein Element jedes möglichen Clusters ist. Siehe zum Beispiel eine Doktorarbeit, die an der Mississippi State University, Mississippi, durch Rajeev Agarwal im Jahr 1995 eingereicht wurde und den Titel "Semantic Feature Extraction from Technical Texts with Limited Human Intervention" trägt.
  • Der ZMM-Konzeptmonitor 4400 empfängt Folgendes als Eingang zum Anleiten der Ausführungsform 4000 beim Erzeugen einer KGZ-Datenstruktur: (a) Benutzereingaben, die durch die BEP/WS 4200 auf eine gewünschte ZMM-Rate oder Wiedergaberate umgesetzt wurden (wobei diese gewünschte ZMM-Rate oder Wiedergaberate eine Änderung der ZMM-Rate oder Wiedergaberate für einen wahrgenommenen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit anzeigen kann); (b) Daten von dem Konzeptinformationsdecoder 4800, die Konzepte für den aktuellen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit, der an das ZMM-Teilsystem 4300 gesendet wird, darstellen; und (c) den Parameter Speed_Change_Resolution von der BEP/WS 4200.
  • Der ZMM-Konzeptmonitor 4400 verarbeitet die konzeptuellen Informationen und die durch den Benutzer angeforderte ZMM-Rate oder Wiedergaberate und leitet eine einzelne ZMM-Rate für das Konzept ab, das an seinem Eingang dargestellt wird. Zum Beispiel kann das Konzept, das von dem Konzeptinformationsdecoder 4800 ausgegeben wird, aufgrund der Tatsache, dass ein eingegebenes Konzept, wie zum Beispiel "Finanzmärkte", mehrere Wörter oder Phrasen in der wiedergegebenen Audio- oder audio-visuellen Arbeit darstellen kann, mehrere Sekunden lang unverändert bleiben. Aufgrund dessen kann der Benutzer eine Anzahl von ZMM-Raten über das Intervall der eingegebenen Audio- oder audio-visuellen Arbeit, das mit einem einzelnen Konzept verknüpft ist, anfordern. Gemäß der vorliegenden Erfindung erzeugt der ZMM-Konzeptmonitor 4400 eine einzelne ZMM-Rate für ein Konzept zum Beispiel durch Bilden eines mathematischen Durchschnitts der ZMM-Raten über das Intervall der eingegebenen Audio- oder audio-visuellen Arbeit, das mit diesem einzelnen Konzept verknüpft ist. Zum Beispiel könnte ein gewichteter Durchschnitt verwendet werden, der die jüngsten ZMM-Werte betont, die während des Intervalls erhalten wurden, in dem ein bestimmtes Konzept an dem Eingang des ZMM-Konzeptmonitors 4400 vorhanden war. Es versteht sich, dass dies lediglich Beispiele für viele verschiedene Verfahren sind, die verwendet werden könnten.
  • Der ZMM-Konzeptmonitor 4400 verwendet den Parameter Speed_Change_Resolution zum Bestimmen geeigneter ZMM-Raten zum Weiterleiten an das ZMM-Teilsystem 4300 und den KGZDS-Generator 4500. Die für ein bestimmtes Konzept ermittelte ZMM-Rate wird in einer dem Durchschnittsfachmann vertrauten Weise in einen der quantisierten Pegel umgewandelt. Das heißt, dass die ausgegebene ZMM-Rate oder Wiedergaberate sich nur ändern kann, wenn sich die eingegebene gewünschte ZMM-Rate um einen Betrag ändert, der die Differenz zwischen quantisierten Pegeln übersteigt; d. h. Speed_Change_Resolution und die Anzahl möglicher ZMM-Raten ist für die effiziente Darstellung in Datenstrukturen begrenzt. Der Parameter Speed_Change_Resolution kann als ein vorgegebener Parameter für die Ausführungsform 4000 gemäß dem Durchschnittsfachmann vertrauten Verfahren eingestellt werden, oder er kann durch Empfangen von Benutzereingaben über die BSS 4100 gemäß dem Durchschnittsfachmann vertrauten Verfahren eingegeben und/oder verändert werden. Die Art und Weise, in der diese Parameter eingestellt und/oder verändert werden, ist jedoch nicht gezeigt, um das Verstehen der vorliegenden Erfindung zu erleichtern.
  • Der ZMM-Konzeptmonitor 4400 erzeugt als Ausgang: (a) einen einzelnen ZMM-Raten-Wert und (b) Konzeptinformationen. Die ZMM-Rate wird als Eingang in das ZMM-Teilsystem 4300 und den Generator 4500 für eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur ("KGZDS-Generator 4500") eingespeist, und die Konzeptinformationen werden als Eingang in den KGZDS-Generator 4500 eingespeist. Dem Durchschnittsfachmann dürfte klar sein, dass das Folgende eine Ausführungsform, die einen Durchschnitt zum Bestimmen einer einzelnen ZMM-Rate für ein Konzept verwendet, nur zum einfacheren Verstehen der vorliegenden Erfindung beschreibt. Es dürfte jedoch ebenso klar sein, dass Ausführungsformen der vorliegenden Erfindung nicht auf einen einzelnen Algorithmus zum Bestimmen einer ZMM-Rate zum Verknüpfen mit einem Konzept beschränkt sind und dass Ausführungsformen der vorliegenden Erfindung nicht auf das Verknüpfen einer einzelnen ZMM-Rate mit einem Konzept beschränkt sind. Zum Beispiel kann sich die ZMM-Rate, die mit einem Konzept verknüpft ist, so ändern, dass sie zum Beispiel während einer Wiedergabe beschleunigt wird, um die Tatsache widerzuspiegeln, dass der Hörer mit dem Konzept vertrauter wird und nicht so viel Zeit braucht, um die Informationen zu verstehen, da das Konzept während der Wiedergabe der Arbeit wiederholt wird.
  • Der GZDS-Generator 4500 nimmt das Folgende als Eingang von dem ZMM-Konzeptmonitor 4400 entgegen: (a) Konzeptinformationen; (b) die ZMM-Rate oder Wiedergaberate für dieses Konzept; und (c) Parameter (Refine_or_Average, Theta und Sigma)-Werte von der BEP/WS 4200, die zum Steuern des Prozesses verwendete werden, der die KGZ-Datenstruktur erzeugt. Der Durchschnittsfachmann kennt viele Verfahren zum Implementieren dieser Datenstruktur.
  • Zum Beispiel kann die KGZ-Datenstruktur als eine Reihe verwandter Schlüsselwörter, Phrasen oder Konzepte implementiert sein, denen der entsprechende ZMM-Wert folgt.
    (("Aktien", "Schuldtitel", "Aktienmarkt", "Wall Street", "Währung") 0,8)
    (("Hollywood", "Schauspieler", "Spielfilm") 1,5)
    wobei die ZMM-Rate für die erste Gruppe von Konzepten 0,8 ist und die ZMM-Rate für die zweite Gruppe von Konzepten 1,5 ist. Es ist zu beachten, dass diese Datenstruk tur den Wunsch der Hörer repräsentiert, Informationen über den Aktienmarkt und andere finanzwirtschaftliche Konzepte mit einer verringerten Wiedergaberate (0,8) zu hören, und spezifiziert, dass Informationen über Hollywood-Filme und Schauspieler mit einer etwas schnelleren Wiedergaberate (dem 1,5-fachen der normalen Wiedergaberate) dargeboten werden sollen.
  • Der KGZDS-Generator 4500 verwendet eine Datenbank oder einen Notizblockspeicher zum Führen einer Datensatzliste, in der jeder Datensatz Informationen bezüglich Konzepten und ZMM-Raten, die diesen Konzepten zugeordnet sind, speichert. 9 zeigt ein Flussdiagramm eines Algorithmus', der in einer Ausführungsform des KGZDS-Generators 4500 zum Erzeugen der KGZ-Datenstruktur verwendet wird.
  • Wie in 9 gezeigt, werden Konzeptinformationen und die ZMM-Rate als Eingang in das Kästchen 9500 eingespeist. Im Kästchen 9500 wird eine Suche ausgeführt, um alle Datensätze in einer Datenbank zu finden, die identische oder ähnliche Konzeptinformationen; dann wird die Steuerung an das Kästchen 9510 weitergegeben. Im Kästchen 9510 wird ein numerischer Wert bestimmt, der die Ähnlichkeit der Liste potenzieller Übereinstimmungen für das Konzept, sofern vorhanden, widerspiegelt, die im Kästchen 9500 gefunden wurden. Eine konzeptuelle Distanz zwischen zwei Wörtern oder Datenwerten, die Konzepte darstellen, kann unter Verwendung einer beliebigen Anzahl von Verfahren, die dem Fachmann bekannt sind, berechnet werden. Zum Beispiel kann in der einfachsten Form eine Liste mit Synonymen oder anderen Referenzdaten zum Berechnen der Entfernung verwendet werden. In einem anderen Verfahren kann eine Euklidsche Entfernung verwendet werden, um die Ähnlichkeit von mehrdimensionalen Vektorobjekten in einem Datensatz zu messen, der Clusterbildungsalgorithmen zum Klassifizieren von Konzepten verwendet. In einem anderen Verfahren wird üblicherweise eine "kopfgesteuerte Phrasenstrukturgrammatik" verwendet, um Sätze und Wortphrasen auf ihre Bedeutung hin zu analysieren. Die Steuerung wird dann an das Kästchen 9520 weitergegeben.
  • Im Kästchen 9520 wird eine Entscheidung getroffen, um zu bestimmen, ob der Datensatz mit der besten Übereinstimmung innerhalb eines Betrages liegt, der durch einen Parameter Theta gegeben ist. Wenn die beste Übereinstimmung innerhalb des durch Theta gegebenen Betrages liegt, so wird die Steuerung an das Kästchen 9530 weiterge geben; anderenfalls wird die Steuerung an das Kästchen 9590 weitergegeben.
  • Im Kästchen 9530 wird eine Entscheidung getroffen, um zu bestimmen, ob ein Parameter Refine_or_Average gleich "Refine" oder "Average" ist. Wenn Refine_or_Average gleich "Refine" ist, so wird die Steuerung an das Kästchen 9540 weitergegeben. Wenn Refine_or_Average gleich "Average" ist, so wird die Steuerung an das Kästchen 9580 weitergegeben.
  • Im Kästchen 9580 wird der gespeicherte ZMM-Wert für ein bestimmtes Konzept aktualisiert, indem ein mathematischer Durchschnitt des existierenden ZMM-Wertes in der KGZ-Datenstruktur und der aktuell gespeicherten ZMM-Rate berechnet wird. Die Steuerung wird dann an das Kästchen 9570 weitergegeben.
  • Im Kästchen 9590 wird ein neuer Datensatz in der Datenbank erstellt; dann wird die Steuerung an das Kästchen 9600 weitergegeben. Im Kästchen 9600 werden in folgender Weise Werte in der KGZ-Datenstruktur installiert: (a) das aktuelle Konzept wird in dem Konzeptfeld gespeichert, und (b) die aktuelle ZMM-Rate wird in der ZMM-Feld gespeichert. Die Steuerung wird dann an das Kästchen 9570 weitergegeben.
  • Im Kästchen 9540 wird eine Entscheidung getroffen, welche die Differenz zwischen der ZMM-Rate in dem Datensatz mit der besten Übereinstimmung und der aktuellen ZMM-Rate vergleicht. Wenn die Differenz größer als ein Parameter Sigma ist, so wird die Steuerung an das Kästchen 9560 weitergegeben; anderenfalls wird die Steuerung an das Kästchen 9570 weitergegeben. Im Kästchen 9560 wird das aktuelle Konzept oder die aktuelle Schlüsselwortphrase eingegrenzt, indem vorherige Konzepte an das aktuelle Konzept angehängt werden, um zu versuchen, das Konzept weiter so zu präzisieren und einzugrenzen, dass es von existierenden Konzepten in der KGZ-Datenstruktur unterschieden wird. Zum Beispiel kann in einer Ausführungsform der vorliegenden Erfindung das Konzept oder Schlüsselwort "Schuldtitel" [Englisch: Bond] in dem KGZ-Datenstruktur-Datensatz, der finanzwirtschaftlichen Informationen entspricht, enthalten sein, d. h. das Konzeptfeld, das finanzwirtschaftlichen Informationen entspricht, kann ("Geld", "Aktie", "Schuldtitel" [bzw. "Bond"]) umfassen. Wenn die eingegebene Audio- oder audio-visuelle Arbeit die Phrase "Schauspieler James Bond" enthalten würde und der Hörer die Wiedergabe während dieser Phrase immer wieder so beschleunigt, dass sich die ZMM-Rate um mehr als Sigma von dem Wert in dem ZMM-Feld, das dem Konzeptfeld der finanzwirtschaftlichen Informationen entspricht, unterscheidet, so würde dem Konzept oder Schlüsselwort "Bond" das existierende Konzept oder Schlüsselwort, in diesem Fall "James", als Präfix vorangestellt werden. Dann würde die Datenbank erneut unter Verwendung dieses neuen Konzepts, "James Bond", durchsucht werden, wie durch den Übergang der Steuerung zu dem Kästchen 9500 angezeigt wird. Gemäß dieser Ausführungsform der vorliegenden Erfindung werden verschiedene Einträge für das Schlüsselwort "Bond" erzeugt. Ein Eintrag würde seiner Verwendung im Zusammenhang mit finanzwirtschaftlichen Berichten entsprechen, und ein anderer Eintrag würde seiner Verwendung bei einer Paarung mit dem Namen "James" entsprechen. Im Kästchen 9570 wird der neu erzeugte oder aktualisierte Datensatz in der Datenbank gespeichert.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung kann die KGZ-Datenstruktur ohne Verwendung der oben beschriebenen Ausführungsform 4000 erzeugt werden. Statt dessen kann die KGZ-Datenstruktur erzeugt werden, indem die Daten zum Beispiel unter Verwendung eines Textverarbeitungsprogramms in eine Struktur eingegeben werden oder indem ein Fragebogen über Konzepte, die von Interesse sind, ausgefüllt wird. Diese KGZ-Datenstruktur kann verwendet werden, um eine HIG-Arbeit aus einer Audio- oder audio-visuellen Arbeit zu erzeugen, ohne dass der Benutzer sie zuvor gehört haben muss. In einer ähnlichen Weise kann die KGZ-Datenstruktur unter Verwendung von Schlüsselwörtern und Phrasen des Typs erstellt werden, die in der Regel Internet-Suchmaschinen dargeboten werden und zum Steuern von Datenabrufen verwendet werden.
  • Eine KGZ-Datenstruktur kann ebenfalls zum Steuern der Wiedergaberate von Audio- oder audio-visuellen Arbeiten verwendet werden, die durch eine Suchmaschine abgerufen werden, um HIG-Arbeiten aus zuvor noch nicht gehörten Audio- oder audio-visuellen Arbeiten zu erzeugen, die durch die Suchmaschine abgerufen wurden. In einer solchen Ausführungsform wird die KGZ-Datenstruktur unter Verwendung von durch den Benutzer spezifizierten Suchkriterien, die in die Suchmaschine eingegeben wurden, erhalten. Zum Beispiel würde eine Benutzereingabe in eine Suchmaschine, die nach "allen Schiffen außer Jachten" fragt, HIG-Arbeiten erzeugen, die Informationen über Schiffe mit einer normalen Rate abspielen, aber Dinge über Jachten ausklammern oder sie schnell durchlaufen. Vor dem Hintergrund der detaillierten Beschreibung dürfte dem Durchschnittsfachmann klar sein, wie eine KGZ-Datenstruktur unter Verwendung von Informationen, die zum Beispiel von einer Suchmaschine übertragen werden, erstellt wird.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung kann die KGZ-Datenstruktur ZMM-Raten-Einträge zum Beispiel von "Unendlichkeit" für bestimmte Konzepte oder Schlüsselwörter enthalten. In dieser Ausführungsform der vorliegenden Erfindung weist eine ZMM-Rate von "Unendlichkeit" (oder ein sonstiger Hinweis, der ähnlich übersetzt wird) das Wiedergabesystem an, Abschnitte einer Audio- oder audio-visuellen Arbeit zu überspringen, deren Konzept eine entsprechende ZMM-Rate von Unendlichkeit hat. Gemäß dieser Ausführungsform können Benutzer "kein Interesse" an bestimmten Konzepten oder Schlüsselwörtern spezifizieren, wenn sie Audio- oder audio-visuelle Arbeiten anhören oder durchsuchen. Zum Beispiel kann ein Benutzer die folgende KGZ-Datenstruktur zur Verwendung beim Anhören einer nächtlichen Nachrichtensendung spezifizieren:
    (("Wetter", "teilweise bewölkt", "Wettervorhersage", "Temperaturen", "Taupunkt")
    ("Unendlichkeit")
    (("Aktie", "Schuldtitel", "Aktienmarkt", "Wall Street", "Währung") 0,8)
    (("Hollywood", "Schauspieler", "Spielfilm") 1,5)
  • Diese KGZ-Datenstruktur weist die Wiedergabe an: (a) Wettervorhersagen und Temperaturmeldungen während der Sendung zu überspringen; (b) finanzwirtschaftliche Informationen mit dem 0,8-fachen der normalen Wiedergabegeschwindigkeit wiederzugeben; und (c) Informationen bezüglich Hollywood-Spielfilmen und Schauspielern schnell zu durchlaufen, indem die ZMM-Rate auf das 1,5-fache der normalen Wiedergaberate angehoben wird.
  • Es ist zu beachten, dass Ausführungsformen der vorliegenden Erfindung nicht auf statische KGZ-Datenstrukturen beschränkt sind, insofern, als – wie weiter unten noch beschrieben wird – ein Benutzer Eingaben während der Wiedergabe vornehmen kann, um die ZMM-Raten zu präzisieren. Wenn zum Beispiel die KGZ-Datenstruktur folgende Einträge enthalten würde:
    (("Aktie", "Schuldtitel" [bzw. "bond"], "Aktienmarkt", "Wall Street", "Währung") 0,8)
    (("Hollywood", "Schauspieler", "Spielfilm") 1,5)
    und der Benutzer immer wieder eingreifen würde, um die Wiedergaberate zu beschleunigen, wenn die Phrase "Schauspieler, James Bond" in der Eingabe erscheint, wie oben erläutert wurde, so kann die Ausführungsform 4000 der vorliegenden Erfindung Änderungen oder Präzisierungen an der KGZ-Datenstruktur vornehmen, indem ein neuer Eintrag hinzugefügt wird, so dass die modifizierte Datenstruktur so aussehen würde:
    (("Aktie", "Schuldtitel" [bzw. "bond"], "Aktienmarkt", "Wall Street", "Währung") 0,8)
    (("Hollywood", "Schauspieler", "Spielfilm") 1,5)
    ("Schauspieler James Bond") 2,0)
  • Auf diese Weise kann die KGZ-Datenstruktur kontinuierlich präzisiert werden, um das Benutzerinteresse widerzuspiegeln, während er sich neues Material und neue Konzepte unter Verwendung einer existierenden KGZ-Datenstruktur anhört.
  • Es ist klar, dass die Verwendung einer KGZ-Datenstruktur nicht auf ZMM-Raten beschränkt ist. Wie oben beschrieben wurde, kann praktisch die erste Ableitung der ZMM-Rate ebenso verwendet werden, um das gleiche Ergebnis hervorzubringen. Wenn zum Beispiel ein Benutzer immer wieder die Geschwindigkeit verlangsamt, wenn er das Wort "Gratisprobe" hört, so wäre eine KGZ-Datenstruktur, welche die Änderungen der ZMM-Rate anstelle der ZMM-Raten selbst speichert, gleichermaßen zum Steuern der Wiedergabegeschwindigkeit während zuvor noch nicht gehörtem Material brauchbar.
  • Obgleich 8 die Ausführungsform 4000 so zeigt, dass sie aus separaten Modulen besteht, sind die BSS 4100, die BEP/WS 4200, das ZMM-Teilsystem 4300, der ZMM-Konzeptmonitor 4400, der Konzeptdeterminierer 4700, der Konzeptinformationsdeco der 4800 und der KGZDS-Generator 4500 in einer bevorzugten Ausführungsform als Software-Programme oder -Module verkörpert, die auf einem Allzweckcomputer wie zum Beispiel einem Personalcomputer arbeiten. Des Weiteren ist die digitale Speichervorrichtung 4075 als ein Plattenlaufwerk oder ein Direktzugriffsspeicher verkörpert, und der Digital-Analog-Wandler 4600 ist als eintypisches Zubehör eines Allzweck-Computers, wie zum Beispiel eine Soundkarte eines Personalcomputers, verkörpert. Vor dem Hintergrund des oben im einzelnen Dargelegten dürfte dem Durchschnittsfachmann klar sein, wie diese Programme oder Module als Software zu implementieren sind.
  • Die in 8 gezeigte Ausführungsform 4000 kann so modifiziert werden, dass eine zuvor erzeugte Geschwindigkeitskontur für eine bestimmte Audio- oder audio-visuelle Arbeit in eine KGZ-Datenstruktur für diese Arbeit konvertiert wird. Bei dieser Modifikation werden ZMM-Raten aus der Geschwindigkeitskontur erhalten (um Benutzer-ZMM-Raten-Werte zu ersetzen, die von der BEP/WS 4200 ausgegeben wurden) und als Eingang in den ZMM-Konzeptmonitor 4400 eingespeist. Vor dem Hintergrund der hier gegebenen detaillierten Beschreibung dürfte dem Durchschnittsfachmann klar sein, wie die Geschwindigkeitskontur einzugeben ist und die ZMM-Raten zu erhalten sind. Gleichermaßen kann die in 1 gezeigte Ausführungsform 1000 so modifiziert werden, dass eine zuvor erzeugte KGZ-Datenstruktur für eine bestimmte Audio- oder audio-visuelle Arbeit in eine Geschwindigkeitskontur für diese Arbeit umgewandelt wird. Bei dieser Modifikation werden ZMM-Raten aus der KGZ-Datenstruktur erhalten (um eine Benutzer-ZMM-Raten-Ausgabe von der BEP/WS 200 zu ersetzen) und als Eingang in den ZMM-Monitor 400 eingespeist. Die ZMM-Raten werden aus der KGZ-Datenstruktur gemäß Ausführungsform 6000 erhalten (die weiter unten noch näher beschrieben wird), d. h. die ZMM-Raten werden von der ZMM-Konzeptnachschlagevorrichtung 6500 von Ausführungsform 6000 ausgegeben.
  • Um das Verstehen zu erleichtern, beziehen sich die im vorliegenden Text beschriebenen Ausführungsformen auf ZMM-Raten. Jedoch ist die vorliegende Erfindung nicht darauf beschränkt. Es versteht sich, dass Ausführungsformen der vorliegenden Erfindung alles verwenden können, woraus sich die ZMM-Rate bestimmen lässt, um Ausführungsformen der vorliegenden Erfindung herzustellen oder auszuführen, was im vorliegenden Text als Affinitätsinformationen bezeichnet wird. Zum Beispiel könnte ein Hinweis auf das Benutzerinteresse oder auf eine Benutzerinformationen-Abrufhäufigkeit anstelle der ZMM-Rate verwendet werden. Dann wird, um eine Wiedergabe auszuführen, eine Umwandlung zwischen dem Benutzerinteresse oder der Benutzerinformationen-Abrufhäufigkeit und der ZMM-Rate vorgenommen. In einer solchen Ausführungsform würde eine Umwandlungsfunktion verwendet werden, um das Benutzerinteresse oder die Benutzerinformationen-Abrufhäufigkeit auf ZMM-Raten abzubilden. In einigen solchen Ausführungsformen kann zum Beispiel die Umwandlungsfunktion modifiziert werden, ohne die Geschwindigkeitskontur oder die KGZ-Datenstruktur zu ändern.
  • Um das Verstehen zu erleichtern, beziehen sich die im vorliegenden Text beschriebenen Ausführungsformen auf eine Geschwindigkeitskontur, die eine Entsprechung zwischen der ZMM-Rate und einer zugehörigen zeitlichen Position vornimmt, und eine KGZ-Datenstruktur, die eine Entsprechung zwischen der ZMM-Rate und einem zugehörigen Konzept vornimmt. Jedoch ist die vorliegende Erfindung nicht darauf beschränkt. Es versteht sich, dass Ausführungsformen der vorliegenden Erfindung sich auf eine Geschwindigkeitskontur oder eine KGZ-Datenstruktur beziehen, die eine Entsprechung zwischen allem, woraus sich eine ZMM-Rate bestimmen lässt, und zwischen allem, anhand dessen ein oder mehrere Abschnitte einer Arbeit, mit der die ZMM-Rate verknüpft ist, identifiziert werden können, vornimmt.
  • Des Weiteren versteht es sich, dass Ausführungsformen der vorliegenden Erfindung sich auf eine Geschwindigkeitskontur oder eine KGZ-Datenstruktur beziehen, bei der der Identifikator der ZMM-Rate und der Identifikator des Abschnitts eine funktionale Abhängigkeit für das Bestimmen der ZMM-Rate, die für einen bestimmten Abschnittsidentifikator zu verwendet ist, haben können. Zum Beispiel könnte in Ausführungsformen, bei denen Konzepte verwendet werden, um einen Abschnitt einer Arbeit zu identifizieren, die ZMM-Rate, die mit einem bestimmten Konzept verknüpft ist, als eine Funktion der Anzahl von Malen berechnet werden, die ein Konzept in einer Arbeit aufgetaucht ist, so dass die erste Wiedergabe des Konzepts mit einer langsameren ZMM-Rate erfolgt und jede spätere Wiederkehr desselben Konzepts mit erhöhten ZMM-Raten für eine schnellere Wiedergabe dargeboten wird.
  • Anwendung von Geschwindigkeitskonturen und konzeptuellen Geschwindigkeitszuordnungsdatenstrukturen zum Erzeugen einer gemäß einem Hörerinteresse gefilterten Arbeit
  • Gemäß Ausführungsformen eines vierten Aspekts der vorliegenden Erfindung wird eine Geschwindigkeitskontur in Verbindung mit einer Audio- oder audio-visuellen Arbeit benutzt, um eine HIG-Arbeit zu erzeugen, wobei Segmente der Audio- oder audio-visuellen Arbeit gemäß ZMM-Raten oder Wiedergaberaten wiedergegeben werden, die durch die Geschwindigkeitskontur spezifiziert werden. Außerdem speichern einige dieser Ausführungsformen auch die HIG-Arbeit für eine spätere Wiedergabe durch dieselbe Ausführungsform oder durch andere Wiedergabevorrichtungen.
  • Wie dem Durchschnittsfachmann sofort klar ist, können Ausführungsformen der vorliegenden Erfindung, die eine HIG-Arbeit für den Audio-Teil einer audio-visuellen Arbeit erzeugen, auch visuelle Informationen beschleunigen oder verlangsamen, um eine Anpassung an das Audio in den audio-visuellen Arbeiten vorzunehmen. Dafür wird in einer bevorzugten Ausführungsform das Audio unter Verwendung von ZMM-Verfahren, die oben beschrieben wurden, verarbeitet, und das Videosignal wird gemäß einem der vielen dem Durchschnittsfachmann bekannten Verfahren "Frame-unterabgetastet" oder "Frame-repliziert", um die gewünschte ZMM-Rate zu erhalten und um die Synchronität zwischen den Audio- und den visuellen Abschnitten der audio-visuellen Arbeit beizubehalten. Wenn man also das Audio beschleunigt und Abtastungen mit einer schnelleren Rate angefordert werden, so wird der Frame-Strom unterabgetastet, d. h. Frames werden übersprungen.
  • 10 zeigt ein Blockschaubild der Ausführungsform 5000 des vierten Aspekts der vorliegenden Erfindung, die eine Geschwindigkeitskontur in Verbindung mit einer Audio- oder audio-visuellen Arbeit benutzt, um eine HIG-Arbeit zu erzeugen. Wie in 10 gezeigt, umfasst die Ausführungsform 5000 eine Benutzerschnittstelle 5100 ("BSS 5100"), die Eingaben von einem Benutzer empfängt. Eine Ausführungsform der BSS 5100 ist die gleiche wie die BSS 100, die oben mit Bezug auf 1 beschrieben wurde. Die BSS 5100 gibt Ausgangssignale aus, die Eingaben vom Benutzer anzeigen. Die Benutzereingabe wird durch den Benutzereingabeprozessor 5200/die Wiedergabesteuerung 5200 ("BEP/WS 5200") interpretiert, um die folgenden Optionen anzuzeigen, die durch die Benutzer ausgewählt wurden: (a) Auswählen einer wiederzugebenden Datei, wobei diese Datei einer bestimmten Audio- oder audio-visuellen Arbeit entspricht (die ausgewählte Datei kann in die Ausführungsform 5000 direkt eingegeben werden, oder sie kann eine Datei sein, die durch die Ausführungsform 5000 gespeichert wurde); (b) Auswählen einer Geschwindigkeitskontur zum Steuern der ZMM-Rate oder Wiedergaberate; (c) Initiieren der Wiedergabe der ausgewählten Datei; (d) Anhalten der Wiedergabe der ausgewählten Datei; (e) Pausieren der Wiedergabe der ausgewählten Datei; (f) Modifizieren oder Außerkraftsetzen der ZMM-Rate oder Wiedergaberate, die aus der Geschwindigkeitskontur für einen Abschnitt der wiedergegebenen Audio- oder audio-visuellen Arbeit erhalten wurde; oder (g) Spezifizieren der Parameter Offset und Override, die durch die Vorrichtung in einer Weise verwendet werden, die weiter unten noch eingehender erläutert wird.
  • Wie in 10 gezeigt, empfängt die BEP/WS 5200 die Benutzereingabe von der BSS 5100 und (a) wandelt die Benutzereingabe in numerische Werte um; (b) interpretiert die Benutzereingabe zum Einstellen der Werte von Parametern und zum Steuern der Verwendung, Modifizierung oder Außerkraftsetzung der Geschwindigkeitskontur; (c) lenkt den Zugriff auf einen Datenstrom und das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit durch Senden von Stromdatenanforderungen an die digitale Speichervorrichtung 5075 (zur Durchführung einer Wiedergabesteuerung); und (d) lenkt den Zugriff auf einen Datenstrom und das Laden eines Datenstroms von einer Geschwindigkeitskontur durch Senden von Stromdatenanforderungen an die digitale Speichervorrichtung 5075. Im Fall der digitalen Speichervorrichtung 5075 kann die BEP/WS 5200 einen Zugriff auf eine Datei aus digitalen Daten anfordern, die eine Audio- oder audio-visuelle Arbeit darstellen, die in einem Dateisystem in der Vorrichtung gespeichert ist. Um den Zugriff auf einen Datenstrom von einer Audio- oder audio-visuellen Arbeit oder das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit zu lenken, interpretiert die BEP/WS 5200 die Benutzereingabe und die Position digitaler Abtastungen, welche die Audio- oder audio-visuelle Arbeit darstellen, die in der digitalen Speichervorrichtung 5075 gespeichert ist, um Wiedergabepositionen für die ausgewählte Datei bei einer bestimmten Abtastung zu berechnen. In einer bevorzugten Ausführungsform werden die Datenanforderungen für eine Audio- oder audio-visuelle Arbeit und die Datenanforderungen für die Geschwindigkeitskontur so ausgegeben, dass Daten von den gleichen zeitlichen Positionen eines jeden als Ausgang von der digitalen Speichervorrichtung 5075 ausgegeben werden.
  • Die digitale Speichervorrichtung 5075 empfängt Folgendes als Eingang: (a) Stromdatenanforderungen von der BEP/WS 5200; und optional (b) einen zeitmaßstabsmodifizierten Ausgang von dem ZMM-Teilsystem 5300. Die digitale Speichervorrichtung 5075 erzeugt Folgendes als Ausgang: (a) einen Datenstrom, der eine Audio- oder audio-visuelle Arbeit darstellt; (b) einen Strom aus Positionsinformationen, zum Beispiel die Position in einer Datei, des ausgegebenen Datenstroms; und (c) einen Datenstrom, der die Geschwindigkeitskontur darstellt. Es gibt viele dem Durchschnittsfachmann vertraute Verfahren zum Verwenden digitaler Speichervorrichtungen, zum Beispiel einer "Festplatte", um Allzweckdaten zu speichern und abzurufen.
  • Die Audio- oder audio-visuelle Arbeit wird in der Regel in digitaler Form in der digitalen Speichervorrichtung 5075 gespeichert. Eine Ausführungsform der digitalen Speichervorrichtung 5075 ist die gleiche wie die digitale Speichervorrichtung 75, die oben mit Bezug auf 1 beschrieben wurde. Die BEP/WS 5200 greift auf die digitale Speichervorrichtung 5075 gemäß dem Durchschnittsfachmann vertrauten Verfahren zu, um einen Strom aus digitalen Abtastungen bereitzustellen, welche die Audio- und/oder audio-visuelle Arbeit darstellen. In alternativen Ausführungsformen wird die Audio- oder audio-visuelle Arbeit in analoger Form in einer analogen Speichervorrichtung gespeichert. In einer solchen alternativen Ausführungsform wird ein Strom aus analogen Signalen in eine (nicht gezeigte) Vorrichtung eingespeist, um die analogen Abtastungen in digitale Abtastungen umzuwandeln. Es gibt viele dem Durchschnittsfachmann vertraute handelsübliche Vorrichtungen zum Empfangen eines eingegebenen analogen Signals, wie zum Beispiel eines Sprachsignals, und zum Abtasten des analogen Signals mit einer Rate, die mindestens die Nyquist-Rate ist, um einen Strom digitaler Signale bereitzustellen, die ohne Qualitätsverlust in ein analoges Signal zurückkonvertiert werden können. Die digitalen Abtastungen werden dann an das ZMM-Teilsystem 5300 übertragen.
  • Der ZMM-Raten-Determinierer 5400 empfängt als Eingang: (a) eine Geschwindigkeitskontur, die durch den Benutzer ausgewählt wurde und die als Eingang von der digitalen Speichervorrichtung 5075 eingespeist wird; (b) eine ZMM-Rate, die durch den Benutzer spezifiziert wurde und die als Eingang von der BEP/WS 5200 eingespeist wird; (c) Offset, eine Versatz-ZMM-Rate, die durch den Benutzer spezifiziert wurde und die als Eingang von der BEP/WS 5200 eingespeist wird; (d) Override, ein Boolescher Parameter, der durch den Benutzer spezifiziert wurde und der als Eingang von der BEP/WS 5200 eingespeist wird; und (e) aktuelle Strompositionsinformationen von der digitalen Speichervorrichtung 5075, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Strom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert des Anfangs der Gruppe von Abtastungen, die von der digitalen Speichervorrichtung 5075 übertragen werden. In Reaktion darauf erzeugt der ZMM-Raten-Determinierer 5400 als Ausgang eine ZMM-Rate, die durch das ZMM-Teilsystem 5300 empfangen wird.
  • Der ZMM-Raten-Determinierer 5400 verwendet die Strompositionsinformationen zum Auswählen der am besten entsprechenden zeitlichen Position in der Geschwindigkeitskontur, um die zugehörige ZMM-Rate zu bestimmen, die in der Geschwindigkeitskontur spezifiziert ist. Diese Vorgehensweise ermöglicht es, Geschwindigkeitskonturen, die mit verschiedenen Intervall_Size-Werten oder ZMM-Abtastfrequenzen erzeugt wurden, für jegliche Audio- oder audio-visuellen Arbeit zu verwenden, und gewährleistet eine zeitliche Eins-zu-eins- Entsprechung zwischen Datenstromposition und ZMM-Raten, die aus der Geschwindigkeitskontur erhalten wurden.
  • Der ZMM-Raten-Determinierer 5400 bestimmt die ausgegebene ZMM-Rate oder Wiedergaberate unter Verwendung einer der folgenden Betriebsarten:
    • 1. Geschwindigkeitskonturgesteuerte Wiedergabe: In diesem Modus besteht der Ausgang des ZMM-Raten-Determinierers 5400 aus ZMM-Raten, die aus der Geschwindigkeitskontur für die entsprechenden Abschnitte der eingegebenen wiederzugebenden Audio- oder audio-visuellen Arbeit erhalten wurden. Dieser Modus gibt ZMM-Raten aus, die identisch mit jenen sind, die durch die Geschwindigkeitskontur spezifiziert wurden.
    • 2. Geschwindigkeitskonturversetzte Wiedergabe: In diesem Modus spezifiziert der Benutzer über die BSS 5100 den Offset, einen Versatz-Parameter, der zum Justieren der ZMM-Raten verwendet wird, die durch die Geschwindigkeitskontur spezifiziert wurden. In diesem Modus ist der ZMM-Raten-Ausgang durch die folgende Formel gegeben: TSM_rate = ZMM-Rate von der Geschwindigkeitskontur × (1 + Offset)Wenn zum Beispiel ein Benutzer einen Versatzfaktor von –0,4 spezifiziert, so addiert der ZMM-Raten-Determinierer 5400 den Versatzwert –0,4 zu der Zahl 1,0 (was zu dem Wert 0,6 führt) und skaliert jede der in der Geschwindigkeitskontur spezifizierten ZMM-Raten so, dass eine gleichförmige Abnahme (Verlangsamung) der ZMM-Rate oder Wiedergaberate für das erzeugte Ausgangssignal erreicht wird. Gleichermaßen würde ein positiver Versatz die ZMM-Rate oder Wiedergaberate für das erzeugte Ausgangssignal erhöhen (beschleunigen). Es ist zu beachten, dass ein Versatzwert von null keine Auswirkung auf die ZMM-Rate hat. Es ist klar, dass verschiedene Versatzstrategien verwenden werden können, um eine nicht-lineare und lineare Skalierung der ZMM-Raten zu erreichen.
    • 3. Außerkraftsetzen der Geschwindigkeitskontur durch den Benutzer: In diesem Modus kann der Benutzer die Geschwindigkeitskontur außer Kraft setzen und manuell die ZMM-Rate oder Wiedergaberate über Abschnitte der Audio- oder audio-visuellen Arbeit hinweg steuern. Wenn die Außerkraftsetzung durch den Benutzer ausgelöst wird, so wird die ZMM-Rate, die zum Bestimmen der ZMM-Rate oder Wiedergaberate des Ausgangssignals verwendete wird, von der entsprechenden Position in der Geschwindigkeitskontur genommen.
  • Wie in 10 gezeigt, empfängt das ZMM-Teilsystem 5300 als Eingang: (a) einen Strom aus Abtastungen, der Abschnitte der Audio- oder audio-visuellen Arbeit darstellt, von der digitalen Speichervorrichtung 5075; (b) Strompositionsinformationen von der digitalen Speichervorrichtung 5075, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Datenstrom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert; und (c) die ZMM-Rate von dem ZMM-Raten-Determinierer 5400. Wie oben beschrieben, kann der Eingang ein analoger Eingang sein, der gemäß dem Durchschnittsfachmann vertrauten Verfahren und Vorrichtungen in eine Reihe digitaler Abtastungen umgewandelt wird. Der Ausgang des ZMM-Teilsystems 5300 wird als Eingang eingespeist in: (a) die Digital-Analog-Wandler/Audio- und/oder audio- visuelle Wiedergabevorrichtung 5600 ("DA/AWV 5600") und optional in (b) den digitalen Speicher 5075 zum Speichern der Wiedergabe mit der ZMM-Rate, sofern gewünscht. Die DA/AWV 600 ist eine auf diesem technischen Gebiet bestens bekannte Vorrichtung zum Empfangen digitaler Abtastungen und Ausführen einer Wiedergabe einer Audio- oder audio-visuellen Arbeit. Der Ausgang aus der ZMM-Vorrichtung 4300 ist ein Strom digitaler Abtastungen, die einen digitalisierten Audio- oder audio-visuellen Strom bilden, der eine zeitmaßstabsmodifizierte Version der eingegebenen Audio- oder audio-visuellen Arbeit ist und gemäß der vorliegenden Erfindung die ZMM-Raten oder Wiedergaberaten widerspiegelt, die durch die Geschwindigkeitskontur und/oder durch Benutzereingaben spezifiziert wurden. Dieser Ausgang stellt die HIG-Arbeit dar.
  • In einigen Ausführungsformen wird die HIG-Arbeit für eine spätere Wiedergabe durch die gleiche Ausführungsform oder durch andere Wiedergabevorrichtungen gespeichert. Außerdem kann der digitale Ausgang in eine analoge Form zum Speichern in analogen Vorrichtungen umgewandelt werden. Es gibt viele dem Durchschnittsfachmann vertraute Vorrichtungen zum Empfangen eines digitalisierten Eingangssignals, wie zum Beispiel einer 16-Bit-Impulscode-Modulation, und zum Ausgeben eines analogen Signalausgangs daraus. Zum Beispiel ist es dem Durchschnittsfachmann vertraut, dass es handelsübliche Vorrichtungen zum Empfangen eines Stroms aus digitalisierten Abtastungen, der ein Signal darstellt, und zum Umwandeln dieser Abtastungen in ein analoges Signal ohne Qualitätsverlust gibt. Ausführungsformen des ZMM-Teilsystems 5300 und der DA/AWV 5600 sind die gleichen wie das ZMM-Teilsystem 300 und die DA/AWV 600, die oben mit Berg auf 1 beschrieben wurden. Wie dem Durchschnittsfachmann sofort klar ist, beschleunigt oder verlangsamt das ZMM-Teilsystem 5300 jedes Mal, wenn die Ausführungsform 5000 eine Wiedergabe einer audio-visuellen Arbeit ausführt, visuelle Informationen so, dass sie an das Audio in der audio-visuellen Arbeit angepasst werden. Dafür wird in einer bevorzugten Ausführungsform das Videosignal gemäß einem der vielen dem Durchschnittsfachmann bekannten Verfahren "Frame-unterabgetastet" oder "Frame-repliziert", um die Synchronität zwischen den Audio- und den visuellen Abschnitten der audio-visuellen Arbeit zu wahren. Wenn man also das Audio beschleunigt und Abtastungen mit einer schnelleren Rate angefordert werden, so wird der Frame-Strom unterabgetastet, d. h. Frames werden übersprungen.
  • Obgleich 10 die Ausführungsform 5000 so zeigt, dass sie aus separaten Modulen besteht, sind die BSS 5100, die BEP/WS 5200, das ZMM-Teilsystem 5300 und der ZMM-Raten-Determinierer 5400 in einer bevorzugten Ausführungsform als Software-Programme oder -Module verkörpert, die auf einem Allzweck-Computer wie zum Beispiel einem Personalcomputer arbeiten. Des Weiteren ist die digitale Speichervorrichtung 5075 als ein Plattenlaufwerk oder ein Direktzugriffsspeicher verkörpert, und der Digital-Analog-Wandler 5600 ist als ein typisches Zubehör eines Allzweck-Computers, wie zum Beispiel eine Soundkarte eines Personalcomputers, verkörpert. Vor dem Hintergrund des oben im einzelnen Dargelegten dürfte dem Durchschnittsfachmann klar sein, wie diese Programme oder Module als Software zu implementieren sind.
  • Es ist klar, dass bei Nichtvorliegen von Benutzereingaben der Zeitmaßstab einer HIG-Arbeit vollständig durch die Geschwindigkeitskontur bestimmt wird. Des Weiteren wird auch die Datenabrufrate des Eingangssignals durch die Geschwindigkeitskontur bestimmt: Höhere Raten werden zum Beschleunigen benötigt, langsamere Raten zum Verlangsamen. Da die Geschwindigkeitskontur eine zeitliche Entsprechung mit dem Eingangssignal aufweist, ist die Datenabrufrate oder Leserate für die Geschwindigkeitskontur identisch mit der des Eingangssignals. In vielen Ausführungsformen ist es wünschenswert, die Anzahl von Vorrichtungen mit variablen Leseraten zu verringern. Gemäß der vorliegenden Erfindung können variable Leseraten in der folgenden Weise eliminiert werden.
  • Die in der Geschwindigkeitskontur enthaltenen Daten werden mit der Rate gelesen, die durch die vorherigen Werte der Geschwindigkeitskontur spezifiziert wurde. Durch Ausführen einer Zeitmaßstabsmodifikation der eingegebenen Geschwindigkeitskontur unter Verwendung der Geschwindigkeitskontur selbst wird eine neue Geschwindigkeitskontur erhalten. Diese zeitmaßstabsmodifizierte Geschwindigkeitskontur teilt sich eine zeitliche Entsprechung mit dem Ausgangssignal, das durch Anwenden der ursprünglichen Geschwindigkeitskontur auf das Eingangssignal erzeugt wurde. Weil der Ausgang unabhängig von der ausgeführten Zeitmaßstabsmodifikation mit einer festen Rate erzeugt wird, wird auf die Werte der zeitmaßstabsmodifizierten Geschwindigkeitskontur mit einer festen Rate zugegriffen.
  • Gemäß Ausführungsformen eines fünften Aspekts der vorliegenden Erfindung wird eine KGZ-Datenstruktur in Verbindung mit einer Audio- oder audio-visuellen Arbeit verwendet, um eine HIG-Arbeit zu erzeugen, wobei Abschnitte der Audio- oder audio-visuellen Arbeit gemäß ZMM-Raten oder Wiedergaberaten wiedergegeben werden, die durch die KGZ-Datenstruktur spezifiziert wurden. Außerdem speichern einige solcher Ausführungsformen auch die HIG-Arbeit für eine spätere Wiedergabe durch die gleiche Ausführungsform oder durch andere Wiedergabevorrichtungen.
  • 11 zeigt ein Blockschaubild der Ausführungsform 6000 des fünften Aspekts der vorliegenden Erfindung, die eine KGZ-Datenstruktur in Verbindung mit einer Audio- oder audio-visuellen Arbeit verwendet, um eine HIG-Arbeit zu erzeugen. Wie in 11 gezeigt, umfasst die Ausführungsform 6000 eine Benutzerschnittstelle 6100 ("BSS 6100"), die Eingaben von einem Benutzer empfängt. Eine Ausführungsform der BSS 6100 ist die gleiche wie die BSS 100, die oben mit Bezug auf 1 beschrieben wurden. Die BSS 6100 gibt Ausgangssignale aus, die eine Eingabe von dem Benutzer anzeigen. Die Benutzereingabe wird durch den Benutzereingabeprozessor 6200/die Wiedergabesteuerung ("BEP/WS 6200") interpretiert, um die folgenden Optionen anzuzeigen, die durch den Benutzer ausgewählt wurden: (a) Auswählen einer wiederzugebenden Datei, wobei diese Datei einer bestimmten Audio- oder audio-visuellen Arbeit entspricht (die ausgewählte Datei kann in die Ausführungsform 6000 direkt eingegeben werden, oder sie kann eine Datei sein, die durch die Ausführungsform 6000 gespeichert wurde); (b) Auswählen einer KGZ-Datenstruktur zum Steuern der ZMM-Rate oder Wiedergaberate; (c) Initiieren der Wiedergabe der ausgewählten Datei; (d) Anhalten der Wiedergabe der ausgewählten Datei; (e) Pausieren der Wiedergabe der ausgewählten Datei; (f) Modifizieren oder Außerkraftsetzen der ZMM-Rate oder Wiedergaberate, die aus der KGZ-Datenstruktur für einen Abschnitt der wiedergegebenen Audio- oder audio-visuellen Arbeit erhalten wurde; oder (g) Spezifizieren der Parameter Theta, Offset, Slew-Limit und Override, die durch die Vorrichtung in einer Weise verwendet werden, die weiter unten noch eingehender erläutert wird. Außerdem kann eine Ausführungsform auch eine Audio- oder audio-visuelle Arbeit empfangen, die direkt zum Beispiel von einem Fernsehgerät eingegeben wird. In diesem Fall wird der Audio-Abschnitt in der Weise, die oben für einen analogen Eingang beschrieben wurde, in ein digitales Format umgewandelt, und die Untertitel-Informationen, sofern vorhanden, können ebenfalls gemäß einem der vielen dem Durchschnittsfachmann vertrauten Verfahren in ein geeignetes digitales Format umgewandelt werden.
  • Wie in 11 gezeigt, empfängt die BEP/WS 6200 Eingaben von der BSS 6100 und (a) wandelt die Benutzereingabe in numerische Werte um; (b) interpretiert die Benutzereingabe zum Einstellen der Werte von Parametern und zum Steuern der Verwendung, Modifizierung oder Außerkraftsetzung der ZMM-Raten von die KGZ-Datenstruktur; und (c) lenkt den Zugriff auf einen Datenstrom und das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit durch Senden von Stromdatenanforderungen an die digitale Speichervorrichtung 5075 (zur Durchführung einer Wiedergabesteuerung). Im Fall der digitalen Speichervorrichtung 6075 kann die BEP/WS 6200 den Zugriff auf eine Datei aus digitalen Daten anfordern, die eine Audio- oder audio-visuelle Arbeit darstellen, die in einem Dateisystem in der Vorrichtung gespeichert ist. Um den Zugriff auf einen Datenstrom von einer Audio- oder audio-visuellen Arbeit oder das Laden eines Datenstroms von einer Audio- oder audio-visuellen Arbeit zu lenken, interpretiert die BEP/WS 6200 die Benutzereingabe und die Position digitaler Abtastungen, welche die Audio- oder audio-visuelle Arbeit darstellen, die in der digitalen Speichervorrichtung 6075 gespeichert ist, um Wiedergabepositionen für die ausgewählte Datei bei einer bestimmten Abtastung zu berechnen.
  • Die digitale Speichervorrichtung 6075 empfängt Folgendes als Eingang: (a) Stromdatenanforderungen von der BEP/WS 5200; und optional (b) einen zeitmaßstabsmodifizierten Ausgang von dem ZMM-Teilsystem 5300. Die digitale Speichervorrichtung 5075 erzeugt Folgendes als Ausgang: (a) einen Datenstrom, der eine Audio- oder audio-visuelle Arbeit darstellt; (b) einen Strom aus Positionsinformationen, zum Beispiel die Position in einer Datei, des ausgegebenen Datenstroms; und (c) einen Datenstrom, der die KGZ-Datenstruktur darstellt. Es gibt viele dem Durchschnittsfachmann vertraute Verfahren zum Verwenden digitaler Speichervorrichtungen, zum Beispiel einer "Festplatte", um Allzweckdaten zu speichern und abzurufen.
  • Die Audio- oder audio-visuelle Arbeit wird in der Regel in digitaler Form in der digitalen Speichervorrichtung 6075 gespeichert. Eine Ausführungsform der digitalen Speichervorrichtung 6075 ist die gleiche wie die digitale Speichervorrichtung 75, die oben mit Bezug auf 1 beschrieben wurden. Die BEP/WS 6200 greift auf die digitale Speichervorrichtung 6075 gemäß dem Durchschnittsfachmann vertrauten Verfahren zu, um einen Strom aus digitalen Abtastungen bereitzustellen, welche die Audio- und/oder audio-visuelle Arbeit darstellen. In alternativen Ausführungsformen wird die Audio- oder audio-visuelle Arbeit in analoger Form in einer analogen Speichervorrichtung gespeichert. In einer solchen alternativen Ausführungsform wird ein Strom aus analogen Signalen in eine (nicht gezeigte) Vorrichtung eingespeist, um die analogen Abtastungen in digitale Abtastungen umzuwandeln. Es gibt viele dem Durchschnittsfachmann vertraute handelsübliche Vorrichtungen zum Empfangen eines eingegebenen analogen Signals, wie zum Beispiel eines Sprachsignals, und zum Abtasten des analogen Signals mit einer Rate, die mindestens die Nyquist-Rate ist, um einen Strom digitaler Signale bereitzustellen, die ohne Qualitätsverlust in ein analoges Signal zurückkonvertiert werden können. Die digitalen Abtastungen werden dann an das ZMM-Teilsystem 6300 übertragen.
  • Der Konzeptdeterminierer 6700 nimmt in Abhängigkeit von bestimmten Optionen als Eingang verschiedene Datensätze entgegen. Gemäß Option 1 bilden die Eingangsdaten einen Datenstrom, der Text oder Konzepte, zum Beispiel Untertitel-Daten oder Textanmerkungen, darstellt und der mit dem aktuellen Segment der eingegebenen Audio- oder audio-visuellen Arbeit, das in das ZMM-Teilsystem 6300 eingespeist wird, gespeichert wird. Für den Fall von Option 1 leitet der Konzeptdeterminierer 6700 den ankommenden Datenstrom, der Text oder Konzepte darstellt, als Ausgang an den Konzeptdecoder 6800 weiter. Gemäß Option 2 umfassen die Eingangsdaten: (a) einen Strom aus Abtastungen, der Abschnitte der Audio- oder audio-visuellen Arbeit darstellt, von der digitalen Speichervorrichtung 6075 und (b) aktuelle Strompositionsinformationen von der digitalen Speichervorrichtung 6075, die dafür verwendet werden, die Position der gesendeten Abtastungen in dem Strom zu ermitteln, zum Beispiel einen Abtastzähl- oder Zeitwert des Anfangs der Gruppe von Abtastungen, die von der digitalen Speichervorrichtung 6075 übertragen werden. Für den Fall von Option 2 gibt der Konzeptdeterminierer 6700 als Ausgang einen Datenstrom aus, der Konzepte darstellt, die in dem aktuellen Abschnitt der Audio- oder audio-visuellen Arbeit enthalten sind, der an das ZMM-Teilsystem 6300 übermittelt wird. Die Konzepte und/oder Textmitschriften gesprochener Passagen werden durch Extrahieren von Untertitel-Informationen aus der Audio- oder audio-visuelle Arbeit oder mit Hilfe von Spracherkennungsalgorithmen bestimmt, um einen Text-Strom aus der eingegebenen Audio- oder audio-visuellen Arbeit zu erhalten. Der Durchschnittsfachmann kennt viele Verfahren zum Extrahieren von Untertitel-Informationen, und der Durchschnittsfachmann kennt viele Verfahren zum Extrahieren von Text mit Hilfe der Spracherkennungsalgorithmen.
  • Der Konzeptinformationsdecoder 6800 nimmt als Eingang von dem Konzeptdeterminierer 6700 einen Datenstrom entgegen, der konzeptuelle Informationen darstellt. Gemäß der vorliegenden Erfindung, und ohne darauf beschränkt zu sein, umfassen die konzeptuellen Informationen: Mitschriften, Rohtext, Schlüsselwörter, Phrasen oder sonstige Darstellungen von konzeptuellen Informationen, die dem Durchschnittsfachmann vertraut sind. In Reaktion darauf erzeugt der Konzeptinformationsdecoder 6800 als Ausgang einen Datenstrom, der Schlüsselwörter und Konzepte für den aktuellen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit, der an das ZMM-Teilsystem 6300 gesendet wird, darstellt.
  • Der Konzeptinformationsdecoder 6800 verarbeitet den Eingang, um Konzeptdatendarstellungen des Eingangsdatenstroms zu bilden. Zum Beispiel kann der Konzeptinformationsdecoder 6800 einfach Artikel und Adjektive aus einer Eingabe, die eine Transkription ist, entfernen, um einen Ausgang zu erzeugen, der nur aus Substantiven und Substantiv-Phrasen besteht. Alternativ kann der Konzeptinformationsdecoder 6800 eine natürliche Sprachverarbeitung verwenden, um konzeptuellen Inhalt aus einem Strom gesprochener Wörter zu extrahieren. Der Durchschnittsfachmann kennt viele Verfahren zum Implementieren von Konzeptinformationsdecodern.
  • Die ZMM-Konzeptnachschlagevorrichtung 6500 nimmt als Eingang entgegen: (a) eine KGZ-Datenstruktur, die von der digitalen Speichervorrichtung 6075 kommend empfangen wird, (b) Daten von dem Konzeptinformationsdecoder 6800, die Konzepte für den aktuellen Abschnitt der eingegebenen Audio- oder audio-visuellen Arbeit, der an das ZMM-Teilsystem 6300 gesendet wird, darstellen; und (c) den Parameter Theta von der BEP/WS 6200. Die ZMM-Konzeptnachschlagevorrichtung 6500 verwendet eine Datenbank oder einen Notizblockspeicher zum Führen einer Datensatzliste, in der jeder Datensatz Informationen bezüglich der ZMM-Rate und Konzeptinformationen für die ZMM-Rate speichert. Die ZMM-Konzeptnachschlagevorrichtung 6500 führt die folgenden Schritte gemäß einem der vielen dem Durchschnittsfachmann vertrauten Verfahren aus. Sie durchsucht die Datenbank, welche die KGZ-Datenstruktur enthält, nach dem am besten übereinstimmenden Konzepteintrag. Wenn die Differenz zwischen dem am besten übereinstimmenden Eintrag innerhalb eines Bereichs liegt, der durch einen Parameter Theta spezifiziert wird, so wird die ZMM-Rate, die mit diesem Eintrag verknüpft ist, als Ausgang ausgegeben. Wenn keine Konzepteinträge in der Datenbank, welche die KGZ-Datenstruktur enthält, innerhalb der Distanz liegen, die durch den Parameter Theta spezifiziert wird, dann wird die zuvor erhaltene ZMM-Rate als Ausgang ausgegeben, der durch den ZMM-Ratenverwalter 6400 empfangen wird.
  • Der ZMM-Ratenverwalter 6400 empfängt als Eingang: (a) eine ZMM-Rate von dem Benutzereingabeprozessor 6200, die durch den Benutzer spezifiziert wird; (b) eine ZMM-Rate von der ZMM-Konzeptnachschlagevorrichtung 6500; und (c) die Parameter Offset, Slew-Limit und Override von der BEP/WS 6200, die weiter unten noch näher besprochen werden. In Reaktion darauf erzeugt der ZMM-Ratenverwalter 6400 als Ausgang eine einzelne ZMM-Rate, die an das ZMM-Teilsystem 6300 übermittelt wird.
  • Der ZMM-Ratenverwalter 6400 bestimmt die ZMM-Rate oder Wiedergaberate unter Verwendung einer der folgenden Betriebsarten:
    • 1. KGZ-Datenstrukturgesteuerte Wiedergabe: In diesem Modus ist die verwendete ZMM-Rate die ZMM-Rate, die durch die ZMM-Konzeptnachschlagevorrichtung 6500 bereitgestellt wird.
    • 2. KGZ-Datenstrukturversetzte Wiedergabe: In diesem Modus spezifiziert der Benutzer über die BEP 6100 einen Versatzparameter, der zum Justieren der in der KGZ-Datenstruktur spezifizierten ZMM-Rate zu verwenden ist. Der ZMM-Raten-Ausgang ist durch die folgende Formel gegeben: TSM_rate = ZMM-Rate von der ZMM-Konzeptnachschlagevorrichtung × (1 + Offset)Wenn zum Beispiel ein Benutzer einen Versatz von –0,4 spezifiziert, so addiert der ZMM-Ratenverwalter 6400 den –0,4-Versatz zu der Zahl 1 (was zu dem Wert 0,6 führt) und skaliert jede der ZMM-Raten, die durch die ZMM-Konzeptnachschlagevorrichtung 6500 spezifiziert wurden, um eine gleichmäßige Verringerung (Verlangsamung) der ZMM-Rate oder Wiedergaberate für das erzeugte Ausgangssignal zu erreichen. Glei chermaßen würde ein positiver Versatz die ZMM-Rate oder Wiedergaberate für das erzeugte Ausgangssignal erhöhen (beschleunigen). Es ist zu beachten, dass ein Versatzwert von null keine Auswirkung auf die ZMM-Rate hat. Es ist klar, dass verschiedene Versatzstrategien verwendet werden können, um eine nicht-lineare und eine lineare Skalierung der ZMM-Raten zu erreichen.
    • 3. Außerkraftsetzen der KGZ-Datenstruktur durch den Benutzer: In diesem Modus kann der Benutzer eine ZMM-Rate außer Kraft setzen, die von der ZMM-Konzeptnachschlagevorrichtung 6500 übermittelt wurde, und kann manuell die ZMM-Rate oder Wiedergaberate für Abschnitte der Audio- oder audio-visuellen Arbeit steuern. Wenn das Außerkraftsetzen durch den Benutzer ausgelöst wird, so wird die ZMM-Rate, die zum Bestimmen der Wiedergaberate des Ausgangssignals verwendet wird, von der ZMM-Konzeptnachschlagevorrichtung 6500 genommen, die den KGZ-Datenstruktureintrag benutzt, der den konzeptuellen Informationen in dem aktuellem Segment der Audio- oder audio-visuellen Arbeit entspricht.
  • Der ZMM-Ratenverwalter 6400 verwendet einen Anstiegsratenparameter, der durch den Benutzer spezifiziert wurde, um die Rate der Änderung der ZMM-Rate an seinem Ausgang zu begrenzen, um sanfte Übergänge zwischen verschiedenen ZMM-Raten zu erzeugen. Der ZMM-Verwalter 6400 kann auch den Eingangsstrom vorausschauend abtasten, um die geeignete Änderungsrate über die wiedergegebene Audio- oder audio-visuelle Arbeit hinweg zu prognostizieren. Auf diese Weise wird die Zeitverzögerung, die mit Änderungen der ZMM-Rate verbunden ist, verringert, wie unten beschrieben wird.
  • Es ist klar, dass sich die ZMM-Raten oder Wiedergaberaten, die von der ZMM-Konzeptnachschlagevorrichtung 6500 ausgegeben werden, rasch ändern können. Der Eingangsparameter Slew_Limit wird zum Steuern der Rate der Änderung der Wiedergaberate verwendet. Slew_Limit filtert große Übergangszustände in der ZMM-Rate oder Wiedergaberate heraus, indem eine allmähliche Änderung der Wiedergabegeschwindigkeit erzwungen wird, indem gewährleistet wird, dass die Größenordnung eines Übergangs der ZMM-Rate unter dem Betrag liegt, der in dem Slew_Limit-Parameter spezifiziert wurde. Es ist jedoch wichtig anzumerken, dass, wenn ein kleiner Wert von Slew_Limit ausgewählt wird, die Zeitdauer verlängert wird, die für den Übergang zu einer neuen ZMM-Rate oder Wiedergaberate benötigt wird. Dies kann die unerwünschte Nebenwirkung haben, dass die Wiedergaberatenreaktion träge wirkt. Man bedenke zum Beispiel, was geschieht, wenn die Eingabe mit dem doppelten der normalen Geschwindigkeit wiedergegeben wird und man auf einen interessierenden Punkt stößt, was die ZMM-Konzeptnachschlagevorrichtung 6500 veranlasst, eine ZMM-Rate oder Wiedergaberate von der Hälfte der normalen Geschwindigkeit auszugeben. In diesem Fall kann es sein, dass der Eingangsparameter Slew_Limit eine derart lange Übergangszeit auferlegt, dass das interessierende Wort nicht mit der Geschwindigkeit wiedergegeben wird, die anhand des KGZ-Datenstruktureintrages bestimmt wurde. Eine Möglichkeit zum Vermeiden dieser unerwünschten Nebenwirkung besteht darin, dass die ZMM-Konzeptnachschlagevorrichtung 6500 vorausschauend den Audio- oder audio-visuellen Eingangsstrom abtastet und künftige Werte von ZMM-Raten oder Wiedergaberaten beschafft, die dafür verwendet werden können, die ZMM-Sollrate für bevorstehende Abschnitte der Audio- oder audio-visuellen Arbeit zu bestimmen. Wenn die ZMM-Sollrate für ein bevorstehendes Segment derart abweicht, dass das Slew_Limit verhindern würde, dass sich die ZMM-Rate schnell genug justiert, so könnte der ZMM-Ratenverwalter 6400 einen früheren Übergang der ZMM-Rate oder Wiedergaberate einleiten, indem er die ZMM-Rate für aktuelle Segmente in der Richtung der spezifizierten künftigen ZMM-Raten justiert. Eine andere Möglichkeit zum Vermeiden des unerwünschten Effekts langer Übergangszeiten infolge kleiner Werte für das Slew_Limit besteht darin, den Audio- oder audio-visuellen Eingangsstrom zu verzögern, indem er um einen festen Betrag gepuffert wird, der gleich dem Betrag ist, den die ZMM-Konzeptnachschlagevorrichtung 6500 vorauslesen würde. Dies verschiebt die ZMM-Raten-Übergänge in dem Audio- oder audio-visuellen Eingangsstrom geringfügig nach vorn, was zu einem Ausgangsstrom führt, bei dem Geschwindigkeitsänderungen frühzeitig genug stattfinden, so dass die Konzepte mit der Rate wiedergegeben werden, die anhand der ZMM-Konzeptnachschlagevorrichtung 6500 spezifiziert wurde, und die Geschwindigkeitsübergänge das Slew-Limit einhalten.
  • 12 zeigt ein Flussdiagramm eines Algorithmus', der in einer Ausführungsform des ZMM-Ratenverwalters 6400 zum Bereitstellen einer ZMM-Rate oder Wiedergaberate verwendet wird.
  • Wie in 12 gezeigt, wird Folgendes als Eingang in das Kästchen 7105 eingespeist: (a) eine ZMM-Rate, die durch den Benutzer spezifiziert wurde (TSM_USER) und die von der BEP/WS 6200 kommend empfangen wird; (b) eine ZMM-Rate, die durch die ZMM-Konzeptnachschlagevorrichtung 6500 ausgegeben wurde (TSM_LUS); (c) ein Anstiegsratenbegrenzungsparameter (Slew_Limit), der durch den Benutzer spezifiziert wurde und der von der BEP/WS 6200 kommend empfangen wird; (d) eine Außerkraftsetzungsmarkierung (Override), die durch den Benutzer spezifiziert wurde und die von der BEP/WS 6200 kommend empfangen wird; und (e) ein Versatzwert (Offset), der durch den Benutzer spezifiziert wurde und der von der BEP/WS 6200 kommend empfangen wird.
  • Im Kästchen 7105 wird eine Entscheidung getroffen, um zu bestimmen, ob Override wahr ist. Wenn ja, so wird die Steuerung an das Kästchen 7900 weitergegeben; anderenfalls wird die Steuerung an das Kästchen 7200 weitergegeben. Im Kästchen 7200 wird eine Entscheidung getroffen, um zu bestimmen, ob Offset gleich 0,0 ist. Wenn ja, so wird die Steuerung an das Kästchen 7300 weitergegeben. Anderenfalls wird die Steuerung an das Kästchen 7110 weitergegeben.
  • Im Kästchen 7300 werden die folgenden Variablen berechnet: Delta = |TSM_Prev – TSM_LUS| und Sign = sign[TSM_Prev – TSM_LUS], wobei TSM_Prev die zuvor bestimmte ZMM-Rate ist. Die Steuerung wird dann an das Kästchen 7400 weitergegeben.
  • Im Kästchen 7400 wird eine Entscheidung auf der Basis eines Vergleichs zwischen Delta und Slew_Limit getroffen. Wenn Delta größer als Slew_Limit ist, so wird die Steuerung an das Kästchen 7500 weitergegeben; anderenfalls wird die Steuerung an das Kästchen 7600 weitergegeben.
  • Im Kästchen 7600 wird Delta gleich Sign × Delta gesetzt, und die Steuerung wird dann an das Kästchen 7700 weitergegeben. Im Kästchen 7500 wird Delta gleich Sign × Slew_Limit gesetzt, und die Steuerung wird dann an das Kästchen 7700 weitergegeben. Im Kästchen 7700 wird TSM_Prev gleich TSM_Prev + Delta gesetzt, und die Steuerung wird dann an das Kästchen 7800 weitergegeben. Im Kästchen 7800 wird TSM_Prev gleich TSM [deutsch: ZMM] gesetzt, und der Wert TSM wird als Ausgang ausgegeben.
  • Im Kästchen 7900 wird TSM gleich TSM_USER gesetzt, und die Steuerung wird dann an das Kästchen 7800 weitergegeben. Schließlich wird im Kästchen 7110 TSM gleich TSM_LUS × (1 + Offset) gesetzt, und die Steuerung wird dann an das Kästchen 7300 weitergegeben.
  • Kombinationen der oben beschriebenen Betriebsarten liegen ebenfalls innerhalb des Geltungsbereichs der vorliegenden Erfindung. Zum Beispiel kann ein Benutzer sich entscheiden, einen Benutzerversatz mit der Verwendung einer KGZ-Datenstruktur für Untertitel-Informationen, die in die wiederzugebende Audio- oder audio-visuellen Arbeit eingebettet ist, zu kombinieren, um die ZMM-Rate zu bestimmen, die für das Ausgangssignal gewünscht wird.
  • Der Ausgang von der Ausführungsform 6000 ist ein Strom digitaler Abtastungen, die einen digitalisierten Audio- oder audio-visuellen Strom bilden, der eine Zeitmaßstabsmodifikation der eingegebenen Audio- oder audio-visuellen Arbeit ist und gemäß der vorliegenden Erfindung die ZMM-Raten oder Wiedergaberaten widerspiegelt, die durch die KGZ-Datenstruktur und/oder die Benutzereingaben spezifiziert wurden. Dieser Ausgang stellt die HIG-Arbeit dar.
  • In einigen Ausführungsformen speichert die Ausführungsform 6000 auch die HIG-Arbeit für eine spätere Wiedergabe durch die gleiche Ausführungsform oder durch andere Wiedergabevorrichtungen. Außerdem kann der digitale Ausgang in eine analoge Form zum Speichern in analogen Vorrichtungen umgewandelt werden. Es gibt viele dem Durchschnittsfachmann vertraute Vorrichtungen zum Empfangen eines digitalisierten Eingangssignals, wie zum Beispiel einer 16-Bit-Impulscode-Modulation, und zum Ausgeben eines analogen Signalausgangs daraus. Zum Beispiel ist es dem Durchschnittsfachmann vertraut, dass es handelsübliche Vorrichtungen zum Empfangen eines Stroms aus digitalisierten Abtastungen, die ein Signal darstellen, und zum Umwandeln solcher Abtastungen in ein analoges Signal ohne Qualitätsverlust gibt. Wie dem Durchschnittsfachmann sofort klar ist, beschleunigt oder verlangsamt das ZMM-Teilsystem 6300 jedes Mal, wenn die Ausführungsform 6000 eine Wiedergabe einer audio-visuellen Arbeit ausführt, visuelle Informationen so, dass sie an das Audio in der audio-visuellen Arbeit angepasst werden. Dafür wird in einer bevorzugten Ausführungsform das Videosignal gemäß einem der vielen dem Durchschnittsfachmann bekannten Verfahren "Frame-unterabgetastet" oder "Frame-repliziert", um die Synchronität zwischen den Audio- und den visuellen Abschnitten der audio-visuellen Arbeit zu wahren. Wenn man also das Audio beschleunigt und Abtastungen mit einer schnelleren Rate angefordert werden, so wird der Frame-Strom unterabgetastet, d. h. Frames werden übersprungen.
  • Obgleich 11 die Ausführungsform 6000 so zeigt, dass sie aus separaten Modulen besteht, sind die BSS 6100, die BEP/WS 6200, das ZMM-Teilsystem 6300, der ZMM-Ratenverwalter 6400, die ZMM-Konzeptnachschlagevorrichtung 6500, der Konzeptdeterminierer 6700 und der Konzeptinformationsdecoder 6800 in einer bevorzugten Ausführungsform als Software-Programme oder -Module verkörpert, die auf einem Allzweck-Computer wie zum Beispiel einem Personalcomputer arbeiten. Des Weiteren ist die digitale Speichervorrichtung 6075 als ein Plattenlaufwerk oder ein Direktzugriffsspeicher verkörpert, und der Digital-Analog-Wandler 6600 ist als ein typisches Zubehör eines Allzweck-Computers, wie zum Beispiel eine Soundkarte eines Personalcomputers, verkörpert. Vor dem Hintergrund des oben im einzelnen Dargelegten dürfte dem Durchschnittsfachmann klar sein, wie diese Programme oder Module als Software zu implementieren sind.
  • Anwendungen der vorliegenden Erfindung
  • Im Folgenden werden Beispiele der Verwendung des Verfahrens und der Vorrichtung gemäß der Erfindung beschrieben. Ein erstes Beispiel der Verwendung des Verfahrens und der Vorrichtung gemäß der Erfindung steht in Verbindung mit der Unterweisung im Umgang mit den audio-visuellen Arbeiten. Die erfindungsgemäße Vorrichtung ermöglicht es, die ZMM-Rate oder Wiedergaberate einer bestimmten audio-visuellen Arbeit für einzelne Benutzer oder auf einer gemeinsamen Basis, die auf spezielle Gruppen von Hörern abzielt, zu steuern. Nehmen wir zum Beispiel an, dass eine unterweisende audio-visuelle Arbeit verwendet wird, um Zuschauer darin zu unterweisen, wie ein Auftragseingangsbuchhaltungssystem auf einem bestimmten Betriebssystem einzurichten und zu verwenden ist, um bestimmte Arten von Finanztransaktionen einzugeben und zu berichten. Nehmen wir des Weiteren an, dass das Zielpublikum für die unterweisende audio-visuelle Arbeit aus zwei Gruppen besteht: (a) Buchhalter, die Neulinge am Computer sind, und (b) fortgeschrittene Computer-Nutzer, die noch nicht mit der standardmäßigen Buchhaltungspraxis vertraut sind. Während der Wiedergabe der audio-visuellen Arbeit wird Material in folgender Weise präsentiert. Es wird eine bestimmte Finanztransaktion zusammen mit entsprechenden Aktionen an der Benutzerschnittstelle des Software-Programms beschrieben, wie zum Beispiel "Wählen Sie das Pulldown-Menü geben Sie NEU ein"; dann wird der eigentliche Prozess demonstriert. Während der Wiedergabe dieser audio-visuellen Arbeit mit normaler Geschwindigkeit würden Buchhaltungsfachleute, die Computer-Neulinge sind, bei der Beschreibung der Finanztransaktionen, mit denen sie bereits vertraut sind, ungeduldig werden. Aber für dieselben Personen könnte das Tempo der Unterweisung zu schnell sein, wenn demonstriert wird, wie Einträge in die Software auszuführen sind, weil sie mit der Verwendung solcher Schnittstellen nicht vertraut sind. Gleichermaßen könnte für jene Zuschauer, die fortgeschrittene Computer-Nutzer, aber Buchhaltungs-Neulinge sind, das Tempo der Unterweisung (die Sprechrate) zu schnell sein, wenn es um bestimmte Finanztransaktionen geht. Aber dieselben Personen würden bei der langsamen methodischen Demonstration des Eingabeprozesses, der bereits verbal besprochen wurde, ungeduldig werden. Ausführungsformen der vorliegenden Erfindung lösen dieses Problem in der folgenden Weise. Die audio-visuelle Arbeit wird mit zwei Geschwindigkeitskonturen geliefert. Eine Geschwindigkeitskontur ist für fortgeschrittene Computer-Nutzer, die Buchhaltungs-Neulinge sind (FastCompSlowAcc.spdcon), und eine andere Geschwindigkeitskontur ist für Buchhaltungs-Experten, die Computer-Neulinge sind (FastAccSlow-Comp.spdcon). Die Geschwindigkeitskontur FastCompSlowAcc.spdcon spezifiziert ZMM-Raten, die jene audio-visuellen Segmente schnell durchlaufen, welche die Demonstrationen enthalten, und verlangsamen die Wiedergaberate während der Beschreibung der Buchhaltungstransaktionen. Die Geschwindigkeitskontur FastAccSlowComp.spdcon spezifiziert ZMM-Raten, welche die Wiedergaberate während der Demonstrationen verlangsamen, und durchlaufen schnell jene audio-visuellen Segmente, die Buchhaltungstransaktionen beschreiben. Durch Laden der entsprechenden Geschwindigkeitskontur kann jedes Zielpublikum die Informationen mit einer Rate empfangen, die seiner speziellen Verständnisrate für entsprechende Segmente der audio-visuellen Arbeit entspricht. Infolge dessen machen es Ausführungsformen der vorliegenden Erfindung überflüssig, mehrere Versionen derselben audio-visuellen Arbeit für verschiedene Zielpublikumsgruppen zu produzieren.
  • In dem oben vorgestellten Beispiel wurden die Betrachter der audio-visuellen Arbeit in zwei spezielle Gruppen unterteilt. Jedoch sind in vielen Fällen die Autoren einer audio-visuellen Arbeit nicht mit der Verständnisrate des Publikums vertraut, das sich das in der Arbeit präsentierte Material ansehen wird. In diesem Fall kann jeder Benutzer eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur laden, die Informationen über die ideale Präsentationsrate für bestimmte Konzepte und Passagen mit Schlüsselwörtern und Phrasen enthält. Die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur ermöglicht es Benutzern, Informationen mit einer Darbietungsrate anzusehen, die an ihre eigenen Verständnisraten für verschiedenes Material angepasst ist.
  • Ein zweites Beispiel der Verwendung des Verfahrens und der Vorrichtung gemäß der Erfindung steht in Verbindung mit Unterhaltung unter Verwendung der audio-visuellen Arbeiten. Dem Durchschnittsfachmann dürfte ohne Weiteres klar sein, dass Ausführungsformen der vorliegenden Erfindung nicht auf das Paaren der Darbietungsrate mit Verständnisraten während unterweisenden audio-visuellen Arbeiten beschränkt sind. Ausführungsformen der vorliegenden Erfindung lösen nämlich auch das Problem des Paarens der Darbietungsrate mit dem Interessantheitswert oder Unterhaltungswert einer bestimmten audio-visuellen Arbeit, um den Hörern oder Zuschauern ein angenehmeres Erlebnis zu bieten. Zum Beispiel können Hörer und Spielfilmzuschauer KGZ-Datenstrukturen oder Geschwindigkeitskonturen gemäß der vorliegenden Erfindung zum Steuern der Wiedergaberate einer Audio- oder audio-visuellen Arbeit in der Weise nutzen, dass Passagen oder Szenen mit Gewaltdarstellungen oder erhöhter Handlungsdramatik mit einer schnelleren Rate abgespielt werden, um nicht-tolerierbare Angstzustände zu vermeiden. Gleichermaßen können Hörer und Spielfilmzuschauer, die an romantischen Dialogen interessiert sind, KGZ-Datenstrukturen oder Geschwindigkeitskonturen gemäß der vorliegenden Erfindung dafür nutzen, die Wiedergaberate für diese Passagen zu verringern. Es ist klar, dass jeder Benutzer oder jede Familie KGZ-Datenstrukturen nutzen kann, um entsprechend seinen bzw. ihren Interessen eine "Filter"-Funktion auszuüben, und Ausführungsformen der vorliegenden Erfindung verwenden kann, um HIG-Arbeiten für gewöhnliche Spielfilme, Fernseh-Shows und sonstige dem Unterhaltungssegment zuzurechnende Audio- oder audio-visuelle Arbei ten zu erstellen. Des Weiteren ist klar, dass ein wertvoller Service gemäß der vorliegenden Erfindung KGZ-Datenstrukturen oder Geschwindigkeitskonturen für spezielle Audio- oder audio-visuelle Arbeiten anbieten könnte, die dafür verwendet werden könnten, den Inhalt der Arbeit zu verändern. Zum Beispiel könnte mit Hilfe einer Geschwindigkeitskontur die Altersfreigabe für einen Spielfilm heraufgesetzt werden, wodurch bestimmte Passagen, die nur für Erwachsene geeignete Sprache oder Inhalte enthalten, herausgelöscht werden würden.
  • Es ist anzumerken, dass, nachdem eine KGZ-Datenstruktur erzeugt wurde, sie anschließend verwendet werden kann, um Wiedergaberaten für Audio- oder audio-visuelle Arbeiten zu lenken, die der Hörer zuvor noch nicht gehört hat. In dieser Weise können die Konzept- und ZMM-Raten-Paarungen, die Interesse, Verständnisrate und dergleichen darstellen und durch das Anhören verschiedener Audio- und audio-visueller Arbeiten gewonnen wurden, erfasst, gespeichert und später verwendet werden, um die ZMM-Rate oder Wiedergaberate für Audio- und audio-visuelle Arbeiten zu lenken, die zum ersten Mal durch einen Hörer wiedergegeben werden. So kann eine KGZ-Datenstruktur zum automatischen Steuern der Wiedergaberate oder zum automatischen Erstellen von Geschwindigkeitskonturen, die an das Interesse eines Benutzers angepasst sind, für Arbeiten verwendet werden, die der Benutzer noch nie gehört hat. Diese Fähigkeit zum Steuern der Wiedergaberate oder zum Erzeugen von Geschwindigkeitskonturen für noch nicht gehörte Arbeiten ermöglicht es Ausführungsformen der vorliegenden Erfindung, als Informationsfilter zu fungieren, die die Übermittlungsrate aller Audio- und audio-visuellen Arbeiten, die dem Benutzer dargeboten werden, an den Interessantheitswert anpassen, den die in der KGZ-Datenstruktur enthaltenen Konzepte für den Benutzer haben.
  • Ein drittes Beispiel der Verwendung des Verfahrens und der Vorrichtung gemäß der Erfindung steht in Verbindung mit der Produktion von Inhalten und mit Werbung. In diesem Beispiel kann eine Geschwindigkeitskontur, die das Interesse misst und die Aufmerksamkeit des Hörers oder Zuschauers aufrecht erhält, durch Stichproben bei einem bestimmten Zielpublikum oder Marktsegment bestimmt werden. Wenn zum Beispiel ein Werbespot auf Personen abzielt, die Besitzer eines Computers einer bestimmten Marke oder eines bestimmten Modells sind, so können die Produzenten des Werbespots einen einzelnen Werbespot drehen und die Geschwindigkeitskontur so verändern, dass die Aufmerksamkeit des Zielpublikums gewonnen wird, indem die Informationen mit einer Darbietungsrate übermittelt werden, die auf dieses Zielpublikum abgestimmt ist. Des Weiteren könnten verschiedene Geschwindigkeitskonturen entwickelt werden und an verschiedene Radio- oder Fernsehstationen und/oder in verschiedenen Zeitfenstern gesendet werden, je nachdem, wie vertraut das Publikum der Sendestationen mit dem in dem Werbespot behandelten Thema ist. So kann gemäß der vorliegenden Erfindung ein bestimmter Werbespot auf 20 Sekunden komprimiert werden, wenn er während einer Themensendung über den Umgang mit Heimcomputern mit einer ersten Geschwindigkeitskontur wiedergegeben wird, und derselbe Werbespot kann auf 30 Sekunden ausgedehnt werden, wenn er während der Abendnachrichten mit einer zweiten Geschwindigkeitskontur abgespielt wird, um die langsamere Verständnisrate jener Hörer zu berücksichtigen, die mit der Computer-Terminologie nicht vertraut sind.
  • Ein viertes Beispiel der Verwendung des Verfahrens und der Vorrichtung gemäß der Erfindung ist die Anwendung einer KGZ-Datenstruktur, die Konzepteinträge für numerische Ziffern enthält, die mit ZMM-Raten gepaart werden, die langsame Wiedergaberaten spezifizieren. In diesem Fall könnte das erfindungsgemäße Verfahren auf Voicemail-Systeme angewendet werden, wenn Hörer ihre Voicemail-Nachrichten abrufen. Der Konzeptdeterminierer würde eine einfache Spracherkennung ausführen, um das Vorhandensein numerischer Ziffern in der Nachricht zu bestimmen. Auf diese Weise würden alle Telefonnummern und Zahlenbeträge automatisch verlangsamt werden, was das Mitschreiben durch den Benutzer erleichtern würde. Des Weiteren können Ausführungsformen der vorliegenden Erfindung auch verwendet werden, um Wiedergaberaten für Konzepte wie zum Beispiel, ohne darauf beschränkt zu sein, Datumsangaben und Adressen und dergleichen zu spezifizieren.
  • Ein fünftes Beispiel der Verwendung des Verfahrens und der Vorrichtung gemäß der Erfindung steht in Verbindung mit der Unterweisung in – und dem Erlernen von – Fremdsprachen. Lernende, die sich eine Audio- oder audio-visuelle Arbeit anhören, welche die zu erlernende Fremdsprache enthält, würden Ausführungsformen der vorliegenden Erfindung benutzen, um eine Geschwindigkeitskontur zu erstellen, während sie sich verschiedene Passagen anhören. Die Geschwindigkeitskontur würde ihre Verständnisrate für das Material widerspiegeln, indem Passagen angezeigt werden, deren Wiedergabe mit einer langsameren Geschwindigkeit angefordert wurde als bei anderen Passagen oder die wiederholt wurden. Die Geschwindigkeitskontur könnte dann verwendet werden, um die Lernenden zu beurteilen und auf ihr weiteres Lernen einzuwirken. Zum Beispiel könnten sie sich Audio- oder audio-visuelle Arbeiten unter Verwendung von an sie angepassten Geschwindigkeitskonturen anhören, wodurch sie das verstehende Hören schnell gesprochener Passagen weiter üben könnten, um die Entwicklung von Wortanalysefähigkeiten zu unterstützen. Des Weiteren könnte eine KGZ-Datenstruktur, die unter Verwendung von Ausführungsformen der vorliegenden Erfindung erzeugt wird, um sich Material anzuhören, das in Fremd- oder Muttersprachen dargeboten wird, verwendet werden, um zu analysieren, welche Konzepte bestimmten Lernenden Schwierigkeiten bereiten. Auf diese Weise könnten einer Klasse identische Audio- oder audio-visuelle Arbeiten dargeboten werden, wobei jeder Lernende die Erfindung nutzt, um KGZ-Datenstrukturen zu erhalten, die Informationen über die Verständnisraten für Konzepte in dem in den Arbeiten enthaltenen Material enthalten. Die KGZ-Datenstrukturen könnten dann grafisch oder nach Konzepten geordnet dargeboten werden, um es den Lehrkräften zu ermöglichen, die Lernenden individuell einzustufen und/oder die Verständnisrate jedes Lernenden oder von Gruppen von Lernenden zu messen. Zum Beispiel könnte man einen Grundmaßstab in Verbindung mit von den Benutzern angeforderten Wiedergabegeschwindigkeiten und dem Verständnis von – oder der Vertrautheit mit – in den Konzepten verkörperten Themen entwickeln.
  • Der Fachmann ist sich bewusst, dass die obige Beschreibung lediglich dem Zweck der Veranschaulichung und Beschreibung dient. Insofern soll sie weder erschöpfend sein noch die Erfindung auf die konkret offenbarte Form beschränken.
  • Zum Beispiel dürfte dem Durchschnittsfachmann klar sein, dass die im vorliegenden Text beschriebenen Audio- oder audio-visuellen Arbeiten auch aus dem Internet in die Ausführungsformen der vorliegenden Erfindung eingespeist werden können. Es dürfte dem Durchschnittsfachmann ebenso klar sein, dass Ausführungsformen von Geschwindigkeitskonturen oder KGZ-Datenstrukturen verwendet werden können, um Informati onen zu filtern, auf die im Internet zugegriffen wird. Des Weiteren dürfte klar sein, dass Ausführungsformen der vorliegenden Erfindung als Teile von Suchmaschinen enthalten sein können, die dafür verwendet werden, auf Audio- oder audio-visuelle Arbeiten im Internet zuzugreifen.
  • Als ein weiteres Beispiel kann in Ausführungsformen der vorliegenden Erfindung eine Geschwindigkeitskontur ZMM-Raten-Einträge zum Beispiel von "Unendlichkeit" für bestimmte Abschnitte einer Audio- oder audio-visuellen Arbeit enthalten. In solchen Ausführungsformen der vorliegenden Erfindung weist eine ZMM-Rate von "Unendlichkeit" (oder ein sonstiger Hinweis, der in ähnlicher Weise umgesetzt wird) ein Wiedergabesystem an, Stücke einer Audio- oder audio-visuellen Arbeit zu überspringen, die mit einer ZMM-Rate von Unendlichkeit verknüpft sind. So können Benutzer gemäß solchen Ausführungsformen "kein Interesse" an bestimmten Abschnitten spezifizieren, wenn sie sich Audio- oder audio-visuelle Arbeiten anhören oder Audio- oder audio-visuelle Arbeiten durchsuchen.
  • Als ein weiteres Beispiel dürfte dem Durchschnittsfachmann klar sein, dass mögliche Beispiele Folgendes enthalten: (a) ein computerlesbares Medium, das mit einer KGZ-Datenstruktur codiert ist; (b) ein computerlesbares Medium, das mit einer Geschwindigkeitskontur codiert ist; (c) ein computerlesbares Medium, das mit einer Audio- oder audio-visuellen Arbeit zusammen mit einer KGZ-Datenstruktur codiert ist; und (d) ein computerlesbares Medium, das mit einer Audio- oder audio-visuellen Arbeit zusammen mit einer Geschwindigkeitskontur codiert ist. Im Fall eines computerlesbaren Mediums, das mit einer Audio- oder audio-visuellen Arbeit zusammen mit einer KGZ-Datenstruktur oder einer Geschwindigkeitskontur codiert ist, gibt es viele dem Durchschnittsfachmann vertraute Verfahren zum Speichern einer Audio- oder audio-visuellen Arbeit zusammen mit einer KGZ-Datenstruktur oder einer Geschwindigkeitskontur.

Claims (41)

  1. Vorrichtung zum Erzeugen einer konzeptuellen Geschwindigkeitszuordnungsdatenstruktur, die eine Affinitätsinformation enthält, die zum Erhalten einer Zeitmaßstabsmodifikations(ZMM)-Rate verwendet wird, und die eine Konzeptinformation enthält, die zum Erhalten eines Konzeptidentifikators für einen Teil einer Audio- oder audiovisuellen Arbeit, die der ZMM-Rate zugeordnet ist, verwendet wird, wobei die Vorrichtung Folgendes umfasst: eine Nutzereingabevorrichtung, die Nutzerinformationen empfängt und die Eingabe eines Teils der Audio- oder audiovisuellen Arbeit lenkt; ein Zeitmaßstabsmodifikationssystem, das auf einen Identifikator des Teils, den Teil und die ZMM-Rate anspricht und das einen zeitmaßstabsmodifizierten Teil erzeugt; einen Konzeptdecoder, der auf den Identifikator des Teils und den Teil anspricht und der ein oder mehrere Konzepte für den Teil erzeugt; einen Zeitmaßstabsmodifikationskonzeptmonitor, der auf die Nutzerinformationen und das eine oder die mehreren Konzepte anspricht und der die ZMM-Rate und einen Konzeptidentifikator, welcher der ZMM-Rate zugeordnet ist, erzeugt; und einen Generator für eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur, der auf die ZMM-Rate und den zugehörigen Konzeptidentifikator anspricht und der die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur erzeugt.
  2. Vorrichtung nach Anspruch 1, die des Weiteren eine Speichervorrichtung umfasst, die auf die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur anspricht und die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur speichert.
  3. Vorrichtung nach Anspruch 2, wobei die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur mit einer Nutzeridentifikation gespeichert wird, die in den Nutzerinformationen enthalten sind.
  4. Vorrichtung nach Anspruch 3, wobei der Generator für eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur erzeugt, die eine Funktion verschiedener konzeptueller Geschwindigkeitszuordnungsdatenstrukturen ist, die für einen bestimmten Nutzer erzeugt wurden.
  5. Vorrichtung nach Anspruch 3, wobei der Generator für eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur eine konzeptuelle Geschwindigkeitszuordnungsdatenstruktur erzeugt, die eine Funktion verschiedener konzeptueller Geschwindigkeitszuordnungsdatenstrukturen ist, die für eine Anzahl verschiedener Nutzer erzeugt wurden.
  6. Vorrichtung nach Anspruch 1, wobei der Zeitmaßstabsmodifikationskonzeptmonitor, der auf zuvor festgelegte Nutzerinformationen anspricht, eine oder mehrere bestimmte ZMM-Raten erzeugt und wobei das Zeitmaßstabsmodifikationssystem, das auf die eine oder die mehreren bestimmten ZMM-Raten anspricht, nicht den zeitmaßstabsmodifizierten Teil erzeugt.
  7. Vorrichtung nach Anspruch 1, die des Weiteren eine Anzeigevorrichtung umfasst, die auf die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur anspricht und die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur anzeigt.
  8. Vorrichtung nach Anspruch 1, die des Weiteren eine Wiedergabevorrichtung umfasst, die auf den zeitmaßstabsmodifizierten Teil anspricht und die den zeitmaßstabsmodifizierten Teil wiedergibt.
  9. Vorrichtung nach Anspruch 8, die des Weiteren eine Speichervorrichtung umfasst, die auf den Zeitmaßstabsmodifikationsteil anspricht und den zeitmaßstabsmodifizierten Teil speichert.
  10. Vorrichtung nach Anspruch 1, wobei der Konzeptdecoder einen Algorithmus zum Erkennen von Konzeptkategorien umfasst.
  11. Vorrichtung nach Anspruch 10, wobei eine der Kategorien Zahlen enthält.
  12. Vorrichtung nach Anspruch 1, wobei der Konzeptdecoder einen Konzeptdeterminator umfasst, der eine Ausgabe in einen Konzeptinformationsdecoder einspeist, wobei dieser Konzeptdeterminator Untertiteldaten oder Textkommentare eingibt, die mit dem Teil der Audio- oder audiovisuellen Arbeit gespeichert werden.
  13. Vorrichtung nach Anspruch 1, wobei der Konzeptdecoder einen Konzeptdeterminator umfasst, der eine Ausgabe in einen Konzeptinformationsdecoder einspeist, wobei dieser Konzeptdeterminator eine Spracherkennungsvorrichtung enthält.
  14. Vorrichtung nach Anspruch 1, wobei der Zeitmaßstabsmodifikationskonzeptmonitor eine einzelne ZMM-Rate für ein Konzept erzeugt, indem er eine mathematische Funktion der ZMM-Raten über das Intervall der eingegebenen Audio- oder audiovisuellen Arbeit, die dem einzelnen Konzept zugeordnet ist, ausführt.
  15. Vorrichtung nach Anspruch 14, wobei die mathematische Funktion das Bilden eines mathematischen Durchschnitts umfasst.
  16. Vorrichtung nach Anspruch 14, wobei die mathematische Funktion das Bilden eines gewichteten Durchschnitts umfasst, der die jüngsten ZMM-Werte betont, die während des Intervalls erhalten wurden, in dem ein bestimmtes Konzept am Eingang in den Zeitmaßstabsmodifikationskonzeptmonitor vorhanden war.
  17. Vorrichtung nach Anspruch 1, wobei der Zeitmaßstabsmodifikationskonzeptmonitor einen Vielzahl von ZMM-Raten für ein Konzept.
  18. Vorrichtung nach Anspruch 17, wobei die Vielzahl von ZMM-Raten bewirkt, dass die ZMM-Rate ansteigt, während das Konzept durch die Audio- oder audiovisuelle Arbeit hindurch wiederholt wird.
  19. Vorrichtung nach Anspruch 1, wobei die Affinitätsinformation eine Ableitung der ZMM-Rate umfasst.
  20. Vorrichtung nach Anspruch 19, wobei die Ableitung eine erste Ableitung ist.
  21. Vorrichtung nach Anspruch 1, wobei der Zeitmaßstabsmodifikationskonzeptmonitor die ZMM-Rate, die einem bestimmten Konzept zugeordnet ist, als eine Funktion der Anzahl der Male erzeugt, die das bestimmte Konzept in der Arbeit erschienen ist.
  22. Verfahren zum Erzeugen einer konzeptuellen Geschwindigkeitszuordnungsdatenstruktur, die eine Affinitätsinformation enthält, die zum Erhalten einer Zeitmaßstabsmodifikations(ZMM)-Rate verwendet wird, und die eine Konzeptinformation enthält, die zum Erhalten eines Konzeptidentifikators für einen Teil einer Audio- oder audiovisuellen Arbeit, die der ZMM-Rate zugeordnet ist, verwendet wird, wobei das Verfahren folgende Schritte umfasst: Erlangen von Nutzerinformationen und Lenken der Eingabe eines Teils der Audio- oder audiovisuellen Arbeit; Erzeugen einer zeitmaßstabsmodifizierten Version des Teils in Reaktion auf einen Identifikator des Teils, den Teil und die ZMM-Rate; Erzeugen eines oder mehrerer Konzepte für den Teil in Reaktion auf den Identifikator des Teils und den Teil; Erzeugen der ZMM-Rate und eines Konzepts, das der ZMM-Rate zugeordnet ist, in Reaktion auf die Nutzerinformationen und das eine oder die mehreren Konzepte; und Erzeugen der konzeptuellen Geschwindigkeitszuordnungsdatenstruktur in Reaktion auf die ZMM-Rate und das zugehörige Konzept.
  23. Vorrichtung, die eine Audio- oder audiovisuelle Arbeit in Verbindung mit einer konzeptuellen Geschwindigkeitszuordnungsdatenstruktur wiedergibt, die eine Affinitätsinformation enthält, die zum Erhalten einer ersten Zeitmaßstabsmodifikations(ZMM)-Rate verwendet wird, und die eine Konzeptinformation enthält, die zum Erhalten eines Konzeptidentifikators für einen Teil einer Audio- oder audiovisuellen Arbeit, die der ersten ZMM-Rate zugeordnet ist, verwendet wird, wobei die Vorrichtung Folgendes umfasst: eine Eingabevorrichtung, welche die Eingabe eines Teils der Audio- oder audio-visuellen Arbeit lenkt; ein Zeitmaßstabsmodifikationssystem, das auf einen Identifikator des Teils, den Teil und die ZMM-Rate anspricht und das einen zeitmaßstabsmodifizierten Teil erzeugt; eine Wiedergabevorrichtung, die auf den zeitmaßstabsmodifizierten Teil anspricht und den zeitmaßstabsmodifizierten Teil wiedergibt; einen Konzeptdecoder, der auf den Identifikator des Teils und den Teil anspricht und der ein oder mehrere Konzepte für den Teil erzeugt; und ein Zeitmaßstabsmodifikationskonzeptnachschlagesystem, das auf das eine oder die mehreren Konzepte und die Geschwindigkeitszuordnungsdatenstruktur anspricht und die ZMM-Rate erzeugt.
  24. Vorrichtung nach Anspruch 23, wobei die Eingabevorrichtung des Weiteren eine Nutzereingabevorrichtung umfasst, die Nutzerinformationen empfängt, und wobei das Zeitmaßstabsmodifikationskonzeptnachschlagesystem außerdem auf die Nutzerinformationen in der Weise anspricht, dass es die ZMM-Rate erzeugt.
  25. Vorrichtung nach Anspruch 24, wobei die Nutzerinformationen einen Versatz enthalten und wobei das Zeitmaßstabsmodifikationskonzeptnachschlagesystem die ZMM-Rate unter Verwendung des Versatzes erzeugt.
  26. Vorrichtung nach Anspruch 24, wobei die Nutzerinformationen einen vom Nutzer spezifizierten Quantisierungsschritt zu einer ZMM-Rate enthalten und das Zeitmaßstabsmodifikationskonzeptnachschlagesystem die ZMM-Rate unter Verwendung des vom Nutzer spezifizierten Quantisierungsschrittes erzeugt.
  27. Vorrichtung nach Anspruch 24, wobei die Nutzerinformationen ein Konzept und eine ZMM-Rate für das Konzept enthalten und das Zeitmaßstabsmodifikationskonzeptnachschlagesystem die ZMM-Rate unter Verwendung des vom Nutzer spezifizierten Konzepts und der vom Nutzer spezifizierten ZMM-Rate erzeugt.
  28. Vorrichtung nach Anspruch 23, wobei das Zeitmaßstabsmodifikationskonzeptnachschlagesystem die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur nach Konzepteinträgen innerhalb eines Bereichs des einen oder der mehreren Konzepte durchsucht.
  29. Vorrichtung nach Anspruch 28, wobei, wenn sich keine Konzepteinträge innerhalb des Bereichs finden, die zuvor erhaltene ZMM-Rate verwendet wird.
  30. Vorrichtung nach Anspruch 23, wobei das Zeitmaßstabsmodifikationskonzeptnachschlagesystem die ZMM-Rate, die einem bestimmten Konzept zugeordnet ist, als eine Funktion der Anzahl von Malen erzeugt, die das bestimmte Konzept in der Arbeit erschienen ist.
  31. Verfahren zum Wiedergeben einer Audio- oder audiovisuellen Arbeit in Verbindung mit einer konzeptuellen Geschwindigkeitszuordnungsdatenstruktur, die eine Affinitätsinformation enthält, die zum Erhalten einer ersten Zeitmaßstabsmodifikations(ZMM)-Rate verwendet wird, und die eine Konzeptinformation enthält, die zum Erhalten eines Konzeptidentifikators für einen Teil einer Audio- oder audiovisuellen Arbeit, die der ersten ZMM-Rate zugeordnet ist, verwendet wird, wobei das Verfahren folgende Schritte umfasst: Lenken der Eingabe eines Teils der Audio- oder audiovisuellen Arbeit; Erzeugen eines zeitmaßstabsmodifizierten Teils in Reaktion auf einen Identifikator des Teils, den Teil und eine ZMM-Rate; Wiedergeben des zeitmaßstabsmodifizierten Teils; Erzeugen eines Konzepts für den Teil in Reaktion auf den Identifikator des Teils und den Teil; und Erzeugen der ZMM-Rate in Reaktion auf das Konzept und die konzeptuelle Geschwindigkeitszuordnungsdatenstruktur.
  32. Verfahren nach Anspruch 31, wobei der Schritt des Erzeugens der ZMM-Rate das Durchsuchen der konzeptuellen Geschwindigkeitszuordnungsdatenstruktur nach Konzepteinträgen innerhalb eines Bereichs des einen oder der mehreren Konzepte umfasst.
  33. Verfahren nach Anspruch 32, wobei, wenn sich keine Konzepteinträge innerhalb des Bereichs finden, die zuvor erhaltene ZMM-Rate verwendet wird.
  34. Verfahren nach Anspruch 31, wobei der Schritt des Erzeugens der ZMM-Rate das Erzeugen der ZMM-Rate, die einem bestimmten Konzept zugeordnet ist, als eine Funktion der Anzahl von Malen beinhaltet, die das bestimmte Konzept in der Arbeit erschienen ist.
  35. Computerlesbares Medium, das mit einer konzeptuellen Geschwindigkeitszuordnungs ("KGZ")-Datenstruktur codiert ist, die eine Affinitätsinformation umfasst, die zum Erhalten einer Zeitmaßstabsmodifikations(ZMM)-Rate verwendet wird, und die eine Konzeptinformation umfasst, die zum Erhalten eines Konzeptidentifikators für einen Teil einer Audio- oder audiovisuellen Arbeit, die der ZMM-Rate zugeordnet ist, verwendet wird.
  36. Computerlesbares Medium nach Anspruch 35, wobei das computerlesbare Medium des Weiteren mit einer Audio- oder audiovisuellen Arbeit codiert ist.
  37. Verfahren zum Erzeugen einer Audio- oder audiovisuellen Arbeit in Verbindung mit einer konzeptuellen Geschwindigkeitszuordnungsdatenstruktur, das folgende Schritte umfasst: Erzeugen eines oder mehrerer Konzepte für einen Teil der Audio- oder audiovisuellen Arbeit; Erzeugen einer Zeitmaßstabsmodifikations(ZMM)-Rate in Reaktion auf das ei ne oder die mehreren Konzepte unter Verwendung der konzeptuellen Geschwindigkeitszuordnungsdatenstruktur; und Erzeugen eines zeitmaßstabsmodifizierten Teils der Audio- oder audiovisuellen Arbeit in Reaktion auf die ZMM-Rate.
  38. Verfahren nach Anspruch 37, das des Weiteren Folgendes umfasst: Abrufen der Audio- oder audiovisuellen Arbeit unter Verwendung einer Suchmaschine.
  39. Verfahren nach Anspruch 37, das des Weiteren folgenden Schritt umfasst: Übermitteln von Suchkriterien, die ein oder mehrere Konzepte enthalten, an eine Suchmaschine zum Abrufen der Audio- oder audiovisuellen Arbeit vor dem Erzeugen eines oder mehrerer Konzepte für einen Teil der Audio- oder audiovisuellen Arbeit.
  40. Verfahren nach Anspruch 39, wobei mindestens eine erzeugte ZMM-Rate bewirkt, dass der Teil aus dem zeitmaßstabsmodifizierten Teil weggelassen wird.
  41. Verfahren nach Anspruch 39, wobei der Schritt des Erzeugens einer ZMM-Rate beinhaltet, auf Nutzerinformationen anzusprechen.
DE69937001T 1998-10-09 1999-10-07 Bereitstellung von nach benutzer-interesse gefilterten werken Expired - Lifetime DE69937001T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US169031 1998-10-09
US09/169,031 US6374225B1 (en) 1998-10-09 1998-10-09 Method and apparatus to prepare listener-interest-filtered works
PCT/US1999/023479 WO2000022611A1 (en) 1998-10-09 1999-10-07 Method and apparatus to prepare listener-interest-filtered works

Publications (2)

Publication Number Publication Date
DE69937001D1 DE69937001D1 (de) 2007-10-11
DE69937001T2 true DE69937001T2 (de) 2008-05-15

Family

ID=22613999

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69937001T Expired - Lifetime DE69937001T2 (de) 1998-10-09 1999-10-07 Bereitstellung von nach benutzer-interesse gefilterten werken

Country Status (8)

Country Link
US (8) US6374225B1 (de)
EP (1) EP1125287B1 (de)
JP (1) JP2003510625A (de)
KR (1) KR20010089293A (de)
AT (1) ATE371927T1 (de)
AU (1) AU6296599A (de)
DE (1) DE69937001T2 (de)
WO (2) WO2000022611A1 (de)

Families Citing this family (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7447626B2 (en) * 1998-09-28 2008-11-04 Udico Holdings Method and apparatus for generating a language independent document abstract
US6374225B1 (en) * 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
US6720990B1 (en) * 1998-12-28 2004-04-13 Walker Digital, Llc Internet surveillance system and method
AU5140200A (en) * 1999-05-26 2000-12-18 Enounce, Incorporated Method and apparatus for controlling time-scale modification during multi-media broadcasts
AU4200600A (en) * 1999-09-16 2001-04-17 Enounce, Incorporated Method and apparatus to determine and use audience affinity and aptitude
US7266343B1 (en) * 1999-09-29 2007-09-04 Nokia Corporation Method of and system for providing identification of a piece of information
US8311946B1 (en) 1999-10-15 2012-11-13 Ebrary Method and apparatus for improved information transactions
US7536561B2 (en) 1999-10-15 2009-05-19 Ebrary, Inc. Method and apparatus for improved information transactions
US6581103B1 (en) * 1999-10-22 2003-06-17 Dedicated Radio, Llc Method for internet radio broadcasting including listener requests of audio and/or video files with input dedications
US20030225919A1 (en) * 1999-10-22 2003-12-04 Dengler Christopher A. Apparatuses for digital multimedia transmission with receiver requests
US7020217B1 (en) * 1999-11-04 2006-03-28 Xm Satellite Radio, Inc. Satellite digital audio radio receiver with instant replay capability
AU2248501A (en) * 1999-12-17 2001-06-25 Promo Vu Interactive promotional information communicating system
US6721741B1 (en) * 2000-01-24 2004-04-13 Friskit, Inc. Streaming media search system
US6389467B1 (en) 2000-01-24 2002-05-14 Friskit, Inc. Streaming media search and continuous playback system of media resources located by multiple network addresses
WO2001069921A1 (en) * 2000-03-17 2001-09-20 Koninklijke Philips Electronics N.V. Method and apparatus for rating database objects
US7047192B2 (en) * 2000-06-28 2006-05-16 Poirier Darrell A Simultaneous multi-user real-time speech recognition system
US7047312B1 (en) * 2000-07-26 2006-05-16 Nortel Networks Limited TCP rate control with adaptive thresholds
US20020080166A1 (en) 2000-08-08 2002-06-27 Sweatt Millard E. Method and system for remote television replay control
US9171851B2 (en) * 2000-08-08 2015-10-27 The Directv Group, Inc. One click web records
US10390074B2 (en) 2000-08-08 2019-08-20 The Directv Group, Inc. One click web records
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US7058223B2 (en) * 2000-09-14 2006-06-06 Cox Ingemar J Identifying works for initiating a work-based action, such as an action on the internet
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US7092496B1 (en) * 2000-09-18 2006-08-15 International Business Machines Corporation Method and apparatus for processing information signals based on content
US20060271365A1 (en) * 2000-09-18 2006-11-30 International Business Machines Corporation Methods and apparatus for processing information signals based on content
US20020059072A1 (en) * 2000-10-16 2002-05-16 Nasreen Quibria Method of and system for providing adaptive respondent training in a speech recognition application
US6745599B2 (en) * 2000-11-30 2004-06-08 Alnet (Proprietary) Limited Knitted fabric
US20020087985A1 (en) * 2000-12-01 2002-07-04 Yakov Kamen Methods and apparatuses for displaying meaningful abbreviated program titles
US7356605B1 (en) * 2000-12-29 2008-04-08 Cisco Technology, Inc. System and method for controlling delivery of streaming media
US7437307B2 (en) * 2001-02-20 2008-10-14 Telmar Group, Inc. Method of relating multiple independent databases
EP1374225B1 (de) 2001-03-29 2004-12-29 Philips Electronics N.V. Synchronisierung eines audio- und eines textcursors während der editierung
US20020194608A1 (en) * 2001-04-26 2002-12-19 Goldhor Richard S. Method and apparatus for a playback enhancement system implementing a "Say Again" feature
EP1386312B1 (de) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
US7047200B2 (en) * 2002-05-24 2006-05-16 Microsoft, Corporation Voice recognition status display
EP1391830A1 (de) * 2002-07-19 2004-02-25 Albert Inc. S.A. System zum Extrahieren von Informationen aus einem natürlichsprachigen Text
US7627872B2 (en) 2002-07-26 2009-12-01 Arbitron Inc. Media data usage measurement and reporting systems and methods
US7194693B2 (en) * 2002-10-29 2007-03-20 International Business Machines Corporation Apparatus and method for automatically highlighting text in an electronic document
US8959019B2 (en) * 2002-10-31 2015-02-17 Promptu Systems Corporation Efficient empirical determination, computation, and use of acoustic confusability measures
US7277883B2 (en) * 2003-01-06 2007-10-02 Masterwriter, Inc. Information management system
US20040166481A1 (en) * 2003-02-26 2004-08-26 Sayling Wen Linear listening and followed-reading language learning system & method
US7292723B2 (en) * 2003-02-26 2007-11-06 Walker Digital, Llc System for image analysis in a network that is structured with multiple layers and differentially weighted neurons
US20040186813A1 (en) * 2003-02-26 2004-09-23 Tedesco Daniel E. Image analysis method and apparatus in a network that is structured with multiple layers and differentially weighted neurons
US20040190774A1 (en) * 2003-03-28 2004-09-30 Baker Daniel P. Method for classifying and accessing writing composition examples
US7783617B2 (en) * 2003-04-16 2010-08-24 Yahoo! Inc. Personals advertisement affinities in a networked computer system
JP4317547B2 (ja) * 2003-05-28 2009-08-19 株式会社電通 コンタクトポイント・ナビゲーション・システム及びその方法又はその方法を記録した記録媒体及びその方法を伝送する伝送媒体
US7274775B1 (en) * 2003-08-27 2007-09-25 Escription, Inc. Transcription playback speed setting
WO2005038625A2 (en) 2003-10-17 2005-04-28 Nielsen Media Research, Inc. Et Al. Portable multi-purpose audience measurement system
US7660715B1 (en) 2004-01-12 2010-02-09 Avaya Inc. Transparent monitoring and intervention to improve automatic adaptation of speech models
US8676830B2 (en) 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines
US20050209847A1 (en) * 2004-03-18 2005-09-22 Singhal Manoj K System and method for time domain audio speed up, while maintaining pitch
US7379946B2 (en) 2004-03-31 2008-05-27 Dictaphone Corporation Categorization of information using natural language processing and predefined templates
US8914383B1 (en) 2004-04-06 2014-12-16 Monster Worldwide, Inc. System and method for providing job recommendations
US7739142B2 (en) * 2004-05-17 2010-06-15 Yahoo! Inc. System and method for providing automobile marketing research information
US8504369B1 (en) 2004-06-02 2013-08-06 Nuance Communications, Inc. Multi-cursor transcription editing
US20060010378A1 (en) * 2004-07-09 2006-01-12 Nobuyoshi Mori Reader-specific display of text
GB2432704B (en) * 2004-07-30 2009-12-09 Dictaphone Corp A system and method for report level confidence
US7844464B2 (en) * 2005-07-22 2010-11-30 Multimodal Technologies, Inc. Content-based audio playback emphasis
US7650628B2 (en) * 2004-10-21 2010-01-19 Escription, Inc. Transcription data security
US7836412B1 (en) 2004-12-03 2010-11-16 Escription, Inc. Transcription editing
US7840564B2 (en) 2005-02-16 2010-11-23 Ebrary System and method for automatic anthology creation using document aspects
KR100996131B1 (ko) * 2005-03-11 2010-11-24 야후! 인크. 리스팅 관리 시스템 및 방법
US20060206517A1 (en) * 2005-03-11 2006-09-14 Yahoo! Inc. System and method for listing administration
US7613610B1 (en) 2005-03-14 2009-11-03 Escription, Inc. Transcription data extraction
US20060212309A1 (en) * 2005-03-18 2006-09-21 Pitney Bowes Incorporated Method for determining the best day of the week for a recipient to receive a mail piece
US8375067B2 (en) * 2005-05-23 2013-02-12 Monster Worldwide, Inc. Intelligent job matching system and method including negative filtration
US8527510B2 (en) 2005-05-23 2013-09-03 Monster Worldwide, Inc. Intelligent job matching system and method
US8433713B2 (en) 2005-05-23 2013-04-30 Monster Worldwide, Inc. Intelligent job matching system and method
US7433869B2 (en) 2005-07-01 2008-10-07 Ebrary, Inc. Method and apparatus for document clustering and document sketching
US7924759B1 (en) * 2005-08-08 2011-04-12 H-Itt, Llc Validation method for transmitting data in a two-way audience response teaching system
US7286498B1 (en) * 2005-08-09 2007-10-23 H-Itt, Llc Validation method and data structures for wireless communications
US8032372B1 (en) 2005-09-13 2011-10-04 Escription, Inc. Dictation selection
US20070067174A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Visual comparison of speech utterance waveforms in which syllables are indicated
US8195657B1 (en) 2006-01-09 2012-06-05 Monster Worldwide, Inc. Apparatuses, systems and methods for data entry correlation
US8209181B2 (en) * 2006-02-14 2012-06-26 Microsoft Corporation Personal audio-video recorder for live meetings
US7653543B1 (en) 2006-03-24 2010-01-26 Avaya Inc. Automatic signal adjustment based on intelligibility
US7667120B2 (en) * 2006-03-30 2010-02-23 The Tsi Company Training method using specific audio patterns and techniques
US8600931B1 (en) 2006-03-31 2013-12-03 Monster Worldwide, Inc. Apparatuses, methods and systems for automated online data submission
US20070250311A1 (en) * 2006-04-25 2007-10-25 Glen Shires Method and apparatus for automatic adjustment of play speed of audio data
US8204185B1 (en) 2006-04-28 2012-06-19 At&T Intellectual Property Ii, L.P. Method and apparatus for retrieving voicemail messages via customer premise equipment
US8300781B1 (en) * 2006-04-28 2012-10-30 At&T Intellectual Property Ii, L.P. Method and apparatus for retrieving all voicemail messages at the same time
US20070288308A1 (en) * 2006-05-25 2007-12-13 Yahoo Inc. Method and system for providing job listing affinity
US7831423B2 (en) * 2006-05-25 2010-11-09 Multimodal Technologies, Inc. Replacing text representing a concept with an alternate written form of the concept
JP2008005175A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 情報配信装置、情報配信方法およびプログラム
US8286071B1 (en) 2006-06-29 2012-10-09 Escription, Inc. Insertion of standard text in transcriptions
US20080033720A1 (en) * 2006-08-04 2008-02-07 Pankaj Kankar A method and system for speech classification
US7925508B1 (en) 2006-08-22 2011-04-12 Avaya Inc. Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns
US7962342B1 (en) 2006-08-22 2011-06-14 Avaya Inc. Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns
US8244673B2 (en) * 2006-08-30 2012-08-14 Panasonic Corporation Information presenting device, information presenting method, information presenting program, and integrated circuit
US20080109224A1 (en) * 2006-11-02 2008-05-08 Motorola, Inc. Automatically providing an indication to a speaker when that speaker's rate of speech is likely to be greater than a rate that a listener is able to comprehend
US20080130908A1 (en) * 2006-12-05 2008-06-05 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Selective audio/sound aspects
US20120051561A1 (en) * 2006-12-05 2012-03-01 Cohen Alexander J Audio/sound information system and method
US7899670B1 (en) 2006-12-21 2011-03-01 Escription Inc. Server-based speech recognition
CA2687839A1 (en) * 2007-05-21 2009-01-08 Gwacs Defense, Inc. Method for identifying and locating wireless devices associated with a security event
US8996409B2 (en) 2007-06-06 2015-03-31 Sony Computer Entertainment Inc. Management of online trading services using mediated communications
US8041344B1 (en) 2007-06-26 2011-10-18 Avaya Inc. Cooling off period prior to sending dependent on user's state
CA2706853A1 (en) * 2007-11-26 2009-06-04 Gwacs Defense, Inc. Smart battery system and methods of use
JP5024154B2 (ja) * 2008-03-27 2012-09-12 富士通株式会社 関連付け装置、関連付け方法及びコンピュータプログラム
US10387837B1 (en) 2008-04-21 2019-08-20 Monster Worldwide, Inc. Apparatuses, methods and systems for career path advancement structuring
US7610202B1 (en) * 2008-04-21 2009-10-27 Nuance Communications, Inc. Integrated system and method for mobile audio playback and dictation
US9117007B2 (en) * 2008-05-14 2015-08-25 Microsoft Technology Licensing, Llc Visualization of streaming real-time data
US20090307203A1 (en) * 2008-06-04 2009-12-10 Gregory Keim Method of locating content for language learning
US8983841B2 (en) * 2008-07-15 2015-03-17 At&T Intellectual Property, I, L.P. Method for enhancing the playback of information in interactive voice response systems
US8290604B2 (en) * 2008-08-19 2012-10-16 Sony Computer Entertainment America Llc Audience-condition based media selection
US20100082356A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and method for recommending personalized career paths
US8943394B2 (en) * 2008-11-19 2015-01-27 Robert Bosch Gmbh System and method for interacting with live agents in an automated call center
US8606815B2 (en) * 2008-12-09 2013-12-10 International Business Machines Corporation Systems and methods for analyzing electronic text
US8340974B2 (en) * 2008-12-30 2012-12-25 Motorola Mobility Llc Device, system and method for providing targeted advertisements and content based on user speech data
US8484027B1 (en) 2009-06-12 2013-07-09 Skyreader Media Inc. Method for live remote narration of a digital book
US8504373B2 (en) * 2009-07-02 2013-08-06 Nuance Communications, Inc. Processing verbal feedback and updating digital video recorder (DVR) recording patterns
US8332412B2 (en) * 2009-10-21 2012-12-11 At&T Intellectual Property I, Lp Method and apparatus for staged content analysis
US20110112824A1 (en) * 2009-11-06 2011-05-12 Craig Peter Sayers Determining at least one category path for identifying input text
RU2543936C2 (ru) 2010-03-31 2015-03-10 Томсон Лайсенсинг Воспроизведение с быстрым доступом к объектам видеоданных
US20120023201A1 (en) * 2010-07-26 2012-01-26 Atlas Advisory Partners, Llc Unified Content Delivery Platform
WO2012036658A1 (en) * 2010-09-17 2012-03-22 Thomson Licensing Method for semantics based trick mode play in video system
JP2012075039A (ja) * 2010-09-29 2012-04-12 Sony Corp 制御装置、および制御方法
JP2012129979A (ja) * 2010-11-24 2012-07-05 Jvc Kenwood Corp 区間作成装置、区間作成方法、及び区間作成プログラム
US8909617B2 (en) * 2011-01-26 2014-12-09 Hulu, LLC Semantic matching by content analysis
US8768723B2 (en) 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
US9916420B2 (en) 2011-02-18 2018-03-13 Nuance Communications, Inc. Physician and clinical documentation specialist workflow integration
US10460288B2 (en) 2011-02-18 2019-10-29 Nuance Communications, Inc. Methods and apparatus for identifying unspecified diagnoses in clinical documentation
US9679107B2 (en) 2011-02-18 2017-06-13 Nuance Communications, Inc. Physician and clinical documentation specialist workflow integration
US8694335B2 (en) 2011-02-18 2014-04-08 Nuance Communications, Inc. Methods and apparatus for applying user corrections to medical fact extraction
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US8788289B2 (en) 2011-02-18 2014-07-22 Nuance Communications, Inc. Methods and apparatus for linking extracted clinical facts to text
US8799021B2 (en) 2011-02-18 2014-08-05 Nuance Communications, Inc. Methods and apparatus for analyzing specificity in clinical documentation
US8738403B2 (en) 2011-02-18 2014-05-27 Nuance Communications, Inc. Methods and apparatus for updating text in clinical documentation
US9904768B2 (en) 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
US9185225B1 (en) * 2011-06-08 2015-11-10 Cellco Partnership Method and apparatus for modifying digital messages containing at least audio
US8892447B1 (en) * 2011-10-25 2014-11-18 Nuance Communications, Inc. Quality assessment of text derived from an audio signal
JP2013200423A (ja) * 2012-03-23 2013-10-03 Toshiba Corp 音声対話支援装置、方法、およびプログラム
US9219559B2 (en) 2012-05-16 2015-12-22 The Nielsen Company (Us), Llc Methods and systems for audience measurement
US9317113B1 (en) 2012-05-31 2016-04-19 Amazon Technologies, Inc. Gaze assisted object recognition
KR101960311B1 (ko) * 2012-10-29 2019-03-20 엘지전자 주식회사 이동단말기 및 그 제어방법
US9105178B2 (en) 2012-12-03 2015-08-11 Sony Computer Entertainment Inc. Remote dynamic configuration of telemetry reporting through regular expressions
US8831953B2 (en) * 2013-01-16 2014-09-09 Vikas Vanjani Systems and methods for filtering objectionable content
US9569168B2 (en) * 2013-03-12 2017-02-14 Tivo Inc. Automatic rate control based on user identities
US9569167B2 (en) * 2013-03-12 2017-02-14 Tivo Inc. Automatic rate control for improved audio time scaling
JP5986548B2 (ja) * 2013-09-19 2016-09-06 ヤフー株式会社 サービス提供装置、サービス提供方法及びサービス提供プログラム
US9779084B2 (en) 2013-10-04 2017-10-03 Mattersight Corporation Online classroom analytics system and methods
US20170330153A1 (en) 2014-05-13 2017-11-16 Monster Worldwide, Inc. Search Extraction Matching, Draw Attention-Fit Modality, Application Morphing, and Informed Apply Apparatuses, Methods and Systems
CN105335595A (zh) 2014-06-30 2016-02-17 杜比实验室特许公司 基于感受的多媒体处理
US20160189712A1 (en) * 2014-10-16 2016-06-30 Veritone, Inc. Engine, system and method of providing audio transcriptions for use in content resources
US10740578B2 (en) 2015-04-08 2020-08-11 Fractal Antenna Systems, Inc. Fractal plasmonic surface reader
US10158825B2 (en) * 2015-09-02 2018-12-18 International Business Machines Corporation Adapting a playback of a recording to optimize comprehension
US9666208B1 (en) * 2015-12-14 2017-05-30 Adobe Systems Incorporated Hybrid audio representations for editing audio content
CN105894533A (zh) * 2015-12-31 2016-08-24 乐视移动智能信息技术(北京)有限公司 基于智能设备实现体感控制的方法、系统以及智能设备
US10721509B2 (en) * 2016-07-27 2020-07-21 Accenture Global Solutions Limited Complex system architecture for sensatory data based decision-predictive profile construction and analysis
JP6252921B1 (ja) * 2016-08-31 2017-12-27 パナソニックIpマネジメント株式会社 監視カメラシステム及び再生方法
US10846429B2 (en) 2017-07-20 2020-11-24 Nuance Communications, Inc. Automated obscuring system and method
US11222365B2 (en) * 2017-07-21 2022-01-11 Accenture Global Solutions Limited Augmented reality and mobile technology based services procurement and distribution
CN109147800A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 应答方法和装置
EP3660848A1 (de) * 2018-11-29 2020-06-03 Ricoh Company, Ltd. Vorrichtung, system und verfahren zur anzeigesteuerung und trägermittel
US12120391B2 (en) 2020-09-18 2024-10-15 The Nielsen Company (Us), Llc Methods and apparatus to estimate audience sizes and durations of media accesses
US12093968B2 (en) 2020-09-18 2024-09-17 The Nielsen Company (Us), Llc Methods, systems and apparatus to estimate census-level total impression durations and audience size across demographics
US12112651B2 (en) * 2021-04-14 2024-10-08 Western Governors University Curriculum architecture tool
US11922824B2 (en) 2022-03-23 2024-03-05 International Business Machines Corporation Individualized media playback pacing to improve the listener's desired outcomes

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181491A (ja) * 1991-12-30 1993-07-23 Sony Corp 音声合成装置
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
JP3147562B2 (ja) * 1993-01-25 2001-03-19 松下電器産業株式会社 音声速度変換方法
JP3156020B2 (ja) * 1993-06-21 2001-04-16 松下電器産業株式会社 音声速度変換方法
DE69428612T2 (de) 1993-01-25 2002-07-11 Matsushita Electric Industrial Co., Ltd. Verfahren und Vorrichtung zur Durchführung einer Zeitskalenmodifikation von Sprachsignalen
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
JPH10511472A (ja) * 1994-12-08 1998-11-04 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 言語障害者間の語音の認識を向上させるための方法および装置
US5694521A (en) * 1995-01-11 1997-12-02 Rockwell International Corporation Variable speed playback system
US5842172A (en) 1995-04-21 1998-11-24 Tensortech Corporation Method and apparatus for modifying the play time of digital audio tracks
JP3384646B2 (ja) * 1995-05-31 2003-03-10 三洋電機株式会社 音声合成装置及び読み上げ時間演算装置
JPH0946688A (ja) * 1995-07-26 1997-02-14 Fujitsu Ltd ビデオ情報提供/受信システム
US5806023A (en) 1996-02-23 1998-09-08 Motorola, Inc. Method and apparatus for time-scale modification of a signal
JP3707872B2 (ja) * 1996-03-18 2005-10-19 株式会社東芝 音声出力装置及びその方法
JP3847838B2 (ja) * 1996-05-13 2006-11-22 キヤノン株式会社 情報処理方法及び装置
US5828994A (en) * 1996-06-05 1998-10-27 Interval Research Corporation Non-uniform time scale modification of recorded audio
US5893062A (en) * 1996-12-05 1999-04-06 Interval Research Corporation Variable rate video playback with synchronized audio
US5924068A (en) * 1997-02-04 1999-07-13 Matsushita Electric Industrial Co. Ltd. Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion
AU6516198A (en) * 1997-03-28 1998-10-22 Digispeech (Israel) Ltd. Time scale modification of audiovisual playback and teaching listening comprehension
US6622171B2 (en) * 1998-09-15 2003-09-16 Microsoft Corporation Multimedia timeline modification in networked client/server systems
US6036496A (en) * 1998-10-07 2000-03-14 Scientific Learning Corporation Universal screen for language learning impaired subjects
US6374225B1 (en) * 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
US6370688B1 (en) * 1999-05-26 2002-04-09 Enounce, Inc. Method and apparatus for server broadcast of time-converging multi-media streams
AU5140200A (en) * 1999-05-26 2000-12-18 Enounce, Incorporated Method and apparatus for controlling time-scale modification during multi-media broadcasts
US6934759B2 (en) * 1999-05-26 2005-08-23 Enounce, Inc. Method and apparatus for user-time-alignment for broadcast works
AU4200600A (en) * 1999-09-16 2001-04-17 Enounce, Incorporated Method and apparatus to determine and use audience affinity and aptitude
JP2005316046A (ja) * 2004-04-28 2005-11-10 Canon Inc 画像加熱装置

Also Published As

Publication number Publication date
US9343080B2 (en) 2016-05-17
EP1125287A4 (de) 2005-07-20
DE69937001D1 (de) 2007-10-11
AU6296599A (en) 2000-05-01
US20030046080A1 (en) 2003-03-06
US20050033584A1 (en) 2005-02-10
WO2000022611A1 (en) 2000-04-20
US20110153319A1 (en) 2011-06-23
US7899668B2 (en) 2011-03-01
JP2003510625A (ja) 2003-03-18
US20080140414A1 (en) 2008-06-12
US6801888B2 (en) 2004-10-05
EP1125287B1 (de) 2007-08-29
WO2000022611A9 (en) 2000-09-28
EP1125287A1 (de) 2001-08-22
US20020082828A1 (en) 2002-06-27
KR20010089293A (ko) 2001-09-29
WO2001020596A1 (en) 2001-03-22
US8452589B2 (en) 2013-05-28
US20160259541A1 (en) 2016-09-08
US6374225B1 (en) 2002-04-16
US7043433B2 (en) 2006-05-09
ATE371927T1 (de) 2007-09-15
US20130253921A1 (en) 2013-09-26
US7299184B2 (en) 2007-11-20

Similar Documents

Publication Publication Date Title
DE69937001T2 (de) Bereitstellung von nach benutzer-interesse gefilterten werken
US10614829B2 (en) Method and apparatus to determine and use audience affinity and aptitude
DE69503914T2 (de) Verfahren und vorrichtung zum erzeugen einer suchbaren digitalen videobibliothek
DE69718652T2 (de) Zeitbasiertes medienverarbeitungssystem und -verfahren
US20030124502A1 (en) Computer method and apparatus to digitize and simulate the classroom lecturing
DE202017105901U1 (de) Erleichtern der Erzeugung und Wiedergabe von durch den Anwender aufgezeichneten Audiosignalen
MXPA97002675A (en) System and method for examining digital audio / video data
DE60319710T2 (de) Verfahren und Vorrichtung zur automatischen Dissektion segmentierte Audiosignale
US12058410B2 (en) Information play control method and apparatus, electronic device, computer-readable storage medium and computer program product
CN116471266A (zh) 一种基于大数据的多媒体设备的远程管理系统及方法
CN113038259B (zh) 互联网教育的上课质量反馈方法及系统
DE19755863A1 (de) Versprachlichung von hypertextorientierten Graphical User Interfaces (GUIs) zur mobilen und stationären Nutzung
Lauer et al. Supporting Speech as Modality for Annotation and Asynchronous Discussion of Recorded Lectures
DE102004029673B4 (de) Verfahren und Anordnung zum Hören von ausgewählten Inhalten einer elektronischen Tageszeitung mit sprachgesteuerter Bedienerführung
DE102023120748A1 (de) Gesichtsbeachtende sprecher-diarisierung für transkripte und textbasierte videobearbeitung
TW202329000A (zh) 資料處理系統及其方法
CN117082293A (zh) 一种基于文字创意的视频自动生成方法和装置
JPWO2006117836A1 (ja) 感性語による情報検索方法およびその装置
Toklu et al. Image and audio sequence visualization and interaction mechanisms for structured video browsing and editing
Dorai Bridging the Semantic-Gap in E-Learning Media Management

Legal Events

Date Code Title Description
8364 No opposition during term of opposition