DE69230815T2 - Medien Handhabungssystem - Google Patents
Medien HandhabungssystemInfo
- Publication number
- DE69230815T2 DE69230815T2 DE69230815T DE69230815T DE69230815T2 DE 69230815 T2 DE69230815 T2 DE 69230815T2 DE 69230815 T DE69230815 T DE 69230815T DE 69230815 T DE69230815 T DE 69230815T DE 69230815 T2 DE69230815 T2 DE 69230815T2
- Authority
- DE
- Germany
- Prior art keywords
- multimedia
- characters
- pseudo
- text
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
- Digital Computer Display Output (AREA)
- User Interface Of Digital Computer (AREA)
Description
- Die Erfindung bezieht sich auf ein Textverarbeitungssystem zur Verarbeitung eines Dokumentes mit einem textlichen Inhalt und einem Multimedia-Inhalt, wobei das System Anzeigemittel zur seitenweisen Textanzeige für die Darstellung von textlichen Zeichen in einem textlichen Modus umfasst, unterstützt durch Textverarbeitungsmittel und Textspeichermittel und mit einer Benutzeroberfläche mit einer Reihe von Textmanipulationsaktionen, die durch mechanische Betätigung eines geeigneten Eingabemittels durch den Benutzer aktiviert werden können und die dann auf die angezeigten textlichen Zeichen wirken, und zur Anzeige des Multimedia-Inhalts in einem Multimedia-Modus, unterstützt durch Multimedia-Verarbeitungsmittel und Multimedia-Speichermittel und mit einer Benutzeroberfläche mit Multimedia-Manipulationsaktionen, die durch mechanische Betätigung eines geeigneten Eingabemittels durch den Benutzer aktiviert werden können und die dann auf den Multimedia-Einhalt wirken. Verschiedene professionelle und Personal- Computer verfügen über Textverarbeitungssysteme. Als Referenz sei hier als Beispiel der Artikel mit dem Titel "Common User Access Advanced Interface Design Guide" für das IBM Operating System/2 von IBM, Juni 1989, Dokument SY0328-300-R00-1089, Seite 33 -42, genannt. Der Text wird in Zeichenform in Übereinstimmung mit einem oder mehreren Formaten - frei-formatierbar, verbunden oder nicht-verbunden - dargestellt. Die Manipulationsaktionen wurden in großer Vielzahl entworfen, wie im folgenden beschrieben wird. Auf diese Weise kann die Formatierung des Textes auf in vielerlei unterschiedliche Weise auf Zeichen-, Wort-, Zeilen, Block-, Fenster-, Absatz- oder Seitenebene oder auf einer anderen Ebene erfolgen, während verschiedene Aktionen wie Einfügen, Löschen, Ausschneiden und Kopieren und andere nützlich sind. Bei der Durchführung dieser Aktionen hat sich die mehrschichtige Struktur der Textdarstellung als nützlich erwiesen. Die am häufigsten benutzten Eingabegeräte auf der Basis einer derartigen mechanischen Betätigung durch den Benutzer sind die Tastatur und die Maus. Es können aber auch verschiedene andere Geräte benutzt werden, zum Beispiel Rollkugel, Berührungsbildschirm oder Schreibnadel.
- In der Referenzschrift "An Interpersonal Multimedia Visualization System" von R. Phillips, IEEE Computer Graphics and Applications, Band 11, Nr. 3, Mai 1991, New York, USA, Seite 20-27, wird ein System beschrieben, bei dem ein Dokument zusätzlich zu einem gewöhnlichen Text eine Reihe von andersartigen Komponenten enthalten kann. Zu diesen anderen Arten von Inhalten gehören Standbilder, Graphiken, Audio- und Video-Informationen. Das bekannte System stellt eine solche Komponente auf integrale Weise dar, d. h. die Komponente wird als einzelne Einheit behandelt. Das System kann die Komponente in dem Dokument als direkte Wiedergabe darstellen. Ein Standbild oder eine Graphik wird zum Beispiel an dem geeigneten Ort als ein Bild dargestellt, das direkt den Inhalt der Komponente zeigt. Alternativ kann das System ein Symbol anzeigen, das auf die Anwesenheit dieser anderen Komponente hinweist, ohne ihren Inhalt direkt darzustellen. In diesem Fall wird durch die Aktivierung des Symbols die Wiedergabe der entsprechenden Komponente gestartet, z. B. kann durch Anklicken eines Sprachsymbols der aufgezeichnete Inhalt abgespielt werden. Die anderen Arten von Komponenten in dem bekannten System werden als spezielle Objekte angezeigt, die sich auf das Objekt beziehen, welches den Text darstellt. Eine solche Komponente unterliegt dem gleichen Ausschneide-, Kopier- und Einfüge-Paradigma wie Text und kann daher wie ein Wort behandelt werden. Eine Komponente kann als Ganzes ausgeschnitten, kopiert oder eingefügt werden. Für das Editieren des Inhalts einer Komponente ist eine spezielle Editierfunktion erforderlich, die für die jeweilige Art der Komponente geeignet ist.
- Die Erfindung hat unter anderem zur Aufgabe, die Darstellung von anderen Kommunikationsmedien und ihre Verarbeitung mit Hilfe einer Schnittstelle zu unterstützen, die in einem erheblichen Maße für die genannten verschiedenen Medien einheitlich ist. Gemäß einem ihrer Aspekte erfüllt die Erfindung diese Aufgabe in einem System, das dadurch gekennzeichnet ist, dass das genannte Anzeigemittel im Multimedia-Modus vorgesehen ist, um den Multimedia-Inhalt als eine Reihe von Pseudo-Zeichen zeilenweise anzuzeigen, wobei die Reihe von Pseudo-Zeichen eine zeitliche Organisation der betreffenden Teile des gespeicherten Multimedia-Inhalts darstellen, und dadurch, dass die Multimedia- Manipulationsaktionen eine erste Multimedia-Untergruppe, die einer ersten textlichen Untergruppe der Gruppe von Text-Manipulationsaktionen entspricht, für die Anwendung auf die angezeigten Pseudo-Zeichen umfassen, wobei diese Multimedia-Manipulationsaktionen in einer Weise auf die Pseudo-Zeichen wirken, die analog zu der Wirkungsweise der entsprechenden Text-Manipulationsaktionen auf die textlichen Zeichen ist und wobei das Ergebnis dieser Multimedia-Manipulationsaktionen für ein bestimmtes Pseudo-Zeichen sich auf den gespeicherten Multimedia-Inhalt auf der Basis der Darstellung des bestimmten Pseudo-Zeichens von einem Teil des Multimedia-Inhalts auswirkt. In einer Ausführungsform umfasst der Multimedia-Modus einen Audio-Anzeigemodus und der Multimedia- Inhalt enthält Audio-Informationen. Die Zeitsequenz der Audio-Informationen gibt den Fortschritt ihrer Anzeige in aufeinanderfolgenden Zeilen vor. Der leichteren Zugänglichkeit halber wird das Audiosignal in Form von Pseudo-Zeichen wie kleinen Blöcken dargestellt, deren Höhe der Audio-Intensität entspricht. Insbesondere fungieren Leerzeichen als Trennzeichen zwischen zusammenhängenden Audiosegmenten, die durch eine Pause getrennt sind. Eine solche Pause kann erkannt werden, wenn sie in dem Audio-Eingangssignal auftritt, zum Beispiel am Ende eines Wortes oder eines Satzes. In einer alternativen Realisierung ist jedes Pausezeichen ein Standardvorgabe-Objekt, bei dem selektiv Audio- Informationen an ausgewählten Stellen eingegeben werden kann, d. h. zu bestimmten Zeitpunkten, eingegeben werden, zum Beispiel beim Ausfüllen eines Formulars oder eines Fragebogens mit Audio-Antworten. Auf diese Weise wird die Audio-Eingabe tatsächlich als Text-Metaphore verarbeitet. Die Übereinstimmung zwischen den verschiedenen Aktivierungen macht einem erfahrenen Benutzer das Leben leichter. Auf der anderen Seite braucht die Abbildung von verschiedenen Manipulationsoperationen auf verschiedene Eingabegeräte bei Text und Audio-Informationen nicht einheitlich zu sein. Tatsächlich können bei einem einzelnen Objekt gewisse Manipulationen im Gegensatz zu anderen Manipulationen und/oder anderen Objekten auf ein bestimmtes Eingabegerät beschränkt sein.
- Vorteilhafterweise ist die genannte Audio-Information eine Stimme auf einer zeilenweisen Anzeigeskala, die mit der Textanzeige vergleichbar ist und Trennzeichen als Signalisierung von erkannten Stummpassagen umfasst. Die Dauer eines Wortes oder einer Textzeile würde dann hinsichtlich des Anzeigeplatzes der Anzeige von ebenso vielen Zeichen in textlicher Darstellung entsprechen. Diese Übereinstimmung des physikalischen Platzbedarfs wäre für den Benutzer leicht erkennbar. Die Stummpassagen-Trennzeichen entsprechen dem Ende von Worten oder Sätzen in einem geschriebenen Text.
- Vorteilhafterweise hat das genannte Anzeigemittel einen Fax-Anzeigemodus auf der Basis einer zeilenweisen Darstellung des genannten Faxschreibens, wobei der genannte Fax-Modus mindestens eine zweite Untergruppe der Gruppe von Text- Manipulationsaktionen aufweist, die auf einen angezeigten Faxbereich auf ähnliche Weise wirken wie auf angezeigten Text. Fax ist definiert als ein Text, der durch ein Punktraster dargestellt wird, wobei der Zeichen/Wort-Gehalt oder das Format in beliebigem Maße unbestimmt sein können, und wobei im Prinzip jedes zweidimensionale Format zulässig ist. Es hat sich gezeigt, dass das Zusammenstellen in einer Fax-Seite ebenfalls vorteilhaft wäre, zum Beispiel Versenden eines Textes zusammen mit nicht-textlichem Material, Ergänzen des empfangenen Faxschreibens durch maschinengeschriebenen Text, Verschieben von Teilen einer Faxseite in Bezug auf andere Teile, und vieles mehr. Die Untergruppen der Aktionen bezüglich Audio-Informationen und Faxseiten können, aber müssen nicht, identisch sein. Der Unterschied zwischen Text- und Fax-Informationen besteht darin, dass das System die Bedeutung der Fax-Informationen nicht kennt. Selbst mit Hilfe einer Zeichenerkennungsfunktion ist nur ein ungefähres Wissen vorhanden.
- Vorteilhafterweise verfügt das genannte System über Schrägekorrekturmittel, um unter Benutzersteuerung die Schräge einer bestimmten Faxzeile zu korrigieren. Die Wortauswahl ist möglich, wenn die Schräge über die Wortlänge klein ist, was üblicherweise der Fall ist. Die Zeilenauswahl ist möglich, wenn die Schräge über die Zeilenlänge im Verglich zur Zeilenhöhe klein ist. Wenn dies nicht der Fall ist, kann der Bediener die Schräge manuell korrigieren; prozessorinterne Algorithmen, die recht elementar sind, wurden in den US-amerikanischen Patentschriften 4.618.991 und 4.759.076 beschrieben. In diesen Referenzen wurde jedoch kein Editieren im Sinne der vorliegenden Erfindung genannt.
- Vorteilhafterweise verfügt das genannte System über Orientierungserkennungsmittel zum Erkennen einer lokalen Orientierung einer angezeigten Faxtextzeile, damit eine Wort- und/oder Zeilenauswahl durch die genannten Aktionen auf einer dergestalt erkannten Zeile möglich wird. Während der frühere Lösungsansatz funktioniert, wenn die erforderliche Justierung nicht zu groß ist (zum Beispiel bis zu etwa 20º) und mehr oder weniger gleichmäßig für die Seite ist, könnten Probleme auftreten, wenn die Schräge sehr groß (bis zu 90º) und/oder äußerst ungleichmäßig über die Seite ist, wie dies bei handschriftlichen Texten vorkommen könnte. In diesem Fall wird die Orientierung der Zeile erkannt, wie in der US-amerikanischen Patentschrift 4.723.297 beschrieben, was im Prinzip separat für jede Zeile erfolgen kann. Der Erkennung kann eine Korrektur folgen, wenn diese durchführbar ist, oder das Editieren kann direkt in der schiefen, unkorrigierten Zeile vorgenommen werden.
- Verschiedene vorteilhafte Aspekte werden in den abhängigen Ansprüchen aufgeführt.
- Die Erfindung wird im folgenden anhand der beigefügten Figuren näher beschrieben. Es zeigen:
- Fig. 1 eine allgemeine Darstellung eines Computersystems;
- die Fig. 2 bis 7 verschiedene Anzeigeformate.
- Fig. 1 zeigt eine allgemeine Darstellung eines tastatur-orientierten Computersystems. Es gibt eine Seitenanzeige 20. Abgebildet sind ein Vordergrundfenster 22, ein teilweise verdecktes Fenster 24 und ein Cursor 26. Die Anzeige kann auf einem Standard-Zeichensatz beruhen oder hochauflösend sein, wenn für jedes Zeichen ein beliebiges Pixelmuster gewählt werden kann. Der Prozessor 28 kann Textverarbeitung ebenso wie System-Software ausführen. Der Speicher 30 speichert anzuzeigende und andere Daten. Die Tastatur 32 erhält Benutzerbetätigungen, die in Systemaktionen umgesetzt werden müssen. Die Maus 34 kann benutzt werden, um absolute oder differentielle Positionen in Verbindung mit Klickbetätigungen von einer der vier Tasten 42 einzugeben. Der Block 44 stellt ein Mikrofon mit zugehörigem Umwandlungsmechanismus für n-bit Audio-Samples dar, die codiert, moduliert, gefiltert und gegebenenfalls in einem Spracherkennungs- Teilsystem benutzt werden können. Der Wert von n hängt ebenso wie die Frequenz der Samples, die Audio-Verarbeitung und andere für digitale Audio-Informationen relevante Technologien von der beabsichtigten Qualität ab. Der Block 46 stellt einen Lautsprecher dar, der digital empfangene Audio-Samples über Fehlererkennung, Demodulation und Digital-Analog-Umsetzung in kontinuierliche Audio-Informationen ausgeben kann. Zusätzlich kann das Audiosignal analog bleiben, wenn es editierbar auf einem geeigneten Medium gespeichert wird. Im Prinzip kann sämtliches Audio-Editieren auf einer analoger Ebene erfolgen, zum Beispiel Ersetzen, Einfügen, Überspielen, Ausblenden und Überlagern, insofern sich die eigentliche Erfindung auf die Schnittstellenbildung zur Signalisierung von Audio-Informationen bezieht. In der Figur wurde keine analoge Speicherung vorgesehen und alle Operationen sind digital. Außerdem verbinden die Kommunikationsleitungen 36, 38 und 40 die dargestellten Teilsysteme. Die abgebildete Konfiguration kann in jedem realisierbaren Maß erweitert oder reduziert werden, und zwar mit Hilfe von:
- - Hintergrundspeicher
- - Externer Datenkommunikation
- - Angepasster Funktionalität der Teilsysteme
- - Weiteren E/A, zum Beispiel Graphik-E/A (im folgenden auch - Maus - genannt, zum Beispiel Soft-Tasten, Joystick)
- - Anderen Speichermedien, zum Beispiel Magnetband
- - Anderen Kommunikationsmustern anstelle von 36, 38 und 40.
- Der Übersichtlichkeit halber ist in Fig. 1 nicht die Umwandlung von Audio-Informationen in Pseudo-Zeichen dargestellt. In Übereinstimmung mit verschiedenen Unterscheidungs-Schwellwerten für die durchschnittliche Audio-Amplitude können die Pseudo-Zeichen in der vorliegenden Ausführungsform eine von vier Höhen ungleich null haben, wie in den Fig. 2 bis 7 dargestellt. Natürlich sind auch andere Zahlen möglich. Die Umsetzung einer bestimmten digitalisierten Amplitude in eine geometrische Darstellung erfolgt durch Umwandeln der Amplitude in einen Adresscode für einen Zeichengenerator, der ein Pseudo-Zeichen auf die gleiche Weise erzeugt wie Standardzeichen. Andere Darstellungen sind realisierbar, zum Beispiel Punkte von unterschiedlichem Durchmesser (der Durchmesser ist jetzt mit der Amplitude verknüpft), Blöcke mit verschiedenen Graustufen und/oder Farben, oder andere. Die Abbildung von Audio-Informationen auf die Pseudo-Zeichen kann zweidimensional sein, zum Beispiel durch Unterscheidung von Audiopegel und Audio-Tonhöhe. Dies würde zum Beispiel einen Dialog zwischen einer männlichen und einer weiblichen Stimme deutlich machen. Die Abbildungskoordinaten könnten jetzt sowohl Größe als auch Farbe der Pseudo-Zeichen sein.
- In den Fig. 2 bis 7 sind verschiedene Anzeigeformate dargestellt. Fig. 2 ist ein Textformat, zum Beispiel mit 53 Zeilen von jeweils 65 Zeichen. In dem Beispiel sind die Zeichen in Druckschrift links- und rechtsbündig angeordnet, mit gleichmäßiger Periodizität und einheitlicher Zeilenhöhe. Der Inhalt dieser Seite ist irrelevant für die Erfindung, ebenso wie für ihre Beschreibung. Das Format braucht allerdings nicht gleichmäßig zu sein. Es kann auch durch eine Formbeschreibung anstelle der Form selbst vorgegeben werden, wie dies bei dem bekannten Postscript® System der Fall ist.
- Fig. 3 zeigt ein Sprachformat. Jedes Zeichen stellt eine Sprechdauer von ca. 1/20 Sekunde dar. Die Höhe eines Blocks entspricht der Amplitude oder Energie des Sprachsegmentes. Die Pseudo-Zeichen haben in etwa die gleiche Breite wie die Zeichen aus Fig. 2. Eine unterbrochene Linie gibt die zusammenhängende Folge an. Andere Darstellungen sind möglich. Farbe könnte die angehobene Tonhöhe zum Beispiel am Ende einer Frage darstellen. Auch andere Eigenschaften der Stimme können angegeben werden, zum Beispiel können die betreffenden Sprecher in einem Gespräch jeweils eine eigene Farbe haben. Neben der Höhe wären auch andere Formen von Pseudo-Zeichen möglich, um verschiedene natürliche oder künstliche Eigenschaften anzugeben. Beispiele sind Markierungen für Ende des Satzes, Echo und maschinenerzeugte Sprache im Vergleich zu aufgezeichneter Sprache. Die Darstellung kann für Sprache, Musik, Klang von Tieren, Klang von Maschinen, Hintergrundgeräusche von Maschinen, natürliche Geräusche und anderes verwendet werden.
- Fig. 4 zeigt ein Fax-Format, das in standardmäßigen horizontalen Linien organisiert und mit Wortrastern versehen ist. Das Fax kann dargestellt werden, wie es empfangen oder erstellt wurde. Alternativ kann es als eine Folge von Blöcken mit unterschiedlicher Länge dargestellt werden. Ein solcher Block, der selbst als Pseudo-Zeichen betrachtet werden kann, kann durch einen bekannten Segmentierungsalgorithmus erkannt werden. Diese Pseudo-Zeichen können auf ähnliche Weise dargestellt werden wie unter Bezugnahme auf die Audio-Informationen weiter oben erläutert. Der Inhalt der Fax-Meldung selbst ist irrelevant für die vorliegende Erfindung, ebenso wie für ihre Beschreibung. Der Vorteil der Verwendung derartiger Pseudo-Zeichen besteht darin, dass zum Beispiel der Inhalt der Fax-Nachricht einem Bediener (der nur bestimmte Teile auswählt oder eine andere Textverarbeitung durchführt, für die der Inhalt des Textes nicht bekannt zu sein braucht) unbekannt bleiben kann. Ein weiteres Beispiel ist, dass eine derartige Darstellung die Leerstellen diskret zeigt, selbst wenn der volle Text zu Unklarheiten führen könnte. Das dargestellte Raster kann weggelassen werden, wenn dies von Vorteil ist. Die Darstellung kann eine Kombination des Fax-Textes selbst mit der Blockstruktur sein. Es ist möglich, zwischen den beiden Darstellungen zu wechseln. Der Fall von schiefen Zeilen wurde bereits weiter oben erörtert. Das Fax kann eine Kombination von Text oder Texten (mit jeweiligen Neigungswinkeln) und nicht-textlichem Material wie Abbildungen enthalten.
- Fig. 5 zeigt links eine Textseite mit einem sogenannten Audio-Schild darauf, das ein nicht-geöffnetes Sprachblatt in Form eines Symbols darstellt. In diesem Zustand ist es möglich, die gespeicherte Stimme, die sich auf dieses Blatt bezieht, wiederzugeben und auch eine neue Stimme (oder ein anderes Audiosignal) aufzunehmen, das dar aufhin zu diesem Blatt hinzugefügt wird. Das Aktivieren dieser Funktion erfolgt durch Zugreifen auf das Symbol 50, das ein stilisiertes Anführungszeichen darstellt. Allerdings bietet nur ein geöffnetes Blatt volle Editierfunktionen. Die rechte Seite der Anzeige zeigt verschiedene Objekte und Fenster, die für die vorliegende Erfindung irrelevant sind und mit der Maus aufgerufen werden können.
- Fig. 6 zeigt ein geöffnetes Sprachblatt, bzw. das Herunterschieben des dunklen Balkens auf der rechten Seite durch die ausgewählte Spalte in Bezug auf Fig. 5. Dieses geöffnete Blatt ermöglicht ein uneingeschränktes Editieren. Anstelle eines Textfonts gibt es einen Blockfont, der die Amplituden angibt. Oben links befindet sich ein Cursor ähnlich einem Textcursor. Die neue Eingabe (durch Aufnahme) wird an dieser Position eingefügt. Ebenso wie bei Text kann der Benutzer einen Teil anwählen und die Ausschneide-, Kopier- und Einfüge-Operationen verwenden. Hierdurch wird ein Audio-Editor geschaffen, der weit über einen Cassettenrecorder hinausgeht. Der Cursor kann durch einen Mausklick an eine bestimmte Position gebracht werden. Der Benutzer kann aber auch die Tatsache nutzen, dass sich der Cursor während der Wiedergabe bewegt. Durch Drücken von "Stop" bleibt der Cursor an der aktuellen Position.
- Wenn ein Teil gewählt wurde, ist der Befehl auf diese Auswahl beschränkt. Zum Beispiel möchte der Benutzer zuerst eine Auswahl hören, bevor er sich zum Ausschneiden entschließt. Fig. 7 zeigt durch invertierte Darstellung die Auswahl eines Segments, das ca. 6 1/2 Zeilen Pseudo-Zeichen umfasst.
- Die Tabellen 3a und 3b enthalten Übersichten zu verschiedenen Aktionen. Tabelle 3a zeigt die Aktionen und den Umfang einer Auswahl. In der linken Spalte ist dargestellt, dass das Auswählen durch eine bestimmte Klick-Operation erfolgen kann. Das Betätigen einer bestimmten Maustaste startet eine kurze Verzögerung, zum Beispiel 500 Millisekunden. Wenn innerhalb dieser Verzögerung ein weiteres Klicken erfolgt, wird die Anzahl der Klicks kumuliert. Wenn innerhalb dieser Verzögerung kein weiteres Klicken erfolgt, wird die kumulierte Summe bei einem nachfolgenden Klicken (auf eins) zurückgestellt. Die maximale Kumulierung in diesem Beispiel ist drei. In der rechten Spalte ist die Wirkung angegeben. Durch einzelnes Klicken wird die aktuelle Cursor-Position gewählt. Durch Doppelklicken wird das Wort oder Pseudo-Wort an der aktuellen Cursor-Position gewählt, das heißt das erste Leerzeichen in der linken und in der rechten Richtung fungiert als Begrenzung für die Auswahl. Durch dreifaches Klicken wird auf ähnliche Weise die gesamte Zeile von Zeichen oder Pseudo-Zeichen gewählt. In der letzten Zeile wird die Wirkung des Ziehens dargelegt. Beim Ziehen wird die Maustaste gedrückt gehalten, während die Maus (oder eher ihre Darstellung auf dem Bildschirm) zu einer gewünschten Zielposition bewegt wird. Sobald die Taste an irgendeiner Stelle losgelassen wird, ist dies die Zielposition. Durch das Ziehen werden alle (Pseudo-) Zeichen zwischen der Startposition und der Zielposition ausgewählt: das bedeutet, alle Zeichen rechts von der Startposition in der Zeile der Startposition und alle Zeichen links von der Zielposition in der Zeile der Zielposition sowie alle Zeichen in den dazwischenliegenden Zeilen komplett. Wenn die beiden Positionen in einer einzigen Zeile liegen, wird nur das Intervall in dieser Zeile gewählt. Im Prinzip könnte das Ziehen mit mehrfachem Klicken kombiniert werden, jedoch wurde dies nicht berücksichtigt.
- Tabelle 3b zeigt nun, was nach der Auswahl entsprechend dem Muster aus Tabelle 3a mit der Menge von (Pseudo-) Zeichen geschieht. Die Gruppe von Befehlen in der linken Spalte kann durch eine bestimmte spezielle Taste auf der Tastatur, durch eine software-definierte Taste auf der Tastatur oder durch eine Funktionstaste auf einem angezeigten Bildschirm-Tastenfeld aktiviert werden. Die Gruppe von Befehlen umfasst folgendes:
- a. schreiben/aufzeichnen (type/record): Die Zeichen in der gewählten Region werden von der Seite gelöscht und die neu eingegebenen oder aufgezeichneten Zeichen werden an der aktuellen Cursor-Position eingefügt, wobei der eigentliche Texte kontinuierlich entsprechend verschoben wird.
- b. Befehl CUT (ausschneiden): Hiermit werden alle gewählten (Pseudo-) Zeichen gelöscht, der (Pseudo-) Text entsprechend verschoben und die ausgewählten Informationen in die sogenannte Zwischenablage (CLIPBOARD) gebracht, bei der es sich um einen besonderen speziellen Speicherbereich handelt, der immer direkt über die Tastatur zugänglich ist. Wenn mehrere Fenster in Folge aktiviert wurden, bleiben die Informationen in der Zwischenablage immer mit demjenigen Fenster verknüpft, aus dem diese Informationen stammen. Die Zwischenablage selbst bietet keine fenster-übergreifende Transportmöglichkeit. Wenn eine solche Transportmöglichkeit benötigt wird, ist ein spezieller zusätzlicher Befehl erforderlich, um die gelöschten Zeichen direkt mit dem Zielfenster in Zusammenhang zu bringen, das dann direkt betätigt werden muss. Wenn nacheinander eine Folge von CUT-Befehlen erteilt wird, werden die gelöschten Informationen stapelweise gespeichert und können in der Reihenfolge Last-in-First-out abge rufen werden. Bei einer anderen Ausführung könnte jedoch eine First-in-First-out- Organisation vorzuziehen sein.
- c. Befehl COPY (kopieren): Hiermit werden die ausgewählten Informationen auf ähnliche Weise in die Zwischenablage gebracht, jedoch ohne dass die ausgewählten Informationen von ihrem ursprünglichen Ort gelöscht werden.
- d. Befehl PASTE (einfügen): Wenn anwendbar, werden die ausgewählten Informationen gelöscht (wenn mehr als ein Pseudo-Zeichen ausgewählt wurde) und die Informationen aus der Zwischenablage an der (den) auf diese Weise angewählten Position(en) eingefügt. Wenn die letztgenannten Informationen zu viel Platz in Anspruch nehmen, wird durch das Einfügen die Menge der Informationen anwachsen. Auf der anderen Seite nimmt die Informationsmenge ab, wenn die neuen Informationen weniger sind als die ursprünglichen Informationen.
- e. Befehl DELETE (löschen): Die gewählten Informationen werden gelöscht und die nachfolgenden Informationen rücken auf.
- Natürlich können die Informationen auf verschiedene andere Weisen manipuliert werden als oben unter Bezugnahme auf die Teilgruppe von Aktivierungen beschrieben, jedoch dennoch in Kombination hiermit. Die Fax-Informationen können zum Beispiel unterstrichen werden. Audio-Informationen können zum Beispiel überspielt werden, ihre Lautstärke kann herausgeschnitten werden und so weiter. Dies könnte entweder im Kontext erfolgen, wo die Pseudo-Zeichen des zugehörigen Kommunikationsmediums auftreten, oder in einer vollkommen getrennten Anordnung.
- Die einheitliche Schnittstelle für verschiedene Kommunikationsmedien bietet also eine bessere Zugänglichkeit. Der Kürze halber wurde die Software nicht ausführlich beschrieben, da diese als eng mit der Software für die reine Textverarbeitung verwandt angesehen wird, die standardmäßig in verschiedenen Paketen enthalten ist, die im Handel erhältlich sind.
Claims (10)
1. Textverarbeitungssystem zur Verarbeitung eines Dokumentes mit einem
textlichen Inhalt und einem Multimedia-Inhalt, wobei das System Anzeigemittel zur
seitenweisen Textanzeige
- für die Darstellung von textlichen Zeichen in einem textlichen Modus umfasst,
unterstützt durch Textverarbeitungsmittel und Textspeichermittel und mit einer
Benutzeroberfläche mit einer Reihe von Textmanipulationsaktionen, die durch mechanische
Betätigung eines geeigneten Eingabemittels durch den Benutzer aktiviert werden
können und die dann auf die angezeigten textlichen Zeichen wirken, und
- für die Anzeige des Multimedia-Inhalts in einem Multimedia-Modus, unterstützt durch
Multimedia-Verarbeitungsmittel und Multimedia-Speichermittel und mit einer
Benutzeroberfläche mit Multimedia-Manipulationsaktionen, die durch mechanische
Betätigung eines geeigneten Eingabemittels durch den Benutzer aktiviert werden können und
die dann auf den Multimedia-Einhalt wirken,
dadurch gekennzeichnet,
dass das genannte Anzeigemittel im Multimedia-Modus vorgesehen ist, um den
Multimedia-Inhalt als eine Reihe von Pseudo-Zeichen zeilenweise anzuzeigen, wobei die Reihe von
Pseudo-Zeichen eine zeitliche Organisation der betreffenden Teile des gespeicherten
Multimedia-Inhalts darstellen, und dadurch, dass die Multimedia-Manipulationsaktionen eine
erste Multimedia-Untergruppe, die einer ersten textlichen Untergruppe der Gruppe von
Text-Manipulationsaktionen entspricht, für die Anwendung auf die angezeigten Pseudo-
Zeichen umfassen, wobei diese Multimedia-Manipulationsaktionen in einer Weise auf die
Pseudo-Zeichen wirken, die analog zu der Wirkungsweise der entsprechenden Text-
Manipulationsaktionen auf die textlichen Zeichen ist und wobei das Ergebnis dieser
Multimedia-Manipulationsaktionen für ein bestimmtes Pseudo-Zeichen sich auf den
gespeicherten Multimedia-Inhalt auf der Basis der Darstellung des bestimmten Pseudo-Zeichens von
einem Teil des Multimedia-Inhalts auswirkt.
2. Textverarbeitungssystem nach Anspruch 1, wobei der genannte Multimedia-
Modus einen Audio-Anzeigemodus umfasst, um die Pseudo-Zeichen, die die jeweiligen
Teile von gespeicherten Audio-Informationen darstellen, anzuzeigen, und wobei die
Multimedia-Manipulationsaktionen eine zweite Multimedia-Untergruppe, die einer zweiten
Untergruppe der Gruppe von Text-Manipulationsaktionen entspricht, für die Bearbeitung
der angezeigten Pseudo-Zeichen umfassen.
3. Textverarbeitungssystem nach Anspruch 2, wobei die genannte Audio-
Information eine Stimme auf einer zeilenweisen Anzeigeskala, die mit der Textanzeige
vergleichbar ist und Trennzeichen als Signalisierung von erkannten Stummpassagen
umfasst.
4. Textverarbeitungssystem nach Anspruch 2 oder 3, wobei der genannte
Multimedia-Modus einen Fax-Anzeigemodus umfasst, um die Pseudo-Zeichen, die die
jeweiligen Teile eines gespeicherten Faxschreibens darstellen, anzuzeigen, und wobei die
Multimedia-Manipulationsaktionen eine dritte Multimedia-Untergruppe, die einer dritten
Untergruppe der Gruppe von Text-Manipulationsaktionen entspricht, für die Bearbeitung von
angezeigten Pseudo-Zeichen umfassen.
5. Textverarbeitungssystem nach Anspruch 1, wobei der genannte Multimedia-
Modus einen Fax-Anzeigemodus umfasst, um die Pseudo-Zeichen, die die jeweiligen Teile
eines gespeicherten Faxschreibens darstellen, anzuzeigen, und wobei die Multimedia-
Manipulationsaktionen eine vierte Multimedia-Untergruppe, die einer vierten Untergruppe
der Gruppe von Text-Manipulationsaktionen entspricht, für die Bearbeitung von
angezeigten Pseudo-Zeichen umfassen.
6. Textverarbeitungssystem nach Anspruch 4 oder 5 mit
Schrägekorrekturmittel, um unter Benutzersteuerung die Schräge einer bestimmten Faxzeile zu korrigieren.
7. Textverarbeitungssystem nach Anspruch 4 oder 5 mit
Orientierungserkennungsmittel zum Erkennen einer lokalen Orientierung einer angezeigten Faxtextzeile, damit
eine Wort- und/oder Zeilenauswahl durch die genannten Aktionen auf einer dergestalt
erkannten Zeile möglich wird.
8. Textverarbeitungssystem nach einem der Ansprüche 4 bis 7, wobei das
genannte Fax zeilenweise in Form weiterer Pseudo-Zeichen dargestellt ist.
9. Textverarbeitungssystem nach Anspruch 4, wobei die genannte zweite und
die genannte dritte Untergruppe identisch sind.
10. Textverarbeitungssystem nach einem der Ansprüche 1 bis 9, wobei den
genannten Pseudo-Zeichen zwei variable Attribute zugeordnet sind, zum Beispiel 6röße und
Farbe.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP91201804 | 1991-07-11 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE69230815D1 DE69230815D1 (de) | 2000-04-27 |
| DE69230815T2 true DE69230815T2 (de) | 2000-11-02 |
Family
ID=8207772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE69230815T Expired - Fee Related DE69230815T2 (de) | 1991-07-11 | 1992-07-03 | Medien Handhabungssystem |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US6456274B1 (de) |
| JP (1) | JPH05197505A (de) |
| KR (1) | KR100294434B1 (de) |
| DE (1) | DE69230815T2 (de) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20050071786A1 (en) * | 1995-06-07 | 2005-03-31 | Microsoft Corporation | Timing and distance control for displaying dynamic information |
| US6915258B2 (en) * | 2001-04-02 | 2005-07-05 | Thanassis Vasilios Kontonassios | Method and apparatus for displaying and manipulating account information using the human voice |
| US7899674B1 (en) * | 2006-08-11 | 2011-03-01 | The United States Of America As Represented By The Secretary Of The Navy | GUI for the semantic normalization of natural language |
| US20090082887A1 (en) * | 2007-09-23 | 2009-03-26 | International Business Machines Corporation | Method and User Interface for Creating an Audio Recording Using a Document Paradigm |
| US8990088B2 (en) * | 2009-01-28 | 2015-03-24 | Microsoft Corporation | Tool and framework for creating consistent normalization maps and grammars |
| JP2012133250A (ja) * | 2010-12-24 | 2012-07-12 | Sony Corp | 音情報表示装置、音情報表示方法およびプログラム |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4972486A (en) * | 1980-10-17 | 1990-11-20 | Research Triangle Institute | Method and apparatus for automatic cuing |
| NL8200726A (nl) * | 1982-02-24 | 1983-09-16 | Philips Nv | Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. |
| US4779209A (en) * | 1982-11-03 | 1988-10-18 | Wang Laboratories, Inc. | Editing voice data |
| DE3419063A1 (de) | 1983-05-23 | 1984-11-29 | Hitachi, Ltd., Tokio/Tokyo | Verarbeitungsverfahren fuer die drehung eines bildes |
| US5359695A (en) * | 1984-01-30 | 1994-10-25 | Canon Kabushiki Kaisha | Speech perception apparatus |
| US4723297A (en) | 1984-09-27 | 1988-02-02 | Siemens Aktiengesellschaft | Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results |
| JPS61199175A (ja) | 1985-02-28 | 1986-09-03 | Mitsubishi Electric Corp | イメ−ジの任意角度回転方式 |
| US4910765A (en) * | 1986-04-30 | 1990-03-20 | Ricoh Company, Ltd. | Communication terminal apparatus having a relaying function |
| US4837831A (en) * | 1986-10-15 | 1989-06-06 | Dragon Systems, Inc. | Method for creating and using multiple-word sound models in speech recognition |
| JPH02110658A (ja) * | 1988-10-19 | 1990-04-23 | Hitachi Ltd | 文書編集装置 |
| JP2829006B2 (ja) * | 1988-11-10 | 1998-11-25 | 株式会社リコー | 画像処理装置 |
| US5191612A (en) * | 1990-03-13 | 1993-03-02 | Fujitsu Limited | Character recognition system |
-
1992
- 1992-07-03 DE DE69230815T patent/DE69230815T2/de not_active Expired - Fee Related
- 1992-07-09 JP JP4182506A patent/JPH05197505A/ja active Pending
- 1992-07-11 KR KR1019920012359A patent/KR100294434B1/ko not_active Expired - Fee Related
-
1997
- 1997-10-16 US US08/951,291 patent/US6456274B1/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| KR100294434B1 (ko) | 2001-09-17 |
| US6456274B1 (en) | 2002-09-24 |
| DE69230815D1 (de) | 2000-04-27 |
| KR930002972A (ko) | 1993-02-23 |
| JPH05197505A (ja) | 1993-08-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69220583T2 (de) | Vorrichtung zum Anzeigen von Gebieten auf einem Sichtgerät | |
| DE3121503C2 (de) | Dokumenten-Verarbeitungssystem | |
| DE3881331T2 (de) | Flexible Fensterverwaltung auf einer Rechneranzeige. | |
| DE3586342T2 (de) | Anlage fuer automatische auspassung und aufbereitung handgeschriebener textbilder. | |
| DE69424462T2 (de) | Gerät und Verfahren zur Wiedergabe von kontinuierlichen Daten | |
| DE69733162T2 (de) | Datenübertragungssystem | |
| DE4301766C2 (de) | Verfahren zum Darstellen eines doppelseitigen, umwendbaren elektronischen Papiers | |
| DE69933404T2 (de) | System und Verfahren zum gemeinsamen Benutzen von Fonts und Speichermedium für das Programm zum Ausführen des Verfahrens | |
| DE69805536T2 (de) | Datenaufzeichnungsgerät | |
| DE69637487T2 (de) | Multimediabasiertes Berichtsystem mit Aufnahme und Wiedergabe von dynamischen Kommentaren | |
| DE69528885T2 (de) | Software-notizen | |
| DE69225760T2 (de) | Methode und System zur Unterstützung von mehrfacher Textselektion und "swipe and type" Operationen auf einer Rechneranzeige | |
| DE69129364T2 (de) | Vorrichtung zur interaktiven Behandlung von Objekten | |
| DE3729023C2 (de) | Bildbearbeitungsgerät | |
| DE3338385C2 (de) | ||
| DE69317153T2 (de) | Elektronische Schreibtafel | |
| DE3689858T2 (de) | Verfahren zur Manipulation von Unterobjekten in einem interaktiven Zeichnengraphiksystem. | |
| DE69422910T2 (de) | Zeitabhängige scriptfolgen | |
| DE602004005216T2 (de) | Dokumentenscanner | |
| DE2233891A1 (de) | Elektronische textdarstellanordnung, die eine schreibmaschine simuliert | |
| DE19740119A1 (de) | System zum Schneiden digitaler Video- und Audioinformationen | |
| DE2852849A1 (de) | Dateneingabeeinrichtung fuer akzentierte und nicht akzentierte schriftzeichen | |
| DE2144596A1 (de) | Video-Anzeigevorrichtung | |
| DE2352131A1 (de) | Textverarbeitungs-schreibautomat | |
| DE3838729C2 (de) | Dokumentverarbeitungsgerät |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 8364 | No opposition during term of opposition | ||
| 8339 | Ceased/non-payment of the annual fee |