DE68928068T2 - Verfahren und Apparat zum Formatieren von Dokumenten - Google Patents

Verfahren und Apparat zum Formatieren von Dokumenten

Info

Publication number
DE68928068T2
DE68928068T2 DE68928068T DE68928068T DE68928068T2 DE 68928068 T2 DE68928068 T2 DE 68928068T2 DE 68928068 T DE68928068 T DE 68928068T DE 68928068 T DE68928068 T DE 68928068T DE 68928068 T2 DE68928068 T2 DE 68928068T2
Authority
DE
Germany
Prior art keywords
document
formatting
command codes
codes
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE68928068T
Other languages
English (en)
Other versions
DE68928068D1 (de
Inventor
Miwako Doi
Mika Fukui
Isamu Iwai
Yoichi Takebayashi
Koji Yamaguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Application granted granted Critical
Publication of DE68928068D1 publication Critical patent/DE68928068D1/de
Publication of DE68928068T2 publication Critical patent/DE68928068T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Document Processing Apparatus (AREA)
  • Facsimile Scanning Arrangements (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und ein Gerät zum Formatieren eines Dokuments gemäß den Strukturen des Dokuments.
  • In letzter Zeit sind beachtliche Fortschritte beim Desktop- Publishing bzw. bei der rechnerunterstützten Druckvorlagengestaltung sowie bei Prozessoren für japanische Worte zusätzlich zu den Fortschritten bei den Ausgabevorrichtungen, wie beispielsweise bei den Anzeigegeräten und Druckern, gemacht worden, was es ermöglichte, Dokumente auf sehr viel unterschiedlichere und effektivere Weisen herzustellen.
  • Jedoch erfordert ein Herstellen von Dokumenten, die sowohl gut aussehen als auch leicht lesbar sind, ein genaues Verstehen von Operationen, Befehlen und Formatierungen eines Dokumentenformatiergeräts, das zu verwenden ist, was es für jene ohne formales Üben fast unmöglich macht, ein derartiges Dokumentenformatiergerät zu bedienen.
  • Als Lösung dieser Situation sind Fortschritte beim Entwickeln eines automatischen Dokumentenformatiersystems gemacht worden, das eine automatisch extrahierte logische Struktur eines Dokuments verwendet, und zwar zusammen mit einem Dokumentenformatiersystem, das numerische Zeichen und Absätze gemäß automatisch abgeleiteter Referenzbezüge zwischen numerischen Zeichen und Absätzen anordnen kann.
  • Obwohl solche logischen Strukturen und Referenzbezüge im allgemeinen dazu ausreichen, eine strukturelle Information auf dem Dokument zu erzeugen, die zum effektiven Formatieren nötig ist, können in menschlichen Sprachen enthaltene Vieldeutigkeiten zu einem Mißverständnis bezüglich der logischen Strukturen und Referenzbezüge führen. Abgesehen von diesem Problem können weiterhin Ausgaben dieses automatischen Dokumentenformatiergeräts personelle oder zeitliche Anforderungen eines Benutzers nicht erfüllen.
  • Andererseits gibt es Dokumentenformatiersysteme, die Befehlscodes verwenden, die die Art der zum Dokument gehörenden Formatierung anzeigen, wie beispielsweise "Roff ". In allerletzter Zeit erschienen Dokumentenformatiersysteme, wie beispielsweise "scribevi oder "TEX" (Merkmale des TEX- Systems können in D.E. Kuuth: "The Textbook", Addison-Weshley Publishing company, Oktober 1984, S. 7-11, 19-21, 37-41, 85-89, 101, 339-365 gefunden werden), welche unabhängige Dokumentendaten und Formatierungsdaten haben, so daß eine Änderung der Befehlscodes bezüglich der Formatierungsdaten auf einmal durchgeführt werden können, ohne nach jedem zugehörigen Befehlscode zu suchen, wie bei "Roff". Darüber hinaus können "Scribe" und "TEX" eine kompliziertere Formatierung als andere Systeme durchführen. Aber bei diesen Dokumentenformatiersystemen ist ein genaues Verstehen der Befehlscodes für ein geschicktes Zuwerkegehen unverzichtbar. Darüber hinaus ist selbst bei "Scribe" und "TEX" ein Einbinden von Befehlscodes nötig, was schnell ermüdend werden kann. Obwohl automatische Dokumentenformatiergeräte, die oben angegeben sind, frei von solchen Problemen sind, die Befehlscodes betreffen, sind sie, wie es oben beschrieben ist, anfällig für ein Mißverständnis bezüglich der logischen Strukturen und Referenzbeziehungen aufgrund der Vieldeutigkeiten der menschlichen Sprachen, und es kann sein, daß die Ausgaben dieser automatischen Dokumentenformatiergeräte persönliche oder zeitliche Anforderungen eines Benutzers nicht erfüllen. Somit muß bei herkömmlichen Dokumentenformatiergeräten entweder die Möglichkeit einer Mißinterpretation, die aus einer automatischen Extrahierung der Dokumentenstrukturen resultiert, oder anderer Schwierigkeiten beim Arbeiten mit Befehlscodes, die vom Anwender in das Dokument eingebunden und genau beherrscht werden müssen, toleriert werden.
  • Es ist die Aufgabe der Erfindung
  • - ein Gerät und ein Verfahren zum Formatieren eines Dokuments zu schaffen, das Befehlscodes enthält, die vorgeschriebene Befehle anzeigen, die wenigstens logische Strukturen im Dokument betreffen, wobei eine Möglichkeit einer Mißinterpretation der wenigstens logischen Strukturen aufgrund von Vieldeutigkeiten der menschlichen Sprache vermieden werden.
  • Diese Aufgabe wird durch ein Gerät des Patentanspruchs 1 und ein Verfahren des Patentanspruchs 4 gelöst. Weitere vorteilhafte Ausführungsbeispiele und Verbesserungen der Erfindung sind in den abhängigen Ansprüchen definiert.
  • Andere Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung in Zusammenhang mit den beigefügten Zeichnungen klar.
  • Fig. 1 ist ein Blockdiagramm eines Dokumentenformatiergeräts gemäß einem Ausführungsbeispiel der vorliegenden Erfindung.
  • Fig. 2 ist eine tabellenmäßige Darstellung von Beispielen von Befehlscodes, die beim in Fig. 1 gezeigten Dokumentenformatiergerät zu verwenden sind.
  • Fig. 3 ist eine weitere tabellenmäßige Darstellung logischer Strukturen, die beim in Fig. 1 gezeigten Dokumentenformatiergerät zu verwenden sind.
  • Fig. 4 ist ein Flußdiagramm für die Operation zum Formatieren durch das in Fig. 1 gezeigte Dokumentenformatiergerät.
  • Fig. 5 ist eine Darstellung eines Dokuments, das durch das in Fig. 1 gezeigte Dokumentenformatiergerät formatiert wird, welche Darstellung Arten zeigt, auf die die Befehlscodes bei diesem Ausführungsbeispiel verwendet werden.
  • Fig. 6(A) und (B) sind tabellenmäßige Darstellungen logischer Strukturen für das in Fig. 5 gezeigte Dokument, das ohne und mit Befehlscodes erhalten wird.
  • Fig. 7 ist eine weitere Darstellung eines Dokuments, das durch das in Fig. 1 gezeigte Dokumentenformatiergerät formatiert ist, wobei die Darstellung Arten zeigt, auf die die Befehlscodes bei diesem Ausführungsbeispiel verwendet werden.
  • Nimmt man nun Bezug auf Fig. 1 ist ein Ausführungsbeispiel eines Dokumentenformatiergeräts gemäß der vorliegenden Erfindung gezeigt.
  • Dieses Dokumentenformatiergerät weist eine Eingabeeinheit 10 auf, von der ein mit eingebundenen Befehlscodes zu formatierendes Dokument eingegeben wird, einen Originaldokumentenspeicher 20 zum Speichern des Dokuments mit den bei der Eingabeeinheit 10 eingegebenen Befehlscodes, einen Formatspeicher 30 zum Speichern eines Formats, in dem das Dokument zu formatieren ist, eine Analyseeinheit 40, die eine Befehlscode-Analyseeinheit 50 zum Analysieren von Inhalten der Befehlscodes aufweist, und eine Dokumentenstruktur-Analyseeinheit 60 zum Analysieren von Logik- und Referenzstrukturen des Dokuments gemäß den analysierten Inhalten der Befehlscodes, einen Dokumentenstrukturspeicher 70 zum Speichern der analysierten Strukturen des Dokuments, eine Formatierungsverarbeitungseinheit 70 zum Ausführen einer Formatierung gemäß den Strukturen des im Dokumentenstrukturspeicher 70 gespeicherten Dokuments und des im Formatspeicher 30 gespeicherten Formats, eine Ausgabeeinheit 90 zum Präsentieren des Dokuments, wie es durch die Formatierungsverarbeitungseinheit 80 formatiert ist, und eine Verwaltungseinheit 100 zum Verwalten der Operationen durch alle diese Teile dieses oben angegebenen Dokumentenformatiergeräts.
  • Die Eingabeeinheit 10 kann eine Tastatur, eine Maus oder ein Kommunikationsnetz sein. Die Ausgabeeinheit 90 kann eine Kathodenstrahlröhre, eine Anzeige oder ein Drucker sein.
  • In der Analyseeinheit 40 stellt die Befehlscode- Analyseeinheit 50 dann, wenn die Befehlscodes im Dokument vorhanden sind, eine Operation der Dokumentenstruktur- Analyseeinheit 60 derart ein, daß die Inhalte der Befehlscodes auf eine Art zum Analysieren der Logik- und Referenzstrukturen des Dokuments gezeigt werden. Somit kann ein Anwender bei diesem Ausführungsbeispiel die Analyse der Logik- und Referenzstrukturen bewußt steuern. Darüber hinaus dechiffriert die Befehlscode-Analyseeinheit 50 auch jene Befehlscodes, die das Layout des Dokuments direkt betreffen, so daß der Anwender auch das Layout des Dokuments steuern kann.
  • Ein Beispiel einer Gruppe von Befehlscodes, die bei diesem Ausführungsbeispiel zu verwenden sind, sind in Fig. 2 gezeigt. Wie es im Abschnitt (0) der Fig. 2 angegeben ist, beginnt ein Befehlscode bei diesem Ausführungsbeispiel mit , und was diesem Symbol folgt, bezeichnet einen Typ des Befehlscodes. Verschiedene unterschiedliche Typen von Befehlscodes und ihre entsprechenden logischen Attribute sind im Abschnitt (1) der Fig. 2 zusammengefaßt. Beispielsweise zeigt ein Befehlscode DATE an, daß das, was folgt, das Datum ist, ein Befehlscode NODC zeigt an, daß das, was folgt, die Dokumentennummer ist, und so weiter. Zusätzlich gibt es Analyseverbotscodes, die im Abschnitt (2) der Fig. 2 gezeigt sind und anzeigen, daß ein Teil des Dokuments strukturmäßig nicht zu analysieren ist, wie beispielsweise jene, die mathematische Formeln enthalten, und jene, die einen speziellen Formatierungstyp benötigen. Weiterhin gibt es Graphikreferenzcodes, wie es im Abschnitt (3) der Fig. 2 gezeigt ist, die das Vorhandensein einer Referenz vom Dokument zu Graphiken anzeigen, sowie die Stelle der Daten bezüglich der Graphiken, auf die Bezug genommen wird, und das Layout der Graphiken, d.h. wie die Graphiken in die schließliche Ausgabe des Dokuments einzubinden sind. Es gibt auch einen im Abschnitt (4) der Fig. 2 gezeigten vorgeschriebenen Rücksprungcode, der ein erzwungenes Wechseln zur nächsten Zeile anzeigt, und zwar ungeachtet der logischen Struktur.
  • Ein Beispiel der logischen Struktur im Dokumentenstrukturspeicher 70 ist in Fig. 3 gezeigt. Die logische Struktur im Dokumentenstrukturspeicher 70 weist eine Satznummer auf, die jeden Satz des Dokuments bezeichnet, ein Attribut für jeden Satz, einen jedem Attribut zugeordneten Pegel und ein Anfangsblockmuster für relevante Sätze. Beispielsweise ist in Fig. 3 einem Satz, der durch die Satznummer 4 bezeichnet ist, ein Attribut "Absatz ENDE" in Antwort auf den Befehlscode HEAD zugeordnet, der in jenem Satz vorhanden ist, dessen Pegel als 3 gegeben ist und der kein Anfangsblockmuster aufweist. Eine derartige logische Struktur wird zusammen mit den Formatdaten im Formatspeicher 30 beim Ausführen einer Formatierung des Dokuments verwendet.
  • Nimmt man nun Bezug auf Fig. 4, wird die Operation der Dokumentenformatierung durch dieses Dokumentenformatiergerät beschrieben.
  • Beim Schritt 100 wird das Dokument mit den Befehlscodes von der Eingabeeinheit 10 eingegeben und im Originaldokumentenspeicher 20 gespeichert.
  • Dann wird beim Schritt 101 ein Satz des Dokuments aus dem Originaldokumentenspeicher 20 ausgelesen und zur Analyseeinheit 40 gegeben.
  • Dann wird beim Schritt 102 durch die Befehlscode- Analyseeinheit 50 bestimmt, ob es in diesem Satz irgendeinen Befehlscode gibt.
  • Wenn es im Satz keinen Befehlscode gibt, wird beim Schritt 103 eine normale automatische Extrahierung von Logik- und Referenzstrukturen des Dokuments durch die Dokumentenstruktur-Analyseeinheit 60 ausgeführt, und die Verarbeitung geht weiter zum Schritt 113, der unten erklärt wird.
  • Andererseits wird dann, wenn es im Satz einen Befehlscode gibt, zum Schritt 104 gegangen, bei dem durch die Befehlscode-Analyseeinheit 50 bestimmt wird, ob der im Satz vorhandene Befehlscode einer der Logikstruktur-codes ist.
  • Wenn der Befehlscode einer der Logikstruktur-codes ist, wird die logische Struktur des Satzes durch die Dokumentenstruktur-Analyseeinheit 60 beim Schritt 105 extrahiert, und zwar gemäß dem, was der Befehlscode anzeigt, und das Verfahren geht weiter zum Schritt 113.
  • Andererseits wird zum Schritt 106 gegangen, bei dem durch die Befehlscode-Analyseeinheit 50 bestimmt wird, ob der im Satz vorhandene Befehlscode einer der Analyseverbotscodes ist.
  • Wenn der Befehlscode einer der Analyseverbotscodes ist, wird die strukturmäßige Analyse durch die Dokumentenstruktur- Analyseeinheit 60 beim Schritt 107 gemäß dem gesteuert, was der Befehlscode anzeigt, und das Verfahren geht weiter zum Schritt 113.
  • Andererseits wird zum Schritt 108 gegangen, bei dem durch die Befehlscode-Analyseeinheit 50 bestimmt wird, ob der im Satz vorhandene Befehlscode einer der Graphikreferenz-Codes ist.
  • Wenn der Befehlscode einer der Graphikreferenz-codes ist, wird die Referenzstruktur des Satzes durch die Dokumentenstruktur-Analyseeinheit 60 beim Schritt 109 gemäß dem extrahiert, was der Befehlscode anzeigt, und das Verfahren geht weiter zum Schritt 113.
  • Andererseits wird zum Schritt 110 gegangen, bei dem durch die Befehlscode-Analyseeinheit 50 bestimmt wird, ob der im Satz vorhandene Befehlscode der vorgeschriebene Rücksprungcode ist.
  • Wenn der Befehlscode der vorgeschriebene Rücksprungcode ist, wird die Information des vorgeschriebenen Rücksprungs durch die Befehlscode-Analyseeinheit 50 beim Schritt 111 dechiffriert und extrahiert, und das Verfahren geht weiter zum Schritt 113.
  • Andererseits wird zum Schritt 110 gegangen, bei dem durch die Befehlscode-Analyseeinheit 50 bestimmt wird, ob der im Satz vorhandene Befehlscode der Zwangsrücksprungcode ist.
  • Wenn der Befehlscode der Zwangsrücksprungcode ist, wird die Information des Zwangsrücksprungs durch die Befehlscode- Analyseeinheit 50 beim Schritt 111 dechiffriert bzw. entziffert und extrahiert, und das Verfahren geht weiter zum Schritt 113.
  • Sonst ist der im Satz vorhandene Befehlscode fehlerhaft, da er keiner der Befehlscodes ist, die in Fig. 2 vorgegeben sind, so daß beim Schritt 112 der Fehler im Befehlscode korrigiert wird, und das Verfahren zum Schritt 113 weitergeht.
  • Beim Schritt 113 wird das Ergebnis der bis zu dieser Stelle erhaltenen Logik- und Referenzstrukturen im Dokumentenstrukturspeicher 70 gespeichert.
  • Dann wird beim Schritt 114 bestimmt, ob alle Sätze im Dokument geprüft worden sind. Wenn nicht alle Sätze im Dokument geprüft worden sind, kehrt das Verfahren zum Schritt 101 zurück, und die diesem nachfolgenden Schritte werden wiederholt.
  • Sonst geht das Verfahren weiter zum Schritt 115, bei dem die Formatierung des Dokuments durch die Formatierungsverarbeitungseinheit 80 gemäß den im Dokumentenstrukturspeicher 70 gespeicherten Logik- und Referenzstrukturen sowie dem im Formatspeicher 30 gespeicherten Format ausgeführt wird, und wenn das resultierende formatierte Dokument durch die Ausgabeeinheit 90 ausgegeben wird, endet das Verfahren.
  • Ein praktisches Beispiel des Dokuments und der Verwendung der Befehlscodes ist in Fig. 5 gezeigt.
  • Bei diesem Beispiel der Fig. 5, das ein Bericht mit dem Titel "Intelligentes Dokumentenverarbeitungssystem" ist, kann die erste Zeile "INTELLIGENTES DOKUMENTENVERARBEITDNGSSYSTEM" durch die normale automatische Logikstrukturextrahierung als Titel identifiziert werden, so daß in dieser ersten Zeile kein Befehlscode notig ist. Andererseits wird die zweite Zeile "RACHI YOZAN" sehr wahrscheinlich nicht als Name des Autors identifiziert werden, da Rachi Yozan ein äußerst seltener Name ist, so daß dieser Name nicht in einer Namen- Datenbank gefunden werden kann. Somit wird die Tatsache, daß "RACHI YOZAN" ein Name des Autors ist, durch Plazieren des Befehlscodes AUTH an die Spitze dieser zweiten Zeile angezeigt. Demgemäß kann die Dokumentenstruktur- Analyseeinheit 60 "RACHI YOZAN" richtig als einen Namen des Autors analysieren. Gleichermaßen kann "NICHIBEI SOFTWARE" in der dritten Zeile richtig als ein Name der Organisation identifiziert werden, zu der der Autor gehört, und zwar durch Plazieren des Befehlscodes SECT an die Spitze dieser dritten Zeile. In bezug auf die vierte Zeile gibt es einen Zwangsrücksprungcode an der Spitze dieser vierten Zeile, da diese vierte Zeile leer zu lassen ist. Die fünfte Zeile "1. EINLEITUNG" kann durch die normale automatische Logikstrukturextrahierung als ein Abschnittanfangsblock mit "Einleitung" als reserviertes Wort identifiziert werden, so daß in dieser fünften Zeile kein Befehlscode nötig ist. Ebenso bedeutet die dreiunddreißigste Zeile " S Fig. 10 ZF bunsho-1 ZP d E ...", daß "Fig. 10 in der Datei "bunsho-1" ist und in den unteren Teil der aktuellen Seite auszulagern ist
  • Wie die durch die Dokumentenstruktur-Analyseeinheit 60 erhaltene Logikstruktur durch das Vorhandensein der Befehlscodes beim Beispiel der Fig. 5 bewirkt wird, ist in den Fig. 6(A) und (B) gezeigt, wobei Fig. 6(A) die vom Dokument erhaltene logische Struktur ohne die Befehlscodes zeigt und Fig. 6(B) die vom Dokument erhaltene Logikstruktur mit den Befehlscodes zeigt. Wie es aus Fig. 6 zu sehen ist, werden ohne die Befehlscodes, d.h. durch eine vollständig automatische logische Strukturextrahierung, die zweite und die dritte Zeile unrichtig als Untertitel in Fig. 6(A) analysiert, wohingegen bei der Verwendung der Befehlscodes dieses Mißverständnis in Fig. 6(B) vermieden werden kann.
  • Ein weiteres praktisches Beispiel des Dokuments und der Verwendung der Befehlscodes, insbesondere der Verwendung der Analyseverbotscodes, ist in Fig. 7 gezeigt.
  • Bei diesem Beispiel der Fig. 7, das ein Teil eines Absatzes ist, der mathematische Formeln enthält, sind der Analyseverbotsstartzeilencode X und der Analyseverbotsendzeilencode Y jeweils an einem oberen und einem unteren Ende der mathematischen Formeln plaziert, so daß dieser Teil nicht strukturell analysiert wird, da die Bedeutung der mathematischen Formeln durch die Dokumentenstruktur-Analyseeinheit 60 nicht analysierbar ist. Abgesehen von den mathematischen Formeln können die Analyseverbotscodes gleichermaßen für jene Teile verwendet werden, die auf spezielle oder persönliche Weisen geschrieben werden. Zusätzlich kann der Zwangsrücksprungcode C in einer Mitte einer Zeile plaziert werden, wie es in Fig. 7 gezeigt ist.
  • Wie es beschrieben ist, ist es gemäß diesem Ausführungsbeispiel möglich, ein Dokumentenformatiergerät zu haben, das sowohl einfach handhabbar als auch dauerhaft richtig ist. Es kann aus der obigen Beschreibung gesehen werden, daß dies aufgrund der besonderen Verwendung sowohl der automatischen Logik- und Referenzstrukturen als auch der Befehlscodes erfolgt. Folglich kann gemäß diesem
  • Ausführungsbeispiel das Mißverständnis, das die vollständig automatische strukturelle Analyse unvermeidbar begleitet, durch die Verwendung der Befehlscodes richtiggestellt werden. Gleichzeitig können, da dieses Ausführungsbeispiel die Verwendung des Befehlscodes nur an den Stellen benötigt, die ein Mißverständnis verursachen können, und nirgendwo anders, die Behinderungen, die zur herkömmlichen Verwendung der Befehlscodes gehören, enorm verringert werden.
  • Es ist anzumerken, daß, obwohl beim obigen Ausführungsbeispiel die Befehlscodes an den Anfang der Zeilen plaziert werden, dies auf einfache Weise derart modifiziert werden kann, daß eine Plazierung des Befehlscodes irgendwo in den Zeilen erlaubt wird.
  • Ebenso ist es, obwohl beim obigen Ausführungsbeispiel die einzigen Befehlscodes, die das Layout des Dokuments direkt betreffen, die Zwangsrücksprungcodes sind, möglich, kompliziertere Befehlscodes einzubauen, wie beispielsweise Schriftarten-Befehlscodes und Stil-Befehlscodes, die in "Scribe" verwendet werden, und dadurch den Umfang einer möglichen Formatierung zu erhöhen.
  • Weiterhin kann, obwohl beim obigen Ausführungsbeispiel die strukturelle Analyse Zeile für Zeile durchgeführt wird, dies auf eine sogenannte Top-Down-Art (von oben nach unten) durchgeführt werden, d.h. für das gesamte Dokument auf einmal.
  • Darüber hinaus können die Analyseverbotscodes E X und E Y derart modifiziert werden, daß dieanalyse innerhalb eines durch sie angezeigten Pfeils durch ein spezielles Verarbeitungssystem durchgeführt wird, wie beispielsweise TEX, das dafür bekannt ist, daß es sehr effektiv beim Behandeln mathematischer Formeln ist.
  • Weiterhin kann dieses Ausführungsbeispiel effektiv nicht nur für das Dokument verwendet werden, das Referenzen zu den Graphiken enthält, wie bei den Beispielen in der vorangehenden Beschreibung, sondern auch für das Dokument mit Referenzen zu einer Liste von Referenzen oder einer Bibliographie, und für Bezugs-Datenbanken.

Claims (20)

1. Gerät zum Formatieren eines Dokuments, das Befehlscodes enthält, die vorgeschriebene Befehle anzeigen, die strukturelle Funktionen betreffen, wobei das Gerät folgendes aufweist:
a) eine Eingabeeinrichtung (10) zum Eingeben des Dokuments in das Gerät;
b) eine Analyseeinrichtung (60) zum Analysieren einer Dokumentenstruktur für jeden Teil des Dokuments mit und ohne Befehlscodes, wobei die Dokumentenstruktur wenigstens eine logische Struktur enthält, die ein logisches Attribut für jeden bestimmten Teil des Dokuments anzeigt, und zum Ableiten einer strukturellen Information, die die Dokumentenstruktur definiert, von dem Dokument durch automatisches Ausführen einer vorgeschriebenen Routineanalyse des Dokuments;
c) eine Erfassungseinrichtung (50) zum Erfassen der Befehlscodes und zum Einstellen einer Operation der Analyseeinrichtung (60) für jene Teile des Dokuments mit Befehlscodes, um die strukturelle Information gemäß Anzeigen der Befehlscodes abzuleiten; und
d) eine Formatierungseinrichtung (80) zum Ausführen einer Formatierung des Dokuments durch Verwenden der strukturellen Information, die durch die Analyseeinrichtung (60) abgeleitet wird.
2. Gerät nach Anspruch 1, wobei die strukturmäßige Analyseeinrichtung (60) eine Referenzstruktur des Dokuments analysiert.
3. Gerät nach Anspruch 1, wobei die Befehlscodes auch einen ein Format betreffenden vorgeschriebenen Befehl anzeigen, und wobei die Formatierungseinrichtung (80) die Formatierung auch gemäß den Befehlen ausführt, die das Format betreffen, das durch die Befehlscodes angezeigt wird.
4. Verfahren zum Formatieren eines Dokuments, das Befehlscodes enthält, die vorgeschriebene Befehle anzeigen, die strukturelle Funktionen betreffen, wobei das Verfahren folgende Schritte aufweist:
a) Eingeben des Dokuments in das Gerät;
wobei das Verfahren weiterhin folgende Schritte aufweist, die automatisch ausgeführt werden:
b) Analysieren (103) einer Dokumentenstruktur für jeden Teil des Dokuments mit und ohne Befehlscodes, wobei die Dokumentenstruktur wenigstens eine logische Struktur enthält, die ein logisches Attribut für jeden bestimmten Teil des Dokuments anzeigt, und Ableiten struktureller Information, die die Dokumentenstruktur definiert, von dem Dokument durch Ausführen einer vorgeschriebenen Routineanalyse des Dokuments;
c) Erfassen (102) der Befehlscodes und Einstellen (105, 107, 109, 111) der Analyseoperation für jene Teile des Dokuments mit Befehlscodes, um die strukturelle Information gemäß Anzeigen der Befehlscodes abzuleiten; und
d) Formatieren (115) des Dokuments durch Verwenden der strukturellen Information, die beim Erfassungs- und Einstellungsschritt (102, 105, 107, 109, 111) abgeleitet werden.
5. Verfahren nach Anspruch 4, wobei beim strukturellen Analyseschritt (103) eine Referenzstruktur des Dokuments analysiert wird.
6. Verfahren nach Anspruch 4, wobei die Befehlscodes ebenso einen vorbeschriebenen Befehl anzeigen, der ein Format betrifft, und wobei beim Formatierungsschritt (115) die Formatierung ebenso gemäß den Befehlen ausgeführt wird, die ein Format betreffen, das durch die Befehlscodes angezeigt wird.
7. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß die Befehlscodes modifizierte Analyseverbots-Befehlscodes (X, Y) aufweisen, so daß die Analyse innerhalb eines Teils in dem Dokument, der durch sie angezeigt wird, durch ein spezielles Verarbeitungssystem auszuführen ist, wie beispielsweise ein TEX- (Markenzeichen) -System.
8. Gerät nach Anspruch 1, gekennzeichnet durch einen Originaldokumentenspeicher (20) zum Speichern des Dokuments mit den Befehlscodes, eingegeben durch die Eingabeeinrichtung (10).
9. Gerät nach Anspruch 1, gekennzeichnet durch einen Formatspeicher (30) zum Speichern des Formats, in das das eingegebene Dokument zu formatieren ist.
10. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß die Erfassungseinrichtung (50) die Inhalte der Befehlscodes analysiert.
11. Gerät nach den Ansprüchen 10 und 2, dadurch gekennzeichnet, daß die Analyseeinrichtung (60) Logikund Referenzstrukturen des Dokuments gemäß den analysierten Inhalten der Befehlscodes analysiert.
12. Gerät nach Anspruch 1, gekennzeichnet durch einen Dokumentenstrukturspeicher (70) zum Speichern der analysierten Strukturen des Dokuments.
13. Gerät nach den Ansprüchen 12 und 9, dadurch gekennzeichnet, daß die Formatierungseinrichtung (80) die Formatierung des Dokuments gemäß den Strukturen des Dokuments ausführt, die im Dokumentenstrukturspeicher (70) gespeichert sind, und gemäß dem Format, das im Formatspeicher (30) gespeichert ist.
14. Gerät nach Anspruch 1, gekennzeichnet durch eine Ausgabeeinheit (90) zum Präsentieren des Dokuments als formatiert durch die Formatierungseinrichtung (80).
15. Gerät nach Anspruch 10, dadurch gekennzeichnet, daß die Erfassungseinrichtung (50) jene Befehlscodes dechiffriert, die das Layout des Dokuments direkt betreffen.
16. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß die Befehlscodes Logikstrukturcodes, Analyseverbotscodes, Graphikreferenzcodes und Zwangsrückkehrcodes sind.
17. Gerät nach den Ansprüchen 12 und 1, dadurch gekennzeichnet, daß eine logische Struktur, die im Dokumentenstrukturspeicher (70) gespeichert ist, eine Satznummer ist, die jeden Satz des Dokuments bezeichnet, ein Attribut für jeden Satz, ein Pegel, der jedem Attribut zugeteilt ist und ein Anfangsblockmuster für die Sätze.
18. Gerät nach den Ansprüchen 17 und 13, dadurch gekennzeichnet, daß die Formatierungseinrichtung (80) die logische Struktur mit den Formatdaten im Formatspeicher (30) zum Ausführen der Formatierung des Dokuments verwendet.
19. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß der Analyseschritt (103) und der Erfassungs- und Einstellungsschritt (102; 105, 107, 109, 111) für jeden Satz des Dokuments wiederholt wird.
20. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß im Erfassungsschritt c) auch jene Befehlscodes dechiffriert werden, die das Layout des Dokuments direkt betreffen.
DE68928068T 1988-02-12 1989-02-10 Verfahren und Apparat zum Formatieren von Dokumenten Expired - Fee Related DE68928068T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63028789A JPH01205260A (ja) 1988-02-12 1988-02-12 文書整形装置

Publications (2)

Publication Number Publication Date
DE68928068D1 DE68928068D1 (de) 1997-07-03
DE68928068T2 true DE68928068T2 (de) 1997-10-09

Family

ID=12258193

Family Applications (1)

Application Number Title Priority Date Filing Date
DE68928068T Expired - Fee Related DE68928068T2 (de) 1988-02-12 1989-02-10 Verfahren und Apparat zum Formatieren von Dokumenten

Country Status (5)

Country Link
US (1) US5119491A (de)
EP (1) EP0337068B1 (de)
JP (1) JPH01205260A (de)
KR (1) KR920002668B1 (de)
DE (1) DE68928068T2 (de)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5175810A (en) * 1989-06-19 1992-12-29 Digital Equipment Corporation Tabular data format
JPH03177964A (ja) * 1989-12-07 1991-08-01 Toshiba Corp 文書整形装置
DE69131471T2 (de) * 1990-03-29 2000-03-30 Canon K.K., Tokio/Tokyo Textverarbeitungsvorrichtung mit Textformatierung
GB2245400B (en) * 1990-06-15 1994-04-13 Fuji Xerox Co Ltd Document layout processing
DE4143620C2 (de) * 1990-06-15 2000-01-05 Fuji Xerox Co Ltd Dokumentlayoutverarbeitungsverfahren und Vorrichtung zu dessen Durchführung
US5434962A (en) * 1990-09-07 1995-07-18 Fuji Xerox Co., Ltd. Method and system for automatically generating logical structures of electronic documents
JP3110041B2 (ja) * 1990-11-30 2000-11-20 株式会社東芝 画像情報処理装置
JPH0573548A (ja) * 1990-12-18 1993-03-26 Casio Comput Co Ltd 文書整形装置
CA2048039A1 (en) * 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
JPH06250895A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 構造化データベースシステム
US5440745A (en) * 1993-04-29 1995-08-08 International Business Machines Corporation Batch format processing of record data
US5991782A (en) * 1994-02-18 1999-11-23 Fujitsu Limited Automated extraction and doubly linked reference marks for partialized document contents and version control
US5671427A (en) * 1994-10-12 1997-09-23 Kabushiki Kaisha Toshiba Document editing apparatus using a table to link document portions
US5655130A (en) * 1994-10-14 1997-08-05 Unisys Corporation Method and apparatus for document production using a common document database
US6546406B1 (en) 1995-11-03 2003-04-08 Enigma Information Systems Ltd. Client-server computer system for large document retrieval on networked computer system
US6167409A (en) * 1996-03-01 2000-12-26 Enigma Information Systems Ltd. Computer system and method for customizing context information sent with document fragments across a computer network
US5893109A (en) * 1996-03-15 1999-04-06 Inso Providence Corporation Generation of chunks of a long document for an electronic book system
JPH10143403A (ja) 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
EP1126379A1 (de) * 2000-02-16 2001-08-22 Sun Microsystems, Inc. Umwandlung von direkt zugeordneten Dokumentformatkennzeichen
US6941513B2 (en) 2000-06-15 2005-09-06 Cognisphere, Inc. System and method for text structuring and text generation
US20020095378A1 (en) * 2000-10-31 2002-07-18 Cauchon Mark P. Service provider network for legal services with direct browser delivery of rich text format documents
US7546527B2 (en) * 2001-03-06 2009-06-09 International Business Machines Corporation Method and apparatus for repurposing formatted content
JP6893209B2 (ja) 2015-10-30 2021-06-23 アクシオム コーポレーション 構造化されたマルチフィールドファイルのレイアウトの自動解釈

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4028681A (en) * 1971-09-29 1977-06-07 Ing. C. Olivetti & C., S.P.A. System for automatically processing and printing the contents and the format of a text
JPS5844563A (ja) * 1981-09-10 1983-03-15 Sharp Corp 罫線処理装置
US4539653A (en) * 1983-04-11 1985-09-03 International Business Machines Corporation Formatting text/graphics using plural independent formatting mechanisms
US4633430A (en) * 1983-10-03 1986-12-30 Wang Laboratories, Inc. Control structure for a document processing system
KR930009761B1 (ko) * 1984-05-31 1993-10-09 쏘니 가부시기가이샤 워드프로세서
US4723209A (en) * 1984-08-30 1988-02-02 International Business Machines Corp. Flow attribute for text objects
US4751740A (en) * 1984-12-10 1988-06-14 Wang Laboratories, Inc. Apparatus, method, and structure for translating a document having one structure into a document having another structure
JPH077410B2 (ja) * 1986-03-29 1995-01-30 株式会社東芝 文書レイアウト方法
JPH0776969B2 (ja) * 1986-04-18 1995-08-16 株式会社東芝 文書処理装置
US4841472A (en) * 1986-04-22 1989-06-20 Minolta Camera Kabushiki Kaisha Word processor capable of automatic tilting of documents
US4773009A (en) * 1986-06-06 1988-09-20 Houghton Mifflin Company Method and apparatus for text analysis
US4881197A (en) * 1987-02-13 1989-11-14 Addison Fischer Document composition system using named formats and named fonts
US4796196A (en) * 1987-03-13 1989-01-03 Pitney Bowes Inc. Letter processing apparatus
CN1009591B (zh) * 1987-09-23 1990-09-12 北京市海淀区四通新技术研究所 计算机编辑排版系统及其方法

Also Published As

Publication number Publication date
US5119491A (en) 1992-06-02
EP0337068A3 (de) 1991-12-04
KR920002668B1 (ko) 1992-03-31
DE68928068D1 (de) 1997-07-03
EP0337068A2 (de) 1989-10-18
KR890013544A (ko) 1989-09-23
JPH01205260A (ja) 1989-08-17
EP0337068B1 (de) 1997-05-28

Similar Documents

Publication Publication Date Title
DE68928068T2 (de) Verfahren und Apparat zum Formatieren von Dokumenten
DE68928775T2 (de) Verfahren und Vorrichtung zur Herstellung einer Zusammenfassung eines Dokumentes
DE69424350T2 (de) Kontextsensitive Methode zum Auffinden von Informationen über ein Wort in einem elektronischen Wörterbuch
DE3850595T2 (de) Dokumentverarbeitungssystem.
DE4216893C2 (de) Dateneingabeverfahren
DE69322741T2 (de) Vorrichtung und Methode zur Verwendung im Ausrichten von zweisprachigen Corpora
DE68929461T2 (de) Verfahren zur Verarbeitung von digitalen Textdaten
DE3587501T3 (de) Gerät, Verfahren und Struktur zur Umwandlung eines Dokumentes einer Struktur in ein Dokument einer anderen Struktur.
DE3586273T2 (de) Implizite erzeugung einer superblockstruktur in einem vieldaten-edierungsgeraet.
DE10135445B4 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE69630928T2 (de) Vorrichtung und Verfahren zum Anzeigen einer Übersetzung
DE69225760T2 (de) Methode und System zur Unterstützung von mehrfacher Textselektion und "swipe and type" Operationen auf einer Rechneranzeige
DE3782447T2 (de) Dokumentverarbeitungsapparat.
DE69026885T2 (de) Dynamische Selektion von Datenformaten für rekursiv geschachtelte logische Elemente
DE69331044T2 (de) Vorrichtung und Verfahren zur syntaktischen Signalanalyse
DE69226106T2 (de) Datenbankherstellungsverfahren und Gerät
DE102005032046A1 (de) Verfahren, System und Computerprogramm-Produkt zum Übertragen von Daten aus einer Dokumentenanwendung in eine Datenanwendung
DE69025091T2 (de) Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort
EP1671262A1 (de) Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten
DE69715525T2 (de) Verfahren und System um Datenstrukturen zu vereinigen
DE69229583T2 (de) Verfahren zur Flektieren von Wörtern und Datenverarbeitungseinheit zur Durchführung des Verfahrens
DE2825519A1 (de) Elektronisches ausgabegeraet fuer mehrzeilige textwiedergabe
DE68926425T2 (de) Verfahren zur Behandlung von Markierungselementen eines Dokumentendatenstroms
DE3751784T2 (de) Maschinelles Übersetzungssystem und -Verfahren
DE69131471T2 (de) Textverarbeitungsvorrichtung mit Textformatierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8339 Ceased/non-payment of the annual fee