DE4121564A1 - Vorrichtung zur unterstuetzung einer dokumentenerstellung - Google Patents

Vorrichtung zur unterstuetzung einer dokumentenerstellung

Info

Publication number
DE4121564A1
DE4121564A1 DE4121564A DE4121564A DE4121564A1 DE 4121564 A1 DE4121564 A1 DE 4121564A1 DE 4121564 A DE4121564 A DE 4121564A DE 4121564 A DE4121564 A DE 4121564A DE 4121564 A1 DE4121564 A1 DE 4121564A1
Authority
DE
Germany
Prior art keywords
document
region
layout
character
graphic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE4121564A
Other languages
English (en)
Other versions
DE4121564C2 (de
Inventor
Junichi Ohsumi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of DE4121564A1 publication Critical patent/DE4121564A1/de
Application granted granted Critical
Publication of DE4121564C2 publication Critical patent/DE4121564C2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)

Description

Hintergrund der Erfindung
Die Erfindung bezieht sich auf Dokumentenerstellungsvorrichtungen wie Textprozessoren und Arbeitsstationen, und insbesondere auf eine Vorrichtung, die Dokumentenerstellung unterstützt, die elektronisch Dokumentenlayouts komplexer Muster produziert, wobei diese heterogene Daten wie Zeichen (characters), graphische Zeichen und Bilder umfassen.
Bei der Erstellung von Dokumenten mittels Dokumentenerstellungsvorrichtungen wie Textprozessoren (word processors) und Arbeitsstationen (workstations) ist es manchmal erwünscht, daß ein Satz unterschiedlicher Typen von Daten wie beispielsweise (alphanumerische) Zeichen (characters) einschließlich Schriftzeichen, graphische Daten, die durch Vektordaten wie gerade oder gekrümmte Linien repräsentiert sind, sogenannte Bitmapbilder (bit map images), spezifiziert durch Bitmuster (bit patterns) wie zum Beispiel Bilder, die von Bildlesevorrichtungen gelesen werden, gemischt werden.
Bei der Bildung derartiger Dokumente mit heterogenen Daten einschl. Schriftzeichen (characters im Sinne von alphanumerischen Zeichen und/oder Schriftzeichen wie beispielsweise japanische Schriftzeichen), graphische Zeichen in Vektordarstellung (vectorexpressed graphics), und Bitmapbildern, bestehen Unterschiede zwischen der Datenprozeßbetriebsart (data processing mode) von einem Datentyp zu jeweils einem anderen Datentyp innerhalb der Dokumentenerstellungsvorrichtung. Um bei diesen Gegebenheiten die Prozeßeffizienz zu verbessern, werden Boxen bzw. Schreibfelder (boxes) wie eine Schriftzeichenbox (character box), eine Graphenbox (graphic box) und eine Bildbox in einem Dokument definiert, und wenn das Dokument erstellt oder editiert wird, werden die Attribute (attributes) einer jeden Prozeßbox bewertet und die betreffende Box wird gemäß der bewerteten Attribute bearbeitet. In dieser Beschreibung wird der Begriff "Bild" (image) in einem weiten Sinn verwendet, wobei dieser Begriff Schriftzeichen (characters), durch Vektoren bezeichnete graphische Elemente (vectorexpressed graphics), Bitmapbilder und ähnliches umfaßt, während der Begriff "Bild" im engeren Sinn nur Bitmapbilder umfaßt.
Um mittels herkömmlicher Dokumentenerstellungsvorrichtungen ein Dokument zu erstellen, das eine Mischung von Schriftzeichen, durch Vektoren bezeichnete graphische Elemente, Bitmapbilder und ähnliches enthält, hat die Bedienperson die Boxen entsprechend der Attribute im Dokument zu spezifizieren und ihre Größe und Lage anzupassen.
Jedoch ist eine derartige Boxspezifikation und -anpassung für jeden Boxtyp vorzunehmen, daß heißt für die Schriftzeichenbox, die Graphikbox und die Bildbox. Außerdem ist derselbe Vorgang zu wiederholen, wenn eine Mehrzahl von Boxen vorliegt, die durch dasselbe Attribut definiert sind. Dieser Umstand macht den herkömmlichen Dokumentenbildungsvorgang schwerfällig und zeitlich aufwendig.
Insbesondere sind auch, wenn schon ein entsprechendes Dokument existiert und dasselbe Layout dieses Dokuments benutzt werden soll, die zuvor genannten Eingabeoperationen einzeln nacheinander durchzuführen, was die Bedienperson mit Arbeitsaufwand belastet und eine entsprechende geistige Anstrengung erfordert.
Eine Methode, diese Situation zu verbessern, ist es, eine Vielzahl von Dokumententypen vorzubereiten, wobei jedes Dokument ein Standardlayout hat, und dann später bei der eigentlichen Dokumentenerstellung ein Dokument zu suchen und zu kopieren, das das gewünschte Layout aufweist, sowie bedarfsweise die gewünschten Daten in das Dokument einzugeben.
Diese Methode setzt allerdings voraus, alle Standardlayouts vorzuregistrieren, was einen extrem umfangreichen Arbeitsaufwand für die ursprünglichen Eingabeoperationen erfordert. Zusätzlich sind die Dokumente mit allen Standardlayouts zu registrieren, was eine außerordentlich große Speicherkapazität erfordert. Um schließlich die registrierten Layouts zu benutzen, ist weiterhin stets die Suchoperation nach dem Ziellayout vorzunehmen. Ist die Zahl der registrierten Layouts groß, erweist sich die Suchoperation als eine nicht einfache Aufgabe.
Zuammenfassung der Erfindung
Die vorliegende Erfindung löst die vorgenannten Probleme. Dementsprechend ist es eine Aufgabe, eine Vorrichtung zur Unterstützung einer Dokumentenerstellung anzugeben, die verschiedene Layouttypen mit Boxen bzw. Schreibfelder (boxes) selbsttätig erzeugen kann, wenn Dokumente vorliegen, deren Layouts als Muster für die Layouts des zu bildenden Dokuments dienen, wodurch die Effizienz der Dokumentenbildung verbessert wird.
Um diese Aufgabe zu lösen wird die Vorrichtung zur Unterstützung einer Dokumentenerstellung in einer Dokumentenerstellungsvorrichtung angewendet, die bei der Erstellung eines Dokuments Regionen definiert, die sich hinsichtlich ihrer Attribute der Bilder voneinander unterscheiden, die in diesem Dokument enthalten sind, und die jeder dieser Regionen unterschiedlich bearbeitet. Eine derartige Vorrichtung zur Unterstützung von Dokumentenbildung in einer Dokumentenbildungsvorrichtung besteht aus einer Bildeingabeeinheit, die das als Muster eines Bildes bildende Dokument liest, einer Layoutanalyseeinheit, die Attribute der von dem Dokument gelesenen Bilder liest und Layoutdaten, die Größe, Position, und Attribute einer jeden Region basierend auf Unterschieden in den gewerteten Attribute identifiziert, und eine Layouterzeugungsinstruktionseinheit (layout generating instruction section), die anweist, dieselben Regionen wie jene auf dem als Muster dienenden Dokument auf dem zu bildenden Dokument basierend auf den identifizierten Layoutdaten einzustellen.
Die Layoutanalyseeinheit (layout analysis section) kann umfassen: eine Regionenanalyseeinheit (region analysis section), die eine Schriftzeichenregion, eine Graphikregion und eine Bildregion von den Bildern des Dokuments identifiziert; eine Schriftzeichenteilanalyseeinheit (character portion analysis section), die einen Schriftzeichenteil innerhalb der Schriftzeichenregion analysiert, und eine Graphikteilanalyseeinheit (graphic portion analysis section), die eine Zeilenkomponente innerhalb eines graphischen Elements durch Analyse eines Graphikteils innerhalb der Graphikregion identifiziert und die identifizierte Zeilenkomponente als Vektordaten ausgibt.
Im Rahmen der Erfindung wird ein Dokument, das als ein Muster dient, als Bilder gelesen und die Regionen in den gelesenen Bildern werden durch die Layoutanalyseeinheit identifiziert, wenn ein Layout des Dokuments zu spezifizieren ist. Beispielsweise werden durch eine Linie umschlossene (circumscribed), das heißt umschriebene Rechtecke gekoppelter, in dem Dokument enthaltener Bilder identifiziert, und ob jedes umschriebene Rechteck eine Schriftzeichenregion, eine Graphikregion oder eine Bildregion ist, wird durch die Größe, Position und ähnliche Parameter des umschriebenen Rechtecks bewertet. Dann werden die entsprechenden Regionen spezifiziert zu einem neuzubildenden Dokument basierend auf diesen analysierten Regionen durch Instruktionen von der Layouterzeugungsinstruktionseinheit. Dementsprechend hat das neugebildete Dokument die betreffenden Regionen mit demselben Layout des Musters eingestellt.
Kurze Beschreibung der Zeichnungen
Es zeigt
Fig. 1 ein Blockdiagramm der Konfiguration einer Dokumentenerstellungsvorrichtung, die in Verbindung mit der erfindungsgemäßen Dokumentenerstellungsunterstützungsvorrichtung eingesetzt wird;
Fig. 2 ein Blockdiagramm der Konfiguration der Layoutanalyseeinheit;
Fig. 3 ein Flußdiagramm einer beispielhaften Prozedur einer Regionenanalyse;
Fig. 4 ein Flußdiagramm einer beispielhaften Prozedur einer Schriftzeichenteilanalyse;
Fig. 5 ein Flußdiagramm einer beispielhaften Prozedur einer Graphikteilanalyse; und
Fig. 6A und 6B Diagramme, die schematisch Beispiele von Dokumentenbildern und einer Layoutanalyse zeigen.
Bevorzugte Ausführungsform der Erfindung
Eine Ausführungsform der Erfindung wird nun anhand der Zeichnungen beschrieben.
Fig. 1 zeigt die Konfiguration einer Dokumentenbildungsvorrichtung wie beispielsweise ein Textprozessor, die in Verbindung mit einer erfindungsgemäßen Vorrichtung zur Unterstützung der Dokumentenbildung verwendet wird. Eine Vorrichtung 1 zur Unterstützung von Dokumentenbildung umfaßt: eine Bildeingabeeinheit (image input section) 2, die ein Dokument als Bild liest, eine Layoutanalyseeinheit 3, die ein Dokumentenlayout auf die Grundlage der von dem Dokument gelesenen Bilder definiert; eine Layouterzeugungsinstruktionsabschnittseinheit (layout generation instruction section) 4, die die Bildung von Graphikboxen instruiert, Schriftzeichenboxen, Bildboxen oder ähnliches entsprechend des analysierten Layouts. Das von der Layouterzeugungsinstruktionseinheit 4 spezifizierte Layout ist von einer Layoutdarstellungseinheit (layout casting section) 5 dargestellt, so daß der Benutzer tatsächlich einen Blick darauf werfen kann. Daten, die von einem Bedienfeld bzw. von einer Maus eingegeben werden, werden gelesen, wobei sie in Schriftzeichen und graphische Elemente durch eine Schriftzeichen/Graphikelementeingabeeinheit 7 konvertiert und in eine jede Box eingegeben werden, die schon ausgelegt worden ist durch eine Inhaltsdarstellungseinheit (content casting section) 8, und die angezeigt werden durch eine Displayeinheit 9. Wird das Layout manuell von einem Bedienfeld/von einer Maus 6 eingegeben, konvertiert eine Layoutkoordinaten-/Attributeingabeeinheit 10 die von einem Bedienfeld bzw. von einer Maus eingebenen Daten und die konvertierten Daten werden der Layouterzeugungsinstruktionseinheit 4 übermittelt.
Fig. 2 zeigt die Konfiguration der Layoutanalyseneinheit 3. Die von dem Dokument von der Bildeingabeeinheit 2 gelesenen Bilder werden in Regionen aufgeteilt wie beispielsweise eine Schriftzeichenregion, eine Region vektorrepräsentierter Graphikelemente und eine Bitmapbildregion. In der Schriftzeichenregion werden Daten (Schriftzeichenbox/Schriftzeichenteilattributdaten) wie beispielsweise die Position der Schriftzeichenregion, die Größe der Schriftzeichen, der Abstand zwischen den Schriftzeichenfolgen (character strings) und die Richtung der Schriftzeichenfolgen werden von einer Schriftzeichenteilanalyseneinheit (character portion analysis section) 12 identifiziert.
In der Graphikregion werden Daten wie der äußere Rahmen eines Graphikelements, der Rahmen von Tabellen, gezogene Linien, Spalten/Zeilenteilungslinien (column/row partitioning line) einer Tabelle erkannt und als Vektordaten (Graphikbox/Zeilendaten) ausgegeben. In der Bildregion werden Daten als Boxdaten produziert.
Im folgenden wird die Funktion der Layoutanalyseeinheit 3 beschrieben.
Die Dokumentbilder, die als ein Musterlayout dienen, werden von der Bildeingabeeinheit 2 (Fig. 1) eingegeben und die Dokumentenbilder, die in binärcodierter Form dargestellt sind, werden von einer Regionenanalyseeinheit 11 analysiert. Obwohl keine Einschränkung auf bestimmte Regionenanalysentechniken erfolgt, besteht eine beispielhafte Technik darin, daß umschriebene Rechtecke, von denen jedes darin miteinander verbundene Bilder umschließt, aufgenommen werden, und daß jedes Rechteck klassifiziert wird nach Größe, Position und ähnlichem.
Fig. 3 zeigt eine exemplarische Prozedur für eine Regionenanalyse.
Umschriebene Rechtecke werden identifiziert (Schritt S101). Alle überlappende, umschriebenen Rechtecke werden in ein einzelnes umschriebenes Rechteck integriert, das alle derartigen überlappenden Rechtecke einschließt (Schritt S102). Solche umschriebenen Rechtecke, deren vertikale oder horizontale Länge die Größe eines Schriftzeichens überschreitet, kann als ein Bitmapbild oder ein vektorrepräsentiertes Graphikelement identifiziert werden (Schritt S103). Wenn beispielsweise Schriftzeichen bis zu einer Größe von 36 Punkten benutzt werden, wird jedes umschriebene Rechteck, dessen Höhe oder Breite größer ist als 13 mm als ein Bitmapbild oder ein vektorrepräsentiertes Graphikelement bewertet. Wenn ein umschriebenes Rechteck unter großen umschriebenen Rechtecken die Bedingungen erfüllt, daß sein Verhältnis Höhe zu Breite ungefähr (annähernd) 1 ist und daß der Prozentsatz der vorliegenden schwarzen Pixel hoch ist, dann kann es als eine Bildregion identifiziert werden (Schritt S104). Ein Verhältnis Höhe zu Breite ungefähr (annähernd) 1 bedeutet Werte im Bereich von 1/3 bis 3. Andere große umschriebene Rechtecke können als Graphikregionen definiert werden. Kleine umschriebene Rechtecke werden als Schriftzeichen bewertet und das kann bestätigt werden durch eine Prüfung der Periodizität der Schriftzeichen in ihren horizontalen und vertikalen Richtungen (Schritt S105). Ein Satz umschriebener Rechtecke, deren Schriftzeichenperiodizität sowohl in horizontaler und in vertikaler Richtung im wesentlichen konstant ist, kann als eine Gruppe von Schriftzeichen identifiziert werden, die dasselbe Attribut haben, das heißt als eine Schriftzeichenregion (Schritt S106). Die zuvorgenannten Prozeduren identifizieren Schriftzeichenregionen, Graphikelementregionen und Bildregionen und liefern Daten über die Größe und die Position einer jeden Region.
Während jede Region durch die Größe und das Verhältnis Höhe zu Breite eines jeden umschriebenen Rechtecks bei der zuvor genannten Regionenanalyse identifiziert wird, können auch andere Analysentechniken angewendet werden. Als ein Beispiel sei ein Verschmelzen der Algorithmen "Marginalverteilungsverfahren" (marginal distribution method) und "Verfahren der Verkettung schwarzer Punkte) genannt, so wie in "Automatic Document Recognition System" (Kida et al.), oder in "Image Electronics Society Journal" (Vol. 15, No. 2, 1986, Seiten 107-115) beschrieben.
Im folgenden wird die Schriftzeichenteilanalyseeinheit 12 beschrieben. Die Einheit 12 analysiert das Muster (pattern) der von der Regionenanalyseeinheit 11 als Schriftzeichenregionen identifizierten Regionen. Durch die Verwendung der Einheit 11 werden unterschiedliche Analysentechniken nicht ausgeschlossen. Eine Technik besteht darin, die zuvor identifizierten umschriebenen Rechtecke und ihre Periodizität zu nutzen. Fig. 4 beschreibt eine derartige exemplarische Prozedur.
Die Richtung einer Schriftzeichenfolge wird zunächst erkannt. Regelmäßig ist der Abstand zwischen Schriftzeichen kleiner als der Abstand zwischen Schriftzeichenfolgen. Zunächst werden die Abstände zwischen Rechtecken identifiziert (Schritt S201) und die Richtung, entweder horizontal oder vertikal, in welcher der Durchschnittsabstand zwischen den umschriebenen Rechtecken kleiner ist, bewertet wird als die Richtung, in der die Schriftzeichen angeordnet sind (Schritt S202). Das heißt, wenn der Abstand in der Vertikalrichtung größer ist als in der Horizontalrichtung, wird dies so bewertet, daß die Schriftzeichen horizontal geschrieben sind und daß der Abstand zwischen den Schriftzeichenfolgen eine vertikale Periodizität aufweisen (Schritt S203). Andernfalls wird angenommen, daß die Schriftzeichen vertikal geschrieben sind und daß der Abstand zwischen den Schriftzeichenfolgen eine horizontale Periodizität aufweisen (Schritt S204).
Die Größe eines Schriftzeichens wird dann aus den Maximumwerten für die Höhe und die Breite eines jeden umschriebenen Rechtecks in der Region berechnet (Schritt S205). Als Ergebnis der zuvorgenannten Prozeduren können die Attribute innerhalb einer jeden Schriftzeichenregion identifiziert werden.
Dann analysiert die Graphikteilsanalyseeinheit 13 die Regionen, die als Graphikregionen von der Regionenanalyseneinheit 11 bewertet werden, und konvertiert die Zeilen- bzw. Strich- oder Linienzeichnungen (line drawings) in Form von Vektoren. Obwohl es möglich ist, alle erkannten Linienzeichnungen in Vektoren auszudrücken, werden nur lange gerade Liniensegmente identifiziert und zwar sowohl horizontale als auch vertikale Liniensegmente, die als bedeutend und so als mehrfach nutzbar hinsichtlich ihrer Funktion als Layoutmuster gelten können. Diese Zeilen- oder Liniensegmente (line segments) schließen ein: Rahmendaten, gezeichnete Linien, Tabellen, die Rahmen aus vertikalen und horizontalen geraden Linien bilden, und Spalten/Zeilenteilungslinien.
Fig. 5 zeigt eine exemplarische Prozedur für die Graphikteilanalyse.
Eine Technik, horizontale und vertikale Striche zu erkennen, besteht darin, daß schwarze Pixel horizontal und vertikal aufgespürt werden und daß solche mit einer vorbestimmten Länge beiseite gesetzt werden (Schritte S301, S302). Die erhaltenen horizontalen und vertikalen Linien werden in Vektordaten konvertiert, die dargestellt werden durch Daten wie die Startpunkt/ Endpunktdaten und Daten bezüglich der Breite (Schritt S303). Zwischen diesen vektorrepräsentierten Daten wird jedes Einzellinienelement, das gegenüber anderen Einzellinienelementen allein steht, als eine Linie oder als eine Spaltenteilungslinie bewertet (Schritt S304). Ein Teilabschnitt, bestehend aus einer Kombination einer Mehrzahl von horizontalen und vertikalen Linien wird als Teil einer Tabelle bewertet (Schritt S305), während ein Teilabschnitt, der ein einzelnes Rechteck mit horizontalen und vertikalen Linien bildet, als eine Graphikbox bewertet wird (Schritt S306). Andernfalls werden die Teilabschnitte als allgemeine Graphikelemente betrachtet.
Die Layoutanalyse ist mit den vorgenannten Prozeduren abgeschlossen und die Dokumentbilder, die von der Bildeingabeeinheit 2 gelesen werden, werden aufgeteilt in die Schriftzeichenregion, die Bildregion und die Graphikregion. Die Graphikregion schließt Tabellen und Linien ein. Die Schriftzeichenregion schließt zusätzlich Attribute wie die Schriftzeichengröße, den Abstand zwischen den Schriftzeichenfolgen und die Richtung der Schriftzeichenfolgen ein.
Die Layouterzeugungsinstruktionseinheit 4, die in Fig. 1 dargestellt ist, instruiert die Layoutdarstellung (layout casting), basierend auf den zuvorgenannten Daten, die der Layoutdarstellungseinheit 5 zugeführt worden sind, so daß jede Region angeordnet werden kann wie instruiert.
Beispielsweise, wenn ein Dokument als ein Muster dient, das einen Schriftzeichenabschnitt a, einen Bitmapbildabschnitt b, einen Graphikabschnitt c, eine Teilungslinie d, und eine Tabelle e wie in Fig. 6A dargestellt einschließt, von der Bildeingabeeinheit 2 gelesen wird, dann erzeugt eine Layoutanalyse auf diesem Dokument ein Layout, welches schematisch in Fig. 6B dargestellt ist. In Fig. 6B bezeichnet das Bezugszeichen A eine Schriftzeichenregion; B eine Bildregion; C eine Graphikregion; D eine Teilungslinie und E eine Tabellenstruktur. Da die betreffenden durch die Layoutanalyse identifizierten Regionen auf einem Bildschirm der Displayeinheit 9 angezeigt worden sind, auf der Dokumente anzuzeigen sind, spezifiziert der Benutzer eine Region, in welche Schriftzeichen oder Graphikelemente durch eine Tastatur/eine Maus 6 eingegeben werden. Somit verbleibt für dein Benutzer lediglich der Vorgang der Eingabe der gewünschten Daten in die entsprechenden Regionen durch die Tastatur/die Maus 6, um ein Dokument zu erstellen, das das gewünschte Layout hat.
Um ein Bitmapbild direkt in ein Dokument einzufügen, kann das Bilddatum, das von der Bildeingabeeinheit 2 eingeben worden ist, zu der Inhaltdarstellungseinheit (content casting section) 8 zwecks Synthese mit dem Dokument übermittelt werden.
Der Dokumentenersteller kann das Layout der betreffenden, von der Layoutanalyse erzeugten Regionen wie gewünscht editieren und die Inhalte können in den editierten Regionen ausgelegt werden.
Während die Dokumentenbildung als ein Beispiel bei der zuvor beschriebenen Ausführungsform gewählt worden ist, kann die Erfindung auf die Bildung eines vorformatierten Dokuments wie beispielsweise ein Zettel (slip) angewendet werden.
Während für Tabellen nur die vertikalen und horizontalen Linien reproduziert werden, basierend auf den Vektordaten, die durch die Analyse bei der oben genannten Ausführungsform erhalten worden sind, können Daten, die Attribute wie beispielsweise Reihen und Spalten von Tabellen bezeichnen, ausgegeben werden anstelle von Vektordaten, wenn die Dokumentenbildungsvorrichtung Tabellenstrukturen generieren und verwalten kann.
Während bei der oben beschriebenen Ausführungsform die Daten, die in einem Schriftzeichenabschnitt identifiziert worden sind, nur die Größe der Schriftzeichen, den Abstand zwischen Schriftzeichenfolgen und den Schreibstil im Sinne von vertikal oder horizontal, betreffen, können Daten wie der Unterschied in kalligraphischem Stil oder Sprachenunterschiede, zum Beispiel Japanisch oder Englisch, identifiziert werden und als zusätzliche Attribute eingeschlossen werden.
Wenn vorgesehen ist, daß die entsprechenden Schriftzeichen in einer Schriftzeichenregion erkannt werden und entsprechende Graphikelemente in einer Graphikregion, dann sind nicht nur die Layoutdaten sondern auch dessen Inhalt wiederverwendbar.
Wie zuvor beschrieben wurde, wird im Rahmen der Erfindung automatisch ein Layout erzeugt, das auf den Bildern basiert, die von einem Dokument gelesen werden. Wenn daher ein Dokument mit einem entsprechenden Layout erzeugt wird, hat der Benutzer nicht die Prozeduren der Regionenfestlegung und der Vorgangsrevisionen zu durchlaufen; mindestens jedoch werden die durchzuführenden Operationen vereinfacht, wodurch die Effizienz der Dokumentenbildung verbessert wird. Zusätzlich ist es nicht mehr erforderlich, Dokumente mit Standardlayouts vorzubereiten oder zu registrieren, wodurch nicht nur Arbeitsaufwand sondern auch große Speicherkapazität eingespart wird.
Bezugszeichenliste
 1 Vorrichtung zur Unterstützung der Dokumentenbildung
 2 Bildeingabeeinheit
 3 Layoutanalyseneinheit
 4 Layouterzeugungsinstruktionseinheit
 5 Layoutdarstellungseinheit
 6 Tastatur/Maus
 7 Schriftzeichen/Graphikeingabeeinheit
 8 Inhaltdarstellungseinheit
 9 Anzeigeeinheit
10 Layoutkoordinaten/attributeingabeeinheit
Dokumentenbilder
11 Regionenanalyseeinheit
Bildboxdaten
12 Schriftzeichenteilanalyseeinheit
Schriftzeichenbox/Schriftzeichenteilattributdaten
13 Graphikabschnittsanalyseeinheit
Graphikbox/Linien- bzw. Zeilendaten
Legenden Fig. 3
Start
S101 Umschriebene Rechtecke identifizieren
S102 Überlappende umschriebene Rechtecke in Einzelrechtecke integrieren
S103 Ist Höhe/Breite des umschriebenen Rechtecks größer als Schriftzeichengröße?
Nein
S105 Periodizität zwischen Rechtecken identifizieren
S106 Rechtecke mit derselben Periodizität in Einzelrechtecke integrieren
Schriftzeichenregion
Ja
S104 Breite zu Höhen-Verhältnis ungefähr gleich "1" und
Prozentsatz von Schwarz im Rechteck kleiner als vorbestimmter Wert?
Ja
Bildregion
Nein
Graphikregion
Legenden Fig. 4
Start
S201 Entfernungen zwischen Rechtecken identifizieren
S202 Ist vertikaler Abstand größer als horizontaler Abstand?
Nein
S204 Vertikalschreiben
Entfernung zwischen Schriftzeichenfolgen = horizontale Periodizität
Ja
S203 Horizontalschreiben
Entfernung zwischen Schriftzeichenfolgen = vertikale Periodizität
S205 Schriftzeichenhöhe = Maximumrechteckhöhe
Schriftzeichenbreite = Maximumrechteckbreite
Ende
Legenden Fig. 5
Start
S301 Abschnitt mit Anzahl von Pixeln, die einen vorbestimmten Wert in horizontaler Richtung überschreitet, identifizieren
S302 Abschnitt mit Anzahl von Pixeln, die einen vorbestimmten Wert in vertikaler Richtung überschreitet, identifizieren
S303 Indentifiziertes Liniensegment in Vektordaten konvertieren
S304 Ist vorliegender Vektor allein?
Ja
Spalten/Reihenteilungslinie
Nein
S305 Ist Mehrzahl horizontaler/vertikaler Linien eingeschlossen?
Ja
Tabellenregion
Nein
S306 Besteht Vektor aus Rechteck?
Ja
Graphikregionenbox
Nein
Allgemeine graphische Elemente

Claims (2)

1. Vorrichtung (1) zur Unterstützung einer Dokumentenerstellung in einer Dokumentenerstellungsvorrichtung, die bei der Erstellung eines Dokuments Regionen definiert, die sich hinsichtlich ihrer Attribute der Bilder voneinander unterscheiden, die in diesem Dokument enthalten sind, und die jede dieser Regionen unterschiedlich bearbeitet, bestehend aus
  • - einer Bildeingabeeinheit (2), die das als Muster eines Bildes bildende Dokument liest,
  • - einer Layoutanalyseeinheit (3), die Attribute der von dem Dokument gelesenen Bilder liest und Layoutdaten, die Größe, Position, und Attribute einer jeden Region basierend auf Unterschieden in den bewerteten Attribute identifiziert, und
  • - eine Layouterstellungsinstruktionseinheit (4) zum Anweisen, dieselben Regionen wie jene auf dem als Muster dienenden Dokument auf dem zu bildenden Dokument basierend auf den identifizierten Layoutdaten einzustellen.
2. Vorrichtung (1) nach Anspruch 1, dadurch gekennzeichnet, daß die Layoutanalyseeinheit (2) aufweist
  • - eine Regionenanalyseeinheit (11), die eine Schriftzeichenregion, eine Graphikregion und eine Bildregion von den Bildern des Dokuments identifiziert;
  • - eine Schriftzeichenteilanalyseeinheit (12), die einen Schriftzeichenteilabschnitt innerhalb der Schriftzeichenregion analysiert, und
  • - eine Graphikteilanalyseeinheit (13), die eine Linienkomponente innerhalb eines graphischen Elements durch Analyse eines Graphikteilabschnitts innerhalb der Graphikregion identifiziert und die Linienkomponente als Vektordaten ausgibt.
DE4121564A 1990-06-28 1991-06-28 Vorrichtung zur Erstellung von Dokumenten Expired - Lifetime DE4121564C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2172326A JPH0612540B2 (ja) 1990-06-28 1990-06-28 文書作成支援装置

Publications (2)

Publication Number Publication Date
DE4121564A1 true DE4121564A1 (de) 1992-01-09
DE4121564C2 DE4121564C2 (de) 1995-02-16

Family

ID=15939835

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4121564A Expired - Lifetime DE4121564C2 (de) 1990-06-28 1991-06-28 Vorrichtung zur Erstellung von Dokumenten

Country Status (3)

Country Link
JP (1) JPH0612540B2 (de)
DE (1) DE4121564C2 (de)
GB (1) GB2247803B (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4330242A1 (de) * 1993-09-07 1995-03-09 Hell Ag Linotype Verfahren und Einrichtung zur elektronischen Montage von Druckbogen
WO2002037182A2 (en) * 2000-10-31 2002-05-10 Mentor Graphics Corporation Method and apparatus for creating photolithographic masks
US8248625B2 (en) 2006-09-25 2012-08-21 Vistaprint Technologies Limited Preparation of aggregate jobs for production
US9645774B2 (en) 2000-01-25 2017-05-09 Cimpress Usa Incorporated Managing print jobs

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5808747A (en) * 1996-05-30 1998-09-15 Eastman Kodak Company Apparatus and method for production of signatures
AU2001231078A1 (en) 2000-01-25 2001-08-07 Vistaprint Usa, Inc. Managing print jobs
US7493292B2 (en) * 2001-02-15 2009-02-17 Glenn Petkovsek System and a method for automating delivery of communication by a special service
JP2006318142A (ja) * 2005-05-11 2006-11-24 Fujitsu Ltd 紙面レイアウト方法
JP4781214B2 (ja) * 2006-09-27 2011-09-28 株式会社沖データ 印刷システム及び複合端末装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0328900A2 (de) * 1988-01-21 1989-08-23 Kabushiki Kaisha Toshiba Verfahren und Gerät zur Aufbereitung von Dokumenten

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
JPH0214392A (ja) * 1988-07-01 1990-01-18 Fuji Electric Co Ltd 文書領域解析装置
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0328900A2 (de) * 1988-01-21 1989-08-23 Kabushiki Kaisha Toshiba Verfahren und Gerät zur Aufbereitung von Dokumenten

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4330242A1 (de) * 1993-09-07 1995-03-09 Hell Ag Linotype Verfahren und Einrichtung zur elektronischen Montage von Druckbogen
US5809218A (en) * 1993-09-07 1998-09-15 Linotyoe-Hell Ag Method for the electronic assembly of printer's forms
US9645774B2 (en) 2000-01-25 2017-05-09 Cimpress Usa Incorporated Managing print jobs
WO2002037182A2 (en) * 2000-10-31 2002-05-10 Mentor Graphics Corporation Method and apparatus for creating photolithographic masks
WO2002037182A3 (en) * 2000-10-31 2004-02-26 Mentor Graphics Corp Method and apparatus for creating photolithographic masks
US6728946B1 (en) 2000-10-31 2004-04-27 Franklin M. Schellenberg Method and apparatus for creating photolithographic masks
US7174531B2 (en) 2000-10-31 2007-02-06 Schellenberg Franklin M Creating photolithographic masks
US8248625B2 (en) 2006-09-25 2012-08-21 Vistaprint Technologies Limited Preparation of aggregate jobs for production

Also Published As

Publication number Publication date
JPH0612540B2 (ja) 1994-02-16
GB2247803A (en) 1992-03-11
JPH0460759A (ja) 1992-02-26
GB9113488D0 (en) 1991-08-07
GB2247803B (en) 1995-01-18
DE4121564C2 (de) 1995-02-16

Similar Documents

Publication Publication Date Title
DE69610882T2 (de) Blockselektionsystem, bei dem überlappende Blöcke aufgespaltet werden
DE69132816T2 (de) Veränderung eines graphischen Anzeigebildes
DE3806223C2 (de) Verfahren zur Erzeugung von Zeichenmustern
DE3650391T2 (de) Erzeugung von Figuren in einem Dokumentformattierer direkt von einem Identifizierungskennzeichen.
DE69133362T2 (de) Dokumentenverarbeitungs-verfahren und -gerät, entsprechende Program und Speichereinheit
DE69933404T2 (de) System und Verfahren zum gemeinsamen Benutzen von Fonts und Speichermedium für das Programm zum Ausführen des Verfahrens
DE69030550T2 (de) Verfahren und System zur Erzeugung von Plänen für einen Herstellungsprozess
DE69033079T2 (de) Aufbereitung von Text in einem Bild
DE3588084T2 (de) Bildverarbeitungssystem
DE68926068T2 (de) Dokumentenverarbeitungssystem
DE69232493T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE69332286T2 (de) Verfahren und Vorrichtung zur Verarbeitung von Farbbildern
DE69630928T2 (de) Vorrichtung und Verfahren zum Anzeigen einer Übersetzung
DE69130382T2 (de) Zeichenverarbeitungsverfahren
DE69434405T2 (de) Verfahren zur Erzeugung eines visuellen Entwurfs
DE3850595T2 (de) Dokumentverarbeitungssystem.
DE69722246T2 (de) Grafiksystem und verfahren zur anpassung von objekten an schablone
DE69629173T2 (de) Automatisches Plazieren eines graphischen Musters
DE69321763T2 (de) Datenverarbeitungsverfahren und -vorrichtung
DE3411939A1 (de) Verfahren und vorrichtung zur bildwiedergewinnung unter verwendung von annotationen als leitinformation
DE3586646T2 (de) Bildanzeigegeraet.
DE3625390A1 (de) Graphisches anzeigesystem mit beliebiger rberlappung von bildausschnitten
DE10105941A1 (de) System und Verfahren zum automatischen Zuweisen eines Dateinamens zu einem gescannten Dokument
DE69230392T2 (de) Verfahren und Gerät zur Bildverarbeitung
DE69222255T2 (de) Verarbeitungsverfahren für Zeichen oder graphische Daten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
R071 Expiry of right
R071 Expiry of right