DE4121564A1 - Vorrichtung zur unterstuetzung einer dokumentenerstellung - Google Patents
Vorrichtung zur unterstuetzung einer dokumentenerstellungInfo
- Publication number
- DE4121564A1 DE4121564A1 DE4121564A DE4121564A DE4121564A1 DE 4121564 A1 DE4121564 A1 DE 4121564A1 DE 4121564 A DE4121564 A DE 4121564A DE 4121564 A DE4121564 A DE 4121564A DE 4121564 A1 DE4121564 A1 DE 4121564A1
- Authority
- DE
- Germany
- Prior art keywords
- document
- region
- layout
- character
- graphic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- Processing Or Creating Images (AREA)
- Character Input (AREA)
Description
Die Erfindung bezieht sich auf Dokumentenerstellungsvorrichtungen
wie Textprozessoren und Arbeitsstationen, und insbesondere auf
eine Vorrichtung, die Dokumentenerstellung unterstützt, die elektronisch
Dokumentenlayouts komplexer Muster produziert, wobei
diese heterogene Daten wie Zeichen (characters), graphische Zeichen
und Bilder umfassen.
Bei der Erstellung von Dokumenten mittels Dokumentenerstellungsvorrichtungen
wie Textprozessoren (word processors) und Arbeitsstationen
(workstations) ist es manchmal erwünscht, daß ein Satz
unterschiedlicher Typen von Daten wie beispielsweise (alphanumerische)
Zeichen (characters) einschließlich Schriftzeichen, graphische
Daten, die durch Vektordaten wie gerade oder gekrümmte
Linien repräsentiert sind, sogenannte Bitmapbilder (bit map
images), spezifiziert durch Bitmuster (bit patterns) wie zum
Beispiel Bilder, die von Bildlesevorrichtungen gelesen werden,
gemischt werden.
Bei der Bildung derartiger Dokumente mit heterogenen Daten
einschl. Schriftzeichen (characters im Sinne von alphanumerischen
Zeichen und/oder Schriftzeichen wie beispielsweise japanische
Schriftzeichen), graphische Zeichen in Vektordarstellung (vectorexpressed
graphics), und Bitmapbildern, bestehen Unterschiede
zwischen der Datenprozeßbetriebsart (data processing mode) von
einem Datentyp zu jeweils einem anderen Datentyp innerhalb der
Dokumentenerstellungsvorrichtung. Um bei diesen Gegebenheiten die
Prozeßeffizienz zu verbessern, werden Boxen bzw. Schreibfelder
(boxes) wie eine Schriftzeichenbox (character box), eine Graphenbox
(graphic box) und eine Bildbox in einem Dokument definiert,
und wenn das Dokument erstellt oder editiert wird, werden die
Attribute (attributes) einer jeden Prozeßbox bewertet und die
betreffende Box wird gemäß der bewerteten Attribute bearbeitet.
In dieser Beschreibung wird der Begriff "Bild" (image) in einem
weiten Sinn verwendet, wobei dieser Begriff Schriftzeichen (characters),
durch Vektoren bezeichnete graphische Elemente (vectorexpressed
graphics), Bitmapbilder und ähnliches umfaßt, während
der Begriff "Bild" im engeren Sinn nur Bitmapbilder umfaßt.
Um mittels herkömmlicher Dokumentenerstellungsvorrichtungen ein
Dokument zu erstellen, das eine Mischung von Schriftzeichen,
durch Vektoren bezeichnete graphische Elemente, Bitmapbilder und
ähnliches enthält, hat die Bedienperson die Boxen entsprechend
der Attribute im Dokument zu spezifizieren und ihre Größe und
Lage anzupassen.
Jedoch ist eine derartige Boxspezifikation und -anpassung für
jeden Boxtyp vorzunehmen, daß heißt für die Schriftzeichenbox,
die Graphikbox und die Bildbox. Außerdem ist derselbe Vorgang zu
wiederholen, wenn eine Mehrzahl von Boxen vorliegt, die durch
dasselbe Attribut definiert sind. Dieser Umstand macht den herkömmlichen
Dokumentenbildungsvorgang schwerfällig und zeitlich
aufwendig.
Insbesondere sind auch, wenn schon ein entsprechendes Dokument
existiert und dasselbe Layout dieses Dokuments benutzt werden
soll, die zuvor genannten Eingabeoperationen einzeln nacheinander
durchzuführen, was die Bedienperson mit Arbeitsaufwand belastet
und eine entsprechende geistige Anstrengung erfordert.
Eine Methode, diese Situation zu verbessern, ist es, eine Vielzahl
von Dokumententypen vorzubereiten, wobei jedes Dokument ein
Standardlayout hat, und dann später bei der eigentlichen Dokumentenerstellung
ein Dokument zu suchen und zu kopieren, das das
gewünschte Layout aufweist, sowie bedarfsweise die gewünschten
Daten in das Dokument einzugeben.
Diese Methode setzt allerdings voraus, alle Standardlayouts vorzuregistrieren,
was einen extrem umfangreichen Arbeitsaufwand für
die ursprünglichen Eingabeoperationen erfordert. Zusätzlich sind
die Dokumente mit allen Standardlayouts zu registrieren, was eine
außerordentlich große Speicherkapazität erfordert. Um schließlich
die registrierten Layouts zu benutzen, ist weiterhin stets die
Suchoperation nach dem Ziellayout vorzunehmen. Ist die Zahl der
registrierten Layouts groß, erweist sich die Suchoperation als
eine nicht einfache Aufgabe.
Die vorliegende Erfindung löst die vorgenannten Probleme. Dementsprechend
ist es eine Aufgabe, eine Vorrichtung zur Unterstützung
einer Dokumentenerstellung anzugeben, die verschiedene Layouttypen
mit Boxen bzw. Schreibfelder (boxes) selbsttätig erzeugen
kann, wenn Dokumente vorliegen, deren Layouts als Muster für die
Layouts des zu bildenden Dokuments dienen, wodurch die Effizienz
der Dokumentenbildung verbessert wird.
Um diese Aufgabe zu lösen wird die Vorrichtung zur Unterstützung
einer Dokumentenerstellung in einer Dokumentenerstellungsvorrichtung
angewendet, die bei der Erstellung eines Dokuments Regionen
definiert, die sich hinsichtlich ihrer Attribute der Bilder
voneinander unterscheiden, die in diesem Dokument enthalten
sind, und die jeder dieser Regionen unterschiedlich bearbeitet.
Eine derartige Vorrichtung zur Unterstützung von Dokumentenbildung
in einer Dokumentenbildungsvorrichtung besteht aus einer
Bildeingabeeinheit, die das als Muster eines Bildes bildende
Dokument liest, einer Layoutanalyseeinheit, die Attribute der
von dem Dokument gelesenen Bilder liest und Layoutdaten, die
Größe, Position, und Attribute einer jeden Region basierend auf
Unterschieden in den gewerteten Attribute identifiziert, und eine
Layouterzeugungsinstruktionseinheit (layout generating instruction
section), die anweist, dieselben Regionen wie jene auf dem
als Muster dienenden Dokument auf dem zu bildenden Dokument
basierend auf den identifizierten Layoutdaten einzustellen.
Die Layoutanalyseeinheit (layout analysis section) kann umfassen:
eine Regionenanalyseeinheit (region analysis section), die eine
Schriftzeichenregion, eine Graphikregion und eine Bildregion von
den Bildern des Dokuments identifiziert; eine Schriftzeichenteilanalyseeinheit
(character portion analysis section), die
einen Schriftzeichenteil innerhalb der Schriftzeichenregion analysiert,
und eine Graphikteilanalyseeinheit (graphic portion
analysis section), die eine Zeilenkomponente innerhalb eines
graphischen Elements durch Analyse eines Graphikteils innerhalb
der Graphikregion identifiziert und die identifizierte Zeilenkomponente
als Vektordaten ausgibt.
Im Rahmen der Erfindung wird ein Dokument, das als ein Muster
dient, als Bilder gelesen und die Regionen in den gelesenen
Bildern werden durch die Layoutanalyseeinheit identifiziert, wenn
ein Layout des Dokuments zu spezifizieren ist. Beispielsweise
werden durch eine Linie umschlossene (circumscribed), das heißt
umschriebene Rechtecke gekoppelter, in dem Dokument enthaltener
Bilder identifiziert, und ob jedes umschriebene Rechteck eine
Schriftzeichenregion, eine Graphikregion oder eine Bildregion
ist, wird durch die Größe, Position und ähnliche Parameter des
umschriebenen Rechtecks bewertet. Dann werden die entsprechenden
Regionen spezifiziert zu einem neuzubildenden Dokument basierend
auf diesen analysierten Regionen durch Instruktionen von der
Layouterzeugungsinstruktionseinheit. Dementsprechend hat das neugebildete
Dokument die betreffenden Regionen mit demselben Layout
des Musters eingestellt.
Es zeigt
Fig. 1 ein Blockdiagramm der Konfiguration einer Dokumentenerstellungsvorrichtung,
die in Verbindung mit der erfindungsgemäßen
Dokumentenerstellungsunterstützungsvorrichtung eingesetzt
wird;
Fig. 2 ein Blockdiagramm der Konfiguration der Layoutanalyseeinheit;
Fig. 3 ein Flußdiagramm einer beispielhaften Prozedur einer
Regionenanalyse;
Fig. 4 ein Flußdiagramm einer beispielhaften Prozedur einer
Schriftzeichenteilanalyse;
Fig. 5 ein Flußdiagramm einer beispielhaften Prozedur einer
Graphikteilanalyse; und
Fig. 6A und 6B Diagramme, die schematisch Beispiele von
Dokumentenbildern und einer Layoutanalyse zeigen.
Eine Ausführungsform der Erfindung wird nun anhand der
Zeichnungen beschrieben.
Fig. 1 zeigt die Konfiguration einer Dokumentenbildungsvorrichtung
wie beispielsweise ein Textprozessor, die in Verbindung mit
einer erfindungsgemäßen Vorrichtung zur Unterstützung der Dokumentenbildung
verwendet wird. Eine Vorrichtung 1 zur Unterstützung
von Dokumentenbildung umfaßt: eine Bildeingabeeinheit (image
input section) 2, die ein Dokument als Bild liest, eine Layoutanalyseeinheit
3, die ein Dokumentenlayout auf die Grundlage der
von dem Dokument gelesenen Bilder definiert; eine Layouterzeugungsinstruktionsabschnittseinheit
(layout generation instruction
section) 4, die die Bildung von Graphikboxen instruiert, Schriftzeichenboxen,
Bildboxen oder ähnliches entsprechend des analysierten
Layouts. Das von der Layouterzeugungsinstruktionseinheit
4 spezifizierte Layout ist von einer Layoutdarstellungseinheit
(layout casting section) 5 dargestellt, so daß der Benutzer
tatsächlich einen Blick darauf werfen kann. Daten, die von einem
Bedienfeld bzw. von einer Maus eingegeben werden, werden gelesen,
wobei sie in Schriftzeichen und graphische Elemente durch eine
Schriftzeichen/Graphikelementeingabeeinheit 7 konvertiert und in
eine jede Box eingegeben werden, die schon ausgelegt worden ist
durch eine Inhaltsdarstellungseinheit (content casting section)
8, und die angezeigt werden durch eine Displayeinheit 9. Wird das
Layout manuell von einem Bedienfeld/von einer Maus 6 eingegeben,
konvertiert eine Layoutkoordinaten-/Attributeingabeeinheit 10 die
von einem Bedienfeld bzw. von einer Maus eingebenen Daten und die
konvertierten Daten werden der Layouterzeugungsinstruktionseinheit
4 übermittelt.
Fig. 2 zeigt die Konfiguration der Layoutanalyseneinheit 3. Die
von dem Dokument von der Bildeingabeeinheit 2 gelesenen Bilder
werden in Regionen aufgeteilt wie beispielsweise eine Schriftzeichenregion,
eine Region vektorrepräsentierter Graphikelemente
und eine Bitmapbildregion. In der Schriftzeichenregion werden
Daten (Schriftzeichenbox/Schriftzeichenteilattributdaten) wie
beispielsweise die Position der Schriftzeichenregion, die Größe
der Schriftzeichen, der Abstand zwischen den Schriftzeichenfolgen
(character strings) und die Richtung der Schriftzeichenfolgen
werden von einer Schriftzeichenteilanalyseneinheit (character
portion analysis section) 12 identifiziert.
In der Graphikregion werden Daten wie der äußere Rahmen eines
Graphikelements, der Rahmen von Tabellen, gezogene Linien, Spalten/Zeilenteilungslinien
(column/row partitioning line) einer
Tabelle erkannt und als Vektordaten (Graphikbox/Zeilendaten)
ausgegeben. In der Bildregion werden Daten als Boxdaten produziert.
Im folgenden wird die Funktion der Layoutanalyseeinheit 3
beschrieben.
Die Dokumentbilder, die als ein Musterlayout dienen, werden von
der Bildeingabeeinheit 2 (Fig. 1) eingegeben und die Dokumentenbilder,
die in binärcodierter Form dargestellt sind, werden von
einer Regionenanalyseeinheit 11 analysiert. Obwohl keine Einschränkung
auf bestimmte Regionenanalysentechniken erfolgt, besteht
eine beispielhafte Technik darin, daß umschriebene Rechtecke,
von denen jedes darin miteinander verbundene Bilder umschließt,
aufgenommen werden, und daß jedes Rechteck klassifiziert
wird nach Größe, Position und ähnlichem.
Fig. 3 zeigt eine exemplarische Prozedur für eine Regionenanalyse.
Umschriebene Rechtecke werden identifiziert (Schritt S101). Alle
überlappende, umschriebenen Rechtecke werden in ein einzelnes
umschriebenes Rechteck integriert, das alle derartigen überlappenden
Rechtecke einschließt (Schritt S102). Solche umschriebenen
Rechtecke, deren vertikale oder horizontale Länge die Größe
eines Schriftzeichens überschreitet, kann als ein Bitmapbild oder
ein vektorrepräsentiertes Graphikelement identifiziert werden
(Schritt S103). Wenn beispielsweise Schriftzeichen bis zu einer
Größe von 36 Punkten benutzt werden, wird jedes umschriebene
Rechteck, dessen Höhe oder Breite größer ist als 13 mm als ein
Bitmapbild oder ein vektorrepräsentiertes Graphikelement bewertet.
Wenn ein umschriebenes Rechteck unter großen umschriebenen
Rechtecken die Bedingungen erfüllt, daß sein Verhältnis Höhe zu
Breite ungefähr (annähernd) 1 ist und daß der Prozentsatz der
vorliegenden schwarzen Pixel hoch ist, dann kann es als eine
Bildregion identifiziert werden (Schritt S104). Ein Verhältnis
Höhe zu Breite ungefähr (annähernd) 1 bedeutet Werte im Bereich
von 1/3 bis 3. Andere große umschriebene Rechtecke können als
Graphikregionen definiert werden. Kleine umschriebene Rechtecke
werden als Schriftzeichen bewertet und das kann bestätigt werden
durch eine Prüfung der Periodizität der Schriftzeichen in ihren
horizontalen und vertikalen Richtungen (Schritt S105). Ein Satz
umschriebener Rechtecke, deren Schriftzeichenperiodizität sowohl
in horizontaler und in vertikaler Richtung im wesentlichen konstant
ist, kann als eine Gruppe von Schriftzeichen identifiziert
werden, die dasselbe Attribut haben, das heißt als eine Schriftzeichenregion
(Schritt S106). Die zuvorgenannten Prozeduren
identifizieren Schriftzeichenregionen, Graphikelementregionen und
Bildregionen und liefern Daten über die Größe und die Position
einer jeden Region.
Während jede Region durch die Größe und das Verhältnis Höhe zu
Breite eines jeden umschriebenen Rechtecks bei der zuvor genannten
Regionenanalyse identifiziert wird, können auch andere Analysentechniken
angewendet werden. Als ein Beispiel sei ein Verschmelzen
der Algorithmen "Marginalverteilungsverfahren" (marginal
distribution method) und "Verfahren der Verkettung schwarzer
Punkte) genannt, so wie in "Automatic Document Recognition System"
(Kida et al.), oder in "Image Electronics Society Journal"
(Vol. 15, No. 2, 1986, Seiten 107-115) beschrieben.
Im folgenden wird die Schriftzeichenteilanalyseeinheit 12 beschrieben.
Die Einheit 12 analysiert das Muster (pattern) der von
der Regionenanalyseeinheit 11 als Schriftzeichenregionen identifizierten
Regionen. Durch die Verwendung der Einheit 11 werden
unterschiedliche Analysentechniken nicht ausgeschlossen. Eine
Technik besteht darin, die zuvor identifizierten umschriebenen
Rechtecke und ihre Periodizität zu nutzen. Fig. 4 beschreibt
eine derartige exemplarische Prozedur.
Die Richtung einer Schriftzeichenfolge wird zunächst erkannt.
Regelmäßig ist der Abstand zwischen Schriftzeichen kleiner als
der Abstand zwischen Schriftzeichenfolgen. Zunächst werden die
Abstände zwischen Rechtecken identifiziert (Schritt S201) und die
Richtung, entweder horizontal oder vertikal, in welcher der
Durchschnittsabstand zwischen den umschriebenen Rechtecken kleiner
ist, bewertet wird als die Richtung, in der die Schriftzeichen
angeordnet sind (Schritt S202). Das heißt, wenn der Abstand
in der Vertikalrichtung größer ist als in der Horizontalrichtung,
wird dies so bewertet, daß die Schriftzeichen horizontal geschrieben
sind und daß der Abstand zwischen den Schriftzeichenfolgen
eine vertikale Periodizität aufweisen (Schritt S203). Andernfalls
wird angenommen, daß die Schriftzeichen vertikal geschrieben
sind und daß der Abstand zwischen den Schriftzeichenfolgen
eine horizontale Periodizität aufweisen (Schritt S204).
Die Größe eines Schriftzeichens wird dann aus den Maximumwerten
für die Höhe und die Breite eines jeden umschriebenen Rechtecks
in der Region berechnet (Schritt S205). Als Ergebnis der zuvorgenannten
Prozeduren können die Attribute innerhalb einer jeden
Schriftzeichenregion identifiziert werden.
Dann analysiert die Graphikteilsanalyseeinheit 13 die Regionen,
die als Graphikregionen von der Regionenanalyseneinheit 11 bewertet
werden, und konvertiert die Zeilen- bzw. Strich- oder Linienzeichnungen
(line drawings) in Form von Vektoren. Obwohl es
möglich ist, alle erkannten Linienzeichnungen in Vektoren auszudrücken,
werden nur lange gerade Liniensegmente identifiziert und
zwar sowohl horizontale als auch vertikale Liniensegmente, die als
bedeutend und so als mehrfach nutzbar hinsichtlich ihrer Funktion
als Layoutmuster gelten können. Diese Zeilen- oder Liniensegmente
(line segments) schließen ein: Rahmendaten, gezeichnete Linien,
Tabellen, die Rahmen aus vertikalen und horizontalen geraden
Linien bilden, und Spalten/Zeilenteilungslinien.
Fig. 5 zeigt eine exemplarische Prozedur für die Graphikteilanalyse.
Eine Technik, horizontale und vertikale Striche zu erkennen,
besteht darin, daß schwarze Pixel horizontal und vertikal aufgespürt
werden und daß solche mit einer vorbestimmten Länge
beiseite gesetzt werden (Schritte S301, S302). Die erhaltenen
horizontalen und vertikalen Linien werden in Vektordaten konvertiert,
die dargestellt werden durch Daten wie die Startpunkt/
Endpunktdaten und Daten bezüglich der Breite (Schritt S303).
Zwischen diesen vektorrepräsentierten Daten wird jedes Einzellinienelement,
das gegenüber anderen Einzellinienelementen allein
steht, als eine Linie oder als eine Spaltenteilungslinie bewertet
(Schritt S304). Ein Teilabschnitt, bestehend aus einer Kombination
einer Mehrzahl von horizontalen und vertikalen Linien wird
als Teil einer Tabelle bewertet (Schritt S305), während ein
Teilabschnitt, der ein einzelnes Rechteck mit horizontalen und
vertikalen Linien bildet, als eine Graphikbox bewertet wird
(Schritt S306). Andernfalls werden die Teilabschnitte als allgemeine
Graphikelemente betrachtet.
Die Layoutanalyse ist mit den vorgenannten Prozeduren abgeschlossen
und die Dokumentbilder, die von der Bildeingabeeinheit 2
gelesen werden, werden aufgeteilt in die Schriftzeichenregion,
die Bildregion und die Graphikregion. Die Graphikregion schließt
Tabellen und Linien ein. Die Schriftzeichenregion schließt zusätzlich
Attribute wie die Schriftzeichengröße, den Abstand zwischen
den Schriftzeichenfolgen und die Richtung der Schriftzeichenfolgen
ein.
Die Layouterzeugungsinstruktionseinheit 4, die in Fig. 1 dargestellt
ist, instruiert die Layoutdarstellung (layout casting),
basierend auf den zuvorgenannten Daten, die der Layoutdarstellungseinheit
5 zugeführt worden sind, so daß jede Region angeordnet
werden kann wie instruiert.
Beispielsweise, wenn ein Dokument als ein Muster dient, das einen
Schriftzeichenabschnitt a, einen Bitmapbildabschnitt b, einen
Graphikabschnitt c, eine Teilungslinie d, und eine Tabelle e wie
in Fig. 6A dargestellt einschließt, von der Bildeingabeeinheit 2
gelesen wird, dann erzeugt eine Layoutanalyse auf diesem Dokument
ein Layout, welches schematisch in Fig. 6B dargestellt ist. In
Fig. 6B bezeichnet das Bezugszeichen A eine Schriftzeichenregion;
B eine Bildregion; C eine Graphikregion; D eine Teilungslinie
und E eine Tabellenstruktur. Da die betreffenden durch die
Layoutanalyse identifizierten Regionen auf einem Bildschirm der
Displayeinheit 9 angezeigt worden sind, auf der Dokumente anzuzeigen
sind, spezifiziert der Benutzer eine Region, in welche
Schriftzeichen oder Graphikelemente durch eine Tastatur/eine Maus
6 eingegeben werden. Somit verbleibt für dein Benutzer lediglich
der Vorgang der Eingabe der gewünschten Daten in die entsprechenden
Regionen durch die Tastatur/die Maus 6, um ein Dokument zu
erstellen, das das gewünschte Layout hat.
Um ein Bitmapbild direkt in ein Dokument einzufügen, kann das
Bilddatum, das von der Bildeingabeeinheit 2 eingeben worden
ist, zu der Inhaltdarstellungseinheit (content casting section) 8
zwecks Synthese mit dem Dokument übermittelt werden.
Der Dokumentenersteller kann das Layout der betreffenden, von der
Layoutanalyse erzeugten Regionen wie gewünscht editieren und die
Inhalte können in den editierten Regionen ausgelegt werden.
Während die Dokumentenbildung als ein Beispiel bei der zuvor
beschriebenen Ausführungsform gewählt worden ist, kann die Erfindung
auf die Bildung eines vorformatierten Dokuments wie beispielsweise
ein Zettel (slip) angewendet werden.
Während für Tabellen nur die vertikalen und horizontalen Linien
reproduziert werden, basierend auf den Vektordaten, die durch die
Analyse bei der oben genannten Ausführungsform erhalten worden
sind, können Daten, die Attribute wie beispielsweise Reihen und
Spalten von Tabellen bezeichnen, ausgegeben werden anstelle von
Vektordaten, wenn die Dokumentenbildungsvorrichtung Tabellenstrukturen
generieren und verwalten kann.
Während bei der oben beschriebenen Ausführungsform die Daten, die
in einem Schriftzeichenabschnitt identifiziert worden sind, nur
die Größe der Schriftzeichen, den Abstand zwischen Schriftzeichenfolgen
und den Schreibstil im Sinne von vertikal oder horizontal,
betreffen, können Daten wie der Unterschied in kalligraphischem
Stil oder Sprachenunterschiede, zum Beispiel Japanisch
oder Englisch, identifiziert werden und als zusätzliche Attribute
eingeschlossen werden.
Wenn vorgesehen ist, daß die entsprechenden Schriftzeichen in
einer Schriftzeichenregion erkannt werden und entsprechende
Graphikelemente in einer Graphikregion, dann sind nicht nur die
Layoutdaten sondern auch dessen Inhalt wiederverwendbar.
Wie zuvor beschrieben wurde, wird im Rahmen der Erfindung automatisch
ein Layout erzeugt, das auf den Bildern basiert, die von
einem Dokument gelesen werden. Wenn daher ein Dokument mit einem
entsprechenden Layout erzeugt wird, hat der Benutzer nicht die
Prozeduren der Regionenfestlegung und der Vorgangsrevisionen zu
durchlaufen; mindestens jedoch werden die durchzuführenden Operationen
vereinfacht, wodurch die Effizienz der Dokumentenbildung
verbessert wird. Zusätzlich ist es nicht mehr erforderlich, Dokumente
mit Standardlayouts vorzubereiten oder zu registrieren,
wodurch nicht nur Arbeitsaufwand sondern auch große Speicherkapazität
eingespart wird.
Bezugszeichenliste
1 Vorrichtung zur Unterstützung der Dokumentenbildung
2 Bildeingabeeinheit
3 Layoutanalyseneinheit
4 Layouterzeugungsinstruktionseinheit
5 Layoutdarstellungseinheit
6 Tastatur/Maus
7 Schriftzeichen/Graphikeingabeeinheit
8 Inhaltdarstellungseinheit
9 Anzeigeeinheit
10 Layoutkoordinaten/attributeingabeeinheit
Dokumentenbilder
11 Regionenanalyseeinheit
Bildboxdaten
12 Schriftzeichenteilanalyseeinheit
Schriftzeichenbox/Schriftzeichenteilattributdaten
13 Graphikabschnittsanalyseeinheit
Graphikbox/Linien- bzw. Zeilendaten
2 Bildeingabeeinheit
3 Layoutanalyseneinheit
4 Layouterzeugungsinstruktionseinheit
5 Layoutdarstellungseinheit
6 Tastatur/Maus
7 Schriftzeichen/Graphikeingabeeinheit
8 Inhaltdarstellungseinheit
9 Anzeigeeinheit
10 Layoutkoordinaten/attributeingabeeinheit
Dokumentenbilder
11 Regionenanalyseeinheit
Bildboxdaten
12 Schriftzeichenteilanalyseeinheit
Schriftzeichenbox/Schriftzeichenteilattributdaten
13 Graphikabschnittsanalyseeinheit
Graphikbox/Linien- bzw. Zeilendaten
Legenden Fig. 3
Start
S101 Umschriebene Rechtecke identifizieren
S102 Überlappende umschriebene Rechtecke in Einzelrechtecke integrieren
S103 Ist Höhe/Breite des umschriebenen Rechtecks größer als Schriftzeichengröße?
Nein
S105 Periodizität zwischen Rechtecken identifizieren
S106 Rechtecke mit derselben Periodizität in Einzelrechtecke integrieren
Schriftzeichenregion
Ja
S104 Breite zu Höhen-Verhältnis ungefähr gleich "1" und
Prozentsatz von Schwarz im Rechteck kleiner als vorbestimmter Wert?
Ja
Bildregion
Nein
Graphikregion
Start
S101 Umschriebene Rechtecke identifizieren
S102 Überlappende umschriebene Rechtecke in Einzelrechtecke integrieren
S103 Ist Höhe/Breite des umschriebenen Rechtecks größer als Schriftzeichengröße?
Nein
S105 Periodizität zwischen Rechtecken identifizieren
S106 Rechtecke mit derselben Periodizität in Einzelrechtecke integrieren
Schriftzeichenregion
Ja
S104 Breite zu Höhen-Verhältnis ungefähr gleich "1" und
Prozentsatz von Schwarz im Rechteck kleiner als vorbestimmter Wert?
Ja
Bildregion
Nein
Graphikregion
Legenden Fig. 4
Start
S201 Entfernungen zwischen Rechtecken identifizieren
S202 Ist vertikaler Abstand größer als horizontaler Abstand?
Nein
S204 Vertikalschreiben
Entfernung zwischen Schriftzeichenfolgen = horizontale Periodizität
Ja
S203 Horizontalschreiben
Entfernung zwischen Schriftzeichenfolgen = vertikale Periodizität
S205 Schriftzeichenhöhe = Maximumrechteckhöhe
Schriftzeichenbreite = Maximumrechteckbreite
Ende
Start
S201 Entfernungen zwischen Rechtecken identifizieren
S202 Ist vertikaler Abstand größer als horizontaler Abstand?
Nein
S204 Vertikalschreiben
Entfernung zwischen Schriftzeichenfolgen = horizontale Periodizität
Ja
S203 Horizontalschreiben
Entfernung zwischen Schriftzeichenfolgen = vertikale Periodizität
S205 Schriftzeichenhöhe = Maximumrechteckhöhe
Schriftzeichenbreite = Maximumrechteckbreite
Ende
Legenden Fig. 5
Start
S301 Abschnitt mit Anzahl von Pixeln, die einen vorbestimmten Wert in horizontaler Richtung überschreitet, identifizieren
S302 Abschnitt mit Anzahl von Pixeln, die einen vorbestimmten Wert in vertikaler Richtung überschreitet, identifizieren
S303 Indentifiziertes Liniensegment in Vektordaten konvertieren
S304 Ist vorliegender Vektor allein?
Ja
Spalten/Reihenteilungslinie
Nein
S305 Ist Mehrzahl horizontaler/vertikaler Linien eingeschlossen?
Ja
Tabellenregion
Nein
S306 Besteht Vektor aus Rechteck?
Ja
Graphikregionenbox
Nein
Allgemeine graphische Elemente
Start
S301 Abschnitt mit Anzahl von Pixeln, die einen vorbestimmten Wert in horizontaler Richtung überschreitet, identifizieren
S302 Abschnitt mit Anzahl von Pixeln, die einen vorbestimmten Wert in vertikaler Richtung überschreitet, identifizieren
S303 Indentifiziertes Liniensegment in Vektordaten konvertieren
S304 Ist vorliegender Vektor allein?
Ja
Spalten/Reihenteilungslinie
Nein
S305 Ist Mehrzahl horizontaler/vertikaler Linien eingeschlossen?
Ja
Tabellenregion
Nein
S306 Besteht Vektor aus Rechteck?
Ja
Graphikregionenbox
Nein
Allgemeine graphische Elemente
Claims (2)
1. Vorrichtung (1) zur Unterstützung einer Dokumentenerstellung in
einer Dokumentenerstellungsvorrichtung, die bei der Erstellung
eines Dokuments Regionen definiert, die sich hinsichtlich ihrer
Attribute der Bilder voneinander unterscheiden, die in diesem
Dokument enthalten sind, und die jede dieser Regionen unterschiedlich
bearbeitet, bestehend aus
- - einer Bildeingabeeinheit (2), die das als Muster eines Bildes bildende Dokument liest,
- - einer Layoutanalyseeinheit (3), die Attribute der von dem Dokument gelesenen Bilder liest und Layoutdaten, die Größe, Position, und Attribute einer jeden Region basierend auf Unterschieden in den bewerteten Attribute identifiziert, und
- - eine Layouterstellungsinstruktionseinheit (4) zum Anweisen, dieselben Regionen wie jene auf dem als Muster dienenden Dokument auf dem zu bildenden Dokument basierend auf den identifizierten Layoutdaten einzustellen.
2. Vorrichtung (1) nach Anspruch 1,
dadurch gekennzeichnet,
daß die Layoutanalyseeinheit (2) aufweist
- - eine Regionenanalyseeinheit (11), die eine Schriftzeichenregion, eine Graphikregion und eine Bildregion von den Bildern des Dokuments identifiziert;
- - eine Schriftzeichenteilanalyseeinheit (12), die einen Schriftzeichenteilabschnitt innerhalb der Schriftzeichenregion analysiert, und
- - eine Graphikteilanalyseeinheit (13), die eine Linienkomponente innerhalb eines graphischen Elements durch Analyse eines Graphikteilabschnitts innerhalb der Graphikregion identifiziert und die Linienkomponente als Vektordaten ausgibt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2172326A JPH0612540B2 (ja) | 1990-06-28 | 1990-06-28 | 文書作成支援装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4121564A1 true DE4121564A1 (de) | 1992-01-09 |
DE4121564C2 DE4121564C2 (de) | 1995-02-16 |
Family
ID=15939835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4121564A Expired - Lifetime DE4121564C2 (de) | 1990-06-28 | 1991-06-28 | Vorrichtung zur Erstellung von Dokumenten |
Country Status (3)
Country | Link |
---|---|
JP (1) | JPH0612540B2 (de) |
DE (1) | DE4121564C2 (de) |
GB (1) | GB2247803B (de) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4330242A1 (de) * | 1993-09-07 | 1995-03-09 | Hell Ag Linotype | Verfahren und Einrichtung zur elektronischen Montage von Druckbogen |
WO2002037182A2 (en) * | 2000-10-31 | 2002-05-10 | Mentor Graphics Corporation | Method and apparatus for creating photolithographic masks |
US8248625B2 (en) | 2006-09-25 | 2012-08-21 | Vistaprint Technologies Limited | Preparation of aggregate jobs for production |
US9645774B2 (en) | 2000-01-25 | 2017-05-09 | Cimpress Usa Incorporated | Managing print jobs |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5808747A (en) * | 1996-05-30 | 1998-09-15 | Eastman Kodak Company | Apparatus and method for production of signatures |
AU2001231078A1 (en) | 2000-01-25 | 2001-08-07 | Vistaprint Usa, Inc. | Managing print jobs |
US7493292B2 (en) * | 2001-02-15 | 2009-02-17 | Glenn Petkovsek | System and a method for automating delivery of communication by a special service |
JP2006318142A (ja) * | 2005-05-11 | 2006-11-24 | Fujitsu Ltd | 紙面レイアウト方法 |
JP4781214B2 (ja) * | 2006-09-27 | 2011-09-28 | 株式会社沖データ | 印刷システム及び複合端末装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0328900A2 (de) * | 1988-01-21 | 1989-08-23 | Kabushiki Kaisha Toshiba | Verfahren und Gerät zur Aufbereitung von Dokumenten |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
JPH0214392A (ja) * | 1988-07-01 | 1990-01-18 | Fuji Electric Co Ltd | 文書領域解析装置 |
JPH03290774A (ja) * | 1990-04-06 | 1991-12-20 | Fuji Facom Corp | 文書画像の文章領域抽出装置 |
-
1990
- 1990-06-28 JP JP2172326A patent/JPH0612540B2/ja not_active Expired - Fee Related
-
1991
- 1991-06-21 GB GB9113488A patent/GB2247803B/en not_active Expired - Lifetime
- 1991-06-28 DE DE4121564A patent/DE4121564C2/de not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0328900A2 (de) * | 1988-01-21 | 1989-08-23 | Kabushiki Kaisha Toshiba | Verfahren und Gerät zur Aufbereitung von Dokumenten |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4330242A1 (de) * | 1993-09-07 | 1995-03-09 | Hell Ag Linotype | Verfahren und Einrichtung zur elektronischen Montage von Druckbogen |
US5809218A (en) * | 1993-09-07 | 1998-09-15 | Linotyoe-Hell Ag | Method for the electronic assembly of printer's forms |
US9645774B2 (en) | 2000-01-25 | 2017-05-09 | Cimpress Usa Incorporated | Managing print jobs |
WO2002037182A2 (en) * | 2000-10-31 | 2002-05-10 | Mentor Graphics Corporation | Method and apparatus for creating photolithographic masks |
WO2002037182A3 (en) * | 2000-10-31 | 2004-02-26 | Mentor Graphics Corp | Method and apparatus for creating photolithographic masks |
US6728946B1 (en) | 2000-10-31 | 2004-04-27 | Franklin M. Schellenberg | Method and apparatus for creating photolithographic masks |
US7174531B2 (en) | 2000-10-31 | 2007-02-06 | Schellenberg Franklin M | Creating photolithographic masks |
US8248625B2 (en) | 2006-09-25 | 2012-08-21 | Vistaprint Technologies Limited | Preparation of aggregate jobs for production |
Also Published As
Publication number | Publication date |
---|---|
JPH0612540B2 (ja) | 1994-02-16 |
GB2247803A (en) | 1992-03-11 |
JPH0460759A (ja) | 1992-02-26 |
GB9113488D0 (en) | 1991-08-07 |
GB2247803B (en) | 1995-01-18 |
DE4121564C2 (de) | 1995-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69610882T2 (de) | Blockselektionsystem, bei dem überlappende Blöcke aufgespaltet werden | |
DE69132816T2 (de) | Veränderung eines graphischen Anzeigebildes | |
DE3806223C2 (de) | Verfahren zur Erzeugung von Zeichenmustern | |
DE3650391T2 (de) | Erzeugung von Figuren in einem Dokumentformattierer direkt von einem Identifizierungskennzeichen. | |
DE69133362T2 (de) | Dokumentenverarbeitungs-verfahren und -gerät, entsprechende Program und Speichereinheit | |
DE69933404T2 (de) | System und Verfahren zum gemeinsamen Benutzen von Fonts und Speichermedium für das Programm zum Ausführen des Verfahrens | |
DE69030550T2 (de) | Verfahren und System zur Erzeugung von Plänen für einen Herstellungsprozess | |
DE69033079T2 (de) | Aufbereitung von Text in einem Bild | |
DE3588084T2 (de) | Bildverarbeitungssystem | |
DE68926068T2 (de) | Dokumentenverarbeitungssystem | |
DE69232493T2 (de) | Verfahren und Gerät zur Zeichenerkennung | |
DE69332286T2 (de) | Verfahren und Vorrichtung zur Verarbeitung von Farbbildern | |
DE69630928T2 (de) | Vorrichtung und Verfahren zum Anzeigen einer Übersetzung | |
DE69130382T2 (de) | Zeichenverarbeitungsverfahren | |
DE69434405T2 (de) | Verfahren zur Erzeugung eines visuellen Entwurfs | |
DE3850595T2 (de) | Dokumentverarbeitungssystem. | |
DE69722246T2 (de) | Grafiksystem und verfahren zur anpassung von objekten an schablone | |
DE69629173T2 (de) | Automatisches Plazieren eines graphischen Musters | |
DE69321763T2 (de) | Datenverarbeitungsverfahren und -vorrichtung | |
DE3411939A1 (de) | Verfahren und vorrichtung zur bildwiedergewinnung unter verwendung von annotationen als leitinformation | |
DE3586646T2 (de) | Bildanzeigegeraet. | |
DE3625390A1 (de) | Graphisches anzeigesystem mit beliebiger rberlappung von bildausschnitten | |
DE10105941A1 (de) | System und Verfahren zum automatischen Zuweisen eines Dateinamens zu einem gescannten Dokument | |
DE69230392T2 (de) | Verfahren und Gerät zur Bildverarbeitung | |
DE69222255T2 (de) | Verarbeitungsverfahren für Zeichen oder graphische Daten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right | ||
R071 | Expiry of right |