DE19531392C1 - Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen - Google Patents
Verfahren zur Erzeugung einer Graphrepräsentation von BildvorlagenInfo
- Publication number
- DE19531392C1 DE19531392C1 DE19531392A DE19531392A DE19531392C1 DE 19531392 C1 DE19531392 C1 DE 19531392C1 DE 19531392 A DE19531392 A DE 19531392A DE 19531392 A DE19531392 A DE 19531392A DE 19531392 C1 DE19531392 C1 DE 19531392C1
- Authority
- DE
- Germany
- Prior art keywords
- contour
- image
- lines
- line
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/168—Smoothing or thinning of the pattern; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
Die vorliegende Erfindung betrifft das Gebiet der automatischen Bilderkennung,
insbesondere die Erkennung von Schriften, vor allem von handgeschriebenen
Wörtern und Buchstaben.
Allgemein ist die Erkennung von handgeschriebenen Schriften eine schwierigere
Aufgabe, als die Erkennung von Maschinenschrift. In beiden Fällen geht es
allerdings um die Klassifizierung von Objekten mit bedeutungsvollen
Regelmäßigkeiten in einer komplexen Umgebung. Generell dabei auftretende
Probleme betreffen die erforderliche Speicherkapazität und die erforderliche
Rechenzeit, da in einem typischen automatischen Zeichenerkennungssystem eine
Referenzbibliothek sämtlicher zu erwartender Zeichen angelegt wird, mit deren
Inhalt zu erkennende Zeichen verglichen werden.
Zur Lösung dieses Problems sind bisher verschiedene Ansätze vorgeschlagen
worden, so unter anderem die Verwendung neuronaler Netze, direkte
Musterextraktion und Matrixverfahren. Eine kurze Übersicht über das Gesamtgebiet
ist in dem Artikel "Document analysis - from pixels to contents" Proceedings of the
IEEE, Vol. 18, No. 7, Juli 1992, S. 1101-1118, zu finden.
Es ist auch bereits bekannt, nicht unmittelbar von der Binärdarstellung der
Bildvorlage, sondern von einer Konturbeschreibung auszugehen. Eine solche
Konturbeschreibung ist z. B. aus dem Artikel "General data structure for image
analyses based on a description of connected components", computing 42, S.
17-34, (1989) bekannt. Aus diesem Dokument ist auch bereits bekannt, die Konturlinien
durch linienorientierte Bildprimitive, d. h. durch Polygone, zu approximieren.
Aus der Druckschrift JAKUB SEGEN "Model Learning and Recognition of Nonrigid
Objects", IEEE 597-602 (1989) ist bereits die Repräsentation zweidimensionaler
Objekte durch eine Menge lokaler Features bekannt. Als lokales Feature wird ein
lokales Extremum der Krümmung einer zweidimensionalen Kurve herangezogen.
Andere Typen lokaler Features sind gemäß diesem Dokument Wendepunkte,
gerade Linien und Kreissegmente. Hiervon ausgehend wird vorgeschlagen, eine
Hierarchie von Gestaltprimitiven zu konstruieren, mit dem Ziel, allgemeine Formen
durch eine Menge von Beziehungen zwischen lokalen Features zu charakterisieren.
Die Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Erzeugung einer
Graphrepräsentation von Bildvorlagen anzugeben, wobei jeder Graph aus Knoten
und Linien, z. B. repräsentiert als Polygonzüge, besteht.
Diese Aufgabe wird durch die Merkmale des Patentanspruchs 1 gelöst.
Die Erfindung ermöglicht die besonders schnelle und robuste Erzeugung einer
strukturellen Repräsentation der Bildvorlage.
Weitere vorteilhafte Ausbildungen der Erfindung sind in den Unteransprüchen sowie
der Beschreibung und den Zeichnungen zu entnehmen.
Das erfindungsgemäße Verfahren ist vorzugsweise Bestandteil eines Systems, bei
dem ausgehend von einem durch einen optischen Scanner erzeugten Abbild der
Bildvorlage und der nachfolgenden Erzeugung eines Binärbildes der Bildvorlage bei
verschiedenen Abstraktionsstufen eine Bildbearbeitung erfolgt. Ein solches System
wird z. B. in automatischen Anschriftenlesern oder Beleglesern eingesetzt.
Das Verfahren wird vorzugsweise in einem System verwendet, das aus
verschiedenen Modulen besteht. Die wesentlichen Module betreffen dabei
Bildvorverarbeitung, Bildabstrahierung, Bestimmung von Graphmerkmalen,
Filterung von Erkennungsvorschlägen aus einer Referenzbibliothek, die eigentliche
Zeichenerkennung und Auswertung der von der Zeichenerkennung gelieferten
Wortvorschlagslisten, wobei Wortglaubwürdigkeiten zugeordnet werden.
Grundsätzlich ist das erfindungsgemäße Verfahren generell zur strukturellen
Bilddatenreduktion und zur Bildspeicherung geeignet.
Im folgenden wird die Erfindung anhand von Zeichnungen genauer erläutert.
Es zeigen:
Fig. 1 eine Modulübersicht eines Systems zur Schrifterkennung;
Fig. 2 ein typisches Binärbild;
Fig. 3 die Beschreibung eines Binärbildes durch Linien und Knotengebiete;
Fig. 4 die durch Konturcodierung repräsentierte geometrische Grenzlinie des
Binärbildes gem. Fig. 2;
Fig. 5 zusammengefaßte Linien und Knotengebiete gem. Fig. 4;
Fig. 6 die Linien und Knotengebiete der Linienrepräsentation eines Binär
bildes und Linien und Knoten einer entsprechenden Graphre
präsentation;
Fig. 7 die Struktur einer Graphmenge;
Fig. 8 das Verfahren zur Maximalpunktfindung einer Kontur;
Fig. 9 die Beziehung zwischen Maximalpunkten und Polygonapproximation
einer Kontur.
In Fig. 1 ist eine Übersicht über die verschiedenen Prozeßmodule eines
Schrifterkennungssystems dargestellt. Erkennbar ist, daß es sich bei der
Schrifterkennung um einen Multilevelprozess handelt, bei dem ausgehend
von dem durch eine optische Abtasteinrichtung und einer anschließenden
Bildvorverarbeitung gelieferten Binärbild eines Schriftbildes über verschie
dene Verarbeitungsstufen ein Teilwörterbuch mit Glaubwürdigkeiten zuge
ordneter Bedeutungsklassen erzeugt wird. Ein System nach Fig. 1 wird
vorzugsweise als echtzeitfähiges Script-Worterkennungssystem verwendet.
Dabei bedeutet "Scrip" alle Ausprägungen von freier Handschrift, d. h.
von einer Handblockschrift mit isolierten "Kleinbuchstaben" über die
verschiedenen Mischformen bis hin zu vollständig gebundener Schreib
schrift sowie handschriftliche Maschinenschriftfonds und verklebte, d. h.
mit üblichen Schriftsegmentierungsverfahren nicht segmentierbare Maschi
nenschriftfonds. Grundsätzlich ist jedoch dieses System auch für die
Erkennung von anderen Schriftarten und andere Anwendungsgebiete der
Bilderkennung, wie z. B. flow-chart-Analyse, geeignet.
Ausgehend von dem von der optischen Abtastvorrichtung gelieferten
Abbild 10 erfolgt in der Bildvorverarbeitung 12 eine Rauschverringerung,
bei der das Binärbild geglättet wird. Bei Schriftbildern erfolgt üblicherweise
eine Identifizierung und Isolierung von signifikanten Layout-Elementen, wie
z. B. Adreßzeichen. Anschließend wird eine Abstraktion des Bildes 14 er
zeugt, vorzugsweise erfolgt eine Linienrepräsentation des Bildes 15,
anschließend eine Graphrepräsentation 16 sowie eine Normierung auf der
Graphebene 17.
In einem weiteren Schritt werden die globalen Graphmerkmale 18 be
stimmt; insbesondere erfolgt eine Partitionierung der Graphen 19 und eine
merkmalsgesteuerte Reduktion der aus einem Gesamtwörterbuch 22
gewonnenen Wörter mit nachfolgender Filterung 24, die mittels eines Teil
wörterbuchs 26 gesteuert wird.
Bei der eigentlichen Zeichenerkennung 28 werden Bedeutungsklassen
gefunden, die durch ein oder mehrere Graphmodelle repräsentiert werden,
denen in der Auswertung 34 Wortglaubwürdigkeiten zugeordnet werden.
Das Ergebnis des Gesamtprozesses ist ein Teilwörterbuch, mit den einzel
nen Wörtern zugeordneten Glaubwürdigkeiten.
Fig. 2 zeigt ein Binärbild einer handgeschriebenen Ziffer 4. In diesem
Beispiel werden die Bildpunkte als quadratische Flächenelemente reprä
sentiert, deren Kantenlänge die Einheitsmenge ist. Zur Beschreibung in
einem kartesischen Koordinatensystem wird grundsätzlich zwischen den
Eck- und Pixelkoordinaten unterschieden. Die Eckkoordinaten sind auf die
geometrischen Grenzen der Bildpunkte ausgerichtet. Beispielsweise haben
die vier Ecken des Bildpunktes in der linken unteren Ecke die Koordinaten
E₁ = (0,0), E₂ = (1,0), E₃ = (1,1), E₄ = (0,1). Die Pixelkoordinaten indi
zieren die einzelnen Bildpunkte. Z. B. hat der Bildpunkt in der linken unte
ren Ecke die Koordinaten P = (0,0).
Binärbilder können durch Linien- und Knotengebiete beschrieben werden.
Fig. 3 illustriert eine solche Beschreibung eines Binärbildes. Das Beispiel in
Fig. 3 besteht aus zwei Liniengebieten 30, 31 und einem Knotengebiet 40.
Jedes Liniengebiet weist eine Linienseite 1 und eine Linienseite 2 auf.
Eine Linien- und Knotengebietrepräsentation kann man mittels einer Kon
turcodierung erhalten, die auf dem Rasterchaincode (RC-Code) basiert und
den Verlauf der geometrischen Grenzlinie eines Schwarzgebiets der Binär
darstellung beschreibt. Diese Codierung beschreibt jedes zusammen
hängende Schwarzgebiet durch eine Liste von Konturprimitiven, die die
absoluten Richtungen right, up, left, down der Bildpunktkanten einer
Kontur enthalten.
Fig. 4 zeigt für das Binärbild der Fig. 3 die durch eine Konturcodierung
erhaltene geometrische Grenzlinie. Bei einem beliebigen Bild ist es möglich,
durch Ablaufen der Kontur die Flächen der einzelnen Schwarzgebiete, die
Anzahl der konkaven und konvexen Ecken der Kontur und das umschrei
bende Rechteck aller Schwarzgebiete zu bestimmen.
Zusammen mit lokalen Merkmalen der Kontur werden diese globalen
Merkmale benutzt um Linienhypothesen zu bilden. Implizit sind nach der
Bestimmung der Linienhypothesen die Knotengebiete schon bekannt und
zwar als die Gebiete, die zu keiner Linie gehören.
Fig. 5 zeigt die zum Binärbild der Fig. 2 gehörenden Linien und Kno
tengebiete. Generell wird durch das Bild eine komplexe, hierarchiche
Struktur aus Knoten und Linien und gleichen Konturelementen reprä
sentiert. Die oberste Hierarchieebene bildet eine Beschreibung der globalen
Merkmale des jeweiligen Bildes. Bei der Implementierung in einer Datenver
arbeitungsanlage ist von dieser Ebene ein Zugriff auf die nächsttiefere Hier
archieebene, die der Knoten, vorgesehen. Für jeden Knoten existiert eine
Zugriffsmöglichkeit auf diejenigen Linien, die von diesem Knoten ausgehen
und die dritte Ebene der Hierarchie bilden. Von der Linie besteht über die
Endkonturelemente Zugriff auf die gesamte Konturbeschreibung beider
Seiten der Linie. In Fig. 3 sind die Endkonturelemente mit S11, S12, S21
und S22 für jede Linie bezeichnet.
Als globale Merkmale zur Bildbeschreibung werden vorzugsweise Höhe und
Breite und mittlere Strichdicke des Wortbildes verwendet. Zur Be
schreibung der Knoten werden X- und Y-Koordinaten des Umfangs
schwerpunktes und die Ordnung des Knotens d. h. die Anzahl der von ihm
ausgehenden Linien verwendet. Eine Linie wird durch die Merkmale der
ersten und zweiten Konturseite der Linie, mittlere Länge der Linie und
Richtungsinformation an den beiden Linienenden beschrieben. Ein
Konturpunkt wird durch die Merkmale X- und Y-Position des Konturpunktes
und Winkel der Tangente durch diesen Konturpunkt charakterisiert.
In der oben beschriebenen Linienrepräsentation des Binärbildes wird dieses
im wesentlichen durch Linien- und Knotengebiete und die Ver
bindungsstruktur dieser Gebiete charakterisiert. Grundsätzlich läßt sich aus
dieser Darstellung noch das Binärbild rekonstruieren. Für die Zeichener
kennung ist jedoch eine kompaktere Beschreibung des Bildes wesentlich,
bei dem die Knoten- und die Liniengebiete bzw. Konturen in geeigneter
Weise zusammengefaßt werden. Dies geschieht durch eine Graphreprä
sentation des Bildes.
Fig. 6 zeigt einen Ausschnitt eines Schriftbildes in der Linienrepräsentation
und in der daraus gewonnenen Graphrepräsentation. Es ist ersichtlich, daß
aus Liniengebieten Polygone mit Stützpunkten und aus Knotengebieten
Knoten mit vorzugsweise nur einem geometrischen Merkmal geworden
sind.
Fig. 7 illustriert die Struktur der Graphmenge. Die Graphmenge hat
demnach eine komplexe hierarchiche Struktur bestehend aus Graphen 1 bis
P, die jeweils aus Knoten und Linien bestehen, wobei letztere aus Punkten
aufgebaut sind.
Auf der obersten Hierarchiebene wird die Graphmenge durch das Merkmal
der Dimension beschrieben, das vorzugsweise die Untermerkmale X- und
Y-Koordinaten der Seiten des umschreibenden Rechtecks, Breite und Höhe
des Rechtecks, Koordinaten des Rechteckmittelpunktes sowie die Gesamt
länge der zur Graphmenge gehörenden Linien aufweist.
Ein Graph wird vorzugsweise durch die Merkmale: umschreibendes
Rechteck des Graphen, relative Koordinaten innerhalb des umschreibenden
Rechtecks der Graphmenge, Verbindungen zu Linien und Knoten und
Verbindungen zu anderen Graphen charakterisiert.
Ein Knoten wird vorzugsweise durch die Koordinaten des Knotenschwer
punktes und die Verbindungen zu den abgehenden Linien beschrieben.
Eine Linie weist folgende Merkmale auf: vorzugsweise umschreibendes
Rechteck der Linie, akkumulierter Gesamtwinkel der Linie, relative Lage der
Linie innerhalb des umschreibenden Rechtecks des Graphen, Winkel an den
beiden Linienenden, Verbindung zu den beiden Endknoten der Linie sowie
notwendigerweise die Verbindung zu den Punkten auf dieser Linie.
Ein Punkt wird vorzugsweise durch folgende Merkmale beschrieben: Ko
ordinaten des Punktes, Abstand zum nächsten Punkt auf der Linie; bei
Endpunkten Endausrichtung der Linie; bei Maximalpunkten Winkel der
zugehörigen Projektionsachse.
Beim Übergang zur Graphrepräsentation des Bildes werden die Linienge
biete bzw. Konturen durch die beiden Endpunkte des Liniengebiets sowie
gegebenenfalls durch einen oder mehrere Stützstellenpunkte approximiert.
Wesentlich für das erfindungsgemäße Verfahren ist die Bestimmung dieser
Stützstellenpunkte aus Maximalpunkten der Kontur, die durch Projektion
auf vorgegebenen festen Achsen erhalten werden.
In einer bevorzugten Ausführungsform der Erfindung werden die Stützstel
lenpunkte aus der längeren der beiden Konturen eines Liniengebiets
bestimmt. In einer weiteren bevorzugten Ausführungsform wird von einer
Art Mittelachse des Liniengebiets ausgegangen.
Im folgenden wird am Beispiel der Fig. 8 die Approximation durch Maxi
malpunkte der Kontur genauer beschrieben. In Fig. 8 ist der Rand eines
Schwarzgebietes vereinfacht als kontinuierliche Kurve dargestellt. Die
Kurve wird generell auf eine vorgegebene Anzahl von Achsen mit jeweils
unterschiedlichem Winkel α gegenüber einem vorgegebenen festen kartesi
schen Koordinatensystem projiziert. Fig. 8 zeigt die Situation vereinfacht
lediglich für eine Projektion auf die X-Achse. Es sei S der beliebige Start
punkt für die Suche der Maxima. Dann wird die Kurve durchlaufen und
dabei eine Projektion auf die X-Achse gebildet. Beim Durchlaufen der Kurve
variiert der Wert für die Projektion entsprechend. In der resultierenden
Projektionskurve auf die X-Achse werden die lokalen Maxima gesucht. In
Fig. 8 erhält man an den Punkten A und C lokale Maxima, an den Punkten
B und D lokale Minima.
Ein Minimum der Projektion auf eine X-Achse entspricht offensichtlich
einem Maximum der Projektion zu einer Achse, die gegenüber der X-Achse
um 180° gedreht ist.
Eine Kontur weist üblicherweise kleine lokale Schwankungen auf. Um zu
verhindern, daß dadurch zu viele unsignifikante Maxima bzw. Minima er
halten werden, werden nur signifikante lokale Maxima gesucht. Als Krite
rium hierfür wird auf beiden Seiten eines Maximums jeweils ein Minimum
gefordert, das einen Mindestabstand zum Maximum besitzt. Beispielsweise
wird in Fig. 8 das relative Maximum bei A nur dann als signifikantes Maxi
mum akzeptiert, wenn die Differenzen a-d und a-b eine bestimmte
Schwelle überschreiten. Entsprechend ist b nur dann ein Minimalpunkt,
wenn sowohl a-b als auch c-b diese Schwelle überschreiten.
Allgemeiner kann auch die Bedingung bestimmt werden, daß ein Maximum
dann signifikant ist, wenn es links und rechts von der Position des Ma
ximums Projektionspunkte gibt, die mindestens um eine vorgegebene Diffe
renz δ tieferliegen, und wenn es das höchste lokale Maximum in dieser
Umgebung ist. Dies führt dazu, daß lokale Schwankungen der Kontur, die
kleiner als der Wert δ sind, bei der Polygonapproximation ignoriert werden.
Vorteilhaft ist es, δ proportional zur Wurzel der mittleren Strichdicke zu
wählen.
Bei der praktischen Implementierung des Verfahrens braucht nicht immer
überprüft zu werden, ob z. B. auf beiden Seiten eines Maximums ein Mini
mum liegt. Tatsächlich genügt die Überprüfung der im Umlaufsinn nachfol
genden Seite, da Minima- und Maximawerte abwechselnd auftreten. Aller
dings müßten beim ersten potentiellen Maximalpunkt beide Seiten überprüft
werden. Daher wird der erste gefundene potentielle Maximalpunkt ignoriert
und die Suche nach Maximalpunkten nach einem ganzen Umlauf um die
Kontur bis zum ersten tatsächlich gefundenen Maximalpunkt nach dem
Anfangspunkt S weitergeführt werden.
Statt auf die X-Achse, kann die Projektion natürlich auch auf Achsen belie
biger Richtung erfolgen. Besonders vorteilhaft ist die Verwendung von
mehreren Achsen der Neigung 0,45°, 90° und 135° bzw. ein System von
acht festen Achsen mit jeweils gleicher Winkeldifferenz. Dadurch wird die
Kontur als Folge von Maximalpunkten verschiedener Projektionsachsen
beschrieben.
Fig. 9 zeigt den Zusammenhang zwischen den Maximalpunkten und der
Polygonapproximation. Ersichtlicherweise wird durch Verbinden der auf der
Kontur aufeinanderfolgenden Maximalpunkte ein Polygonzug erzeugt, der
eine Approximation des ursprünglichen Bildes liefert.
Die gesamte Graphmenge wird aufbauend auf der Linienrepräsentation des
Bildes rekursiv erzeugt. Hierzu wird zunächst eine neue Menge angelegt.
Für alle noch nicht benutzten Knotengebiete gilt:
- 1) Beginne einen neuen Graphen.
- 2) Lasse den Graphen rekursiv wachsen. Durchflute dabei die ver bundenen Linien- und Knotengebiete und lege innen entsprechende Linien und Knoten für die Graphbeschreibung an. Alle verbundenen Linien und Knoten werden= zu einem Graphen zusammengefaßt.
Im folgenden werden die Linien- und Knotengebiete als L-Linien und
L-Knoten bezeichnet, die Entsprechungen der Graphenbeschreibung als
G-Linien und G-Knoten.
Im Schritt 2) wird der neue Graph so lange erweitert, bis von allen verbun
denen L-Linien bzw. L-Knoten eine korrespondierende Version von G-Linien
und G-Knoten für den Graphen erzeugt worden ist:
- - Markiere, daß der aktuelle L-Knoten benutzt worden ist.
- - Erzeuge den entsprechenden G-Knoten.
Für alle L-Linien, die vom aktuellen L-Knoten ausgehen:
- - Erzeuge eine entsprechende G-Linie, falls sie nicht schon von einem anderen G-Knoten aus erzeugt worden ist.
- - Erzeuge einen Verweis von der G-Linie auf den G-Knoten und umge kehrt.
Für alle L-Linien, die vom aktuellen L-Knoten ausgehen:
- - Gehe zum L-Knoten am anderen Ende der L-Linie. Falls dieser L-Knoten noch nicht als benutzt markiert worden ist, führe die gleiche Prozedur mit diesem L-Knoten als aktuellem Knoten aus.
Nach Ausführung der bisherigen Verfahrensschritte wird die Bildvorlage
durch eine Graphmenge durch Knoten, Linien und Stützstellenpunkten
repräsentiert. In einem weiteren Schritt können die entstandenen Graphen
noch einmal transformiert werden, insbesondere um den Erkennungsprozeß
bei ganzen Worten im Gegensatz zu Einzelzeichen zu erleichtern. Hierzu
wird die Repräsentation des Graphen derart geändert, daß die Stützstellen
punkte der Polygonapproximation als Knoten zweiter Ordnung dargestellt
werden. Daher wird in dieser transformierten Graphrepräsentation eine
Linie mit Stützstellenpunkten ersetzt durch eine homogene Struktur mit
abwechselnden Linien und Knoten. Dies kann rekursiv erfolgen analog zur
Vorgehensweise, wie sie bei der ursprünglichen Graphrepräsentation aus
den Ergebnissen der Linienrepräsentation angewandt wird.
Die Ausführung des erfindungsgemäßen Verfahrens erfolgt durch ein
Computersystem, das zumindest eine Einrichtung zum Anlegen und zur
Speicherung von Datenstrukturen aufweist, mit denen die oben beschrie
bene Linienrepräsentation der Fig. 6, bestehend aus Linien- und Knotenge
bieten sowie der Verbindungsstruktur dieser Gebiete, repräsentiert wird,
sowie einer Einrichtung zum Speichern einer Datenstruktur, durch die die
Graphrepräsentation der Fig. 7 repräsentiert wird, bestehend aus Graphen,
die jeweils aus Knoten und Linien bestehen, wobei letztere aus Punkten
aufgebaut sind. Vorzugsweise werden dabei die Elemente der Linien bzw.
Graphrepräsentation als Objekte im Sinne der objektorientierten Technolo
gie aufgefaßt. Darüber hinaus sind bei dem Computersystem eine Einrich
tung zur Erzeugung von Binärbildern aus den Signalen einer optischen
Abtastvorrichtung sowie weitere Vorrichtungen zur Weiterverarbeitung der
Graphrepräsentation vorgesehen, wie in Fig. 1 dargestellt ist.
Claims (7)
1. Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
wobei aus einem Binärbild der Bildvorlage eine Konturdarstellung
erzeugt wird, die Graphrepräsentation aus einer Menge von Graphen
besteht und jeder Graph aus Knoten und Linien besteht,
dadurch gekennzeichnet,
daß eine Projektion der Konturlinien auf eine vorgegebene Anzahl
von festen Achsen erfolgt und die Stützstellenpunkte der Polygon
züge aus den signifikanten lokalen Maxima der Projektionskurve
jeder Achse bestimmt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die
Projektion der längeren der beiden Konturlinien eines Liniengebiets
der Konturdarstellung verwendet wird.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die
Projektion der Mittelachse der beiden Konturlinien eines Liniengebiets
der Konturdarstellung verwendet wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeich
net, daß ein System von Achsen mit gleicher Winkeldifferenz vorge
sehen ist.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeich
net, daß bei der Bestimmung der lokalen Maxima lokale Schwankun
gen der Konturlinien kleiner als ein vorgegebenes δ ignoriert werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeich
net, daß die Graphrepräsentation zur Bildspeicherung verwendet
wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeich
net, daß die Graphrepräsentation in einem Bilderkennungssystem,
insbesondere zur Erkennung von Script-Schriften verwendet wird.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19531392A DE19531392C1 (de) | 1995-08-26 | 1995-08-26 | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19531392A DE19531392C1 (de) | 1995-08-26 | 1995-08-26 | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19531392C1 true DE19531392C1 (de) | 1997-01-23 |
Family
ID=7770439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19531392A Expired - Fee Related DE19531392C1 (de) | 1995-08-26 | 1995-08-26 | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19531392C1 (de) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19624977A1 (de) * | 1996-06-22 | 1998-01-02 | Siemens Ag | Verfahren zur Verarbeitung von Postsachen |
EP0848350A1 (de) * | 1996-12-11 | 1998-06-17 | Hewlett-Packard Company | Vorrichtung und Verfahren zur Handschriftkomprimierung |
DE19718805A1 (de) * | 1997-05-03 | 1998-11-19 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Verteilinformationen |
DE19742771C1 (de) * | 1997-09-27 | 1998-12-10 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen |
US6018591A (en) * | 1994-07-04 | 2000-01-25 | Hewlett-Packard Company | Scribble matching |
DE19646522C2 (de) * | 1996-11-12 | 2000-08-10 | Siemens Ag | Verfahren und Vorrichtung zur Erkennung von Verteilinformationen auf Sendungen |
DE19922788C1 (de) * | 1999-05-18 | 2000-10-05 | Siemens Ag | Verfahren zum Sortieren von Sendungen |
DE10010241C1 (de) * | 2000-03-02 | 2001-03-01 | Siemens Ag | Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen |
DE10064529C1 (de) * | 2000-12-22 | 2002-01-24 | Siemens Production & Logistics | Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen |
DE10064226A1 (de) * | 2000-12-22 | 2002-07-18 | Siemens Production & Logistics | Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen |
DE10337831A1 (de) * | 2003-08-18 | 2005-03-24 | Sick Ag | Verfahren zur optischen Erkennung von alphanumerischen Zeichen |
WO2005049233A1 (en) | 2003-11-18 | 2005-06-02 | Siemens Ag | Method and apparatus for video coding by validation matrix |
US7181045B2 (en) | 2002-09-03 | 2007-02-20 | Siemens Ag | Method and device for reading the addresses of items of mail |
US7215794B2 (en) | 2002-03-19 | 2007-05-08 | Siemens Ag | Method and device for reading the addresses on items of mail |
WO2007094326A1 (ja) | 2006-02-15 | 2007-08-23 | Konami Digital Entertainment Co., Ltd. | 軌跡情報処理装置、軌跡情報処理方法、情報記録媒体、ならびに、プログラム |
EP1450295B2 (de) † | 2003-02-19 | 2011-02-23 | Solystic | Verfahren zur optischen Erkennung von Postsendungen mittels mehrfacher Binarisierung |
-
1995
- 1995-08-26 DE DE19531392A patent/DE19531392C1/de not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
IEEE Trans. on PAMI, Vol. 16, Nr. 4, 1994, pp. 393-404 * |
JAKUB SEGEN: "Model Learning and Recognition of Nonrigid Objects", CH 2752-4/89 IEEE, pp. 597-602 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6018591A (en) * | 1994-07-04 | 2000-01-25 | Hewlett-Packard Company | Scribble matching |
US6909789B1 (en) | 1996-06-22 | 2005-06-21 | Siemens Aktiengesellschaft | Method of processing postal matters |
DE19624977A1 (de) * | 1996-06-22 | 1998-01-02 | Siemens Ag | Verfahren zur Verarbeitung von Postsachen |
US6665422B1 (en) | 1996-11-12 | 2003-12-16 | Siemens Aktiengesellchaft | Method and device for recognizing distribution data on postal packets |
DE19646522C2 (de) * | 1996-11-12 | 2000-08-10 | Siemens Ag | Verfahren und Vorrichtung zur Erkennung von Verteilinformationen auf Sendungen |
EP0848350A1 (de) * | 1996-12-11 | 1998-06-17 | Hewlett-Packard Company | Vorrichtung und Verfahren zur Handschriftkomprimierung |
DE19718805A1 (de) * | 1997-05-03 | 1998-11-19 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Verteilinformationen |
DE19718805C2 (de) * | 1997-05-03 | 1999-11-04 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Verteilinformationen |
DE19742771C1 (de) * | 1997-09-27 | 1998-12-10 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen |
DE19922788C1 (de) * | 1999-05-18 | 2000-10-05 | Siemens Ag | Verfahren zum Sortieren von Sendungen |
US6570115B1 (en) | 1999-05-18 | 2003-05-27 | Siemens Aktiengesellschaft | Method for sorting mail |
US6917009B2 (en) | 2000-03-02 | 2005-07-12 | Siemens Aktiengesellschaft | Method and apparatus for processing mail pieces |
DE10010241C1 (de) * | 2000-03-02 | 2001-03-01 | Siemens Ag | Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen |
DE10064529C1 (de) * | 2000-12-22 | 2002-01-24 | Siemens Production & Logistics | Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen |
DE10064226A1 (de) * | 2000-12-22 | 2002-07-18 | Siemens Production & Logistics | Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen |
DE10064226B4 (de) * | 2000-12-22 | 2006-04-20 | Siemens Ag | Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen |
US7215794B2 (en) | 2002-03-19 | 2007-05-08 | Siemens Ag | Method and device for reading the addresses on items of mail |
US7181045B2 (en) | 2002-09-03 | 2007-02-20 | Siemens Ag | Method and device for reading the addresses of items of mail |
EP1450295B2 (de) † | 2003-02-19 | 2011-02-23 | Solystic | Verfahren zur optischen Erkennung von Postsendungen mittels mehrfacher Binarisierung |
DE10337831A1 (de) * | 2003-08-18 | 2005-03-24 | Sick Ag | Verfahren zur optischen Erkennung von alphanumerischen Zeichen |
US7346213B2 (en) | 2003-08-18 | 2008-03-18 | Sick Ag | Method for optically recognizing alpha-numerical characters |
WO2005049233A1 (en) | 2003-11-18 | 2005-06-02 | Siemens Ag | Method and apparatus for video coding by validation matrix |
WO2007094326A1 (ja) | 2006-02-15 | 2007-08-23 | Konami Digital Entertainment Co., Ltd. | 軌跡情報処理装置、軌跡情報処理方法、情報記録媒体、ならびに、プログラム |
EP1985340A1 (de) * | 2006-02-15 | 2008-10-29 | Konami Digital Entertainment Co., Ltd. | Vorrichtung zur verarbeitung von trace-informationen, verfahren zur verarbeitung von trace-informationen, informationsaufzeichnungsverfahren und programm |
EP1985340A4 (de) * | 2006-02-15 | 2009-03-25 | Konami Digital Entertainment | Vorrichtung zur verarbeitung von trace-informationen, verfahren zur verarbeitung von trace-informationen, informationsaufzeichnungsverfahren und programm |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19531392C1 (de) | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen | |
DE69226846T2 (de) | Verfahren zur Bestimmung von Wortgrenzen im Text | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE60129872T2 (de) | Verfahren zur Extrahierung von Titeln aus numerischen Bildern | |
DE3716787C2 (de) | ||
DE3689416T2 (de) | Mustermerkmalextraktion. | |
DE3485953T2 (de) | Verfahren und anlage zur on-line-erkennung handgeschriebener muster. | |
DE69329380T2 (de) | Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung | |
DE69525401T2 (de) | Verfahren und Gerät zur Identifikation von Wörtern, die in einem portablen elektronischen Dokument beschrieben sind | |
DE69230631T2 (de) | Verfahren zum Vergleichen von Wortgestalten | |
DE69222141T2 (de) | Verfahren und Gerät zur Erkennung von sich berührendem und degradiertem Text | |
DE60222722T2 (de) | Verfahren und Vorrichtung zur Korrektur von perspektivischen Verzerrungen in Dokumentbildern und zur Summierung von Bildzeilen | |
EP2100258B1 (de) | Vorrichtung, verfahren und computerprogramm zum identifizieren eines verkehrszeichens in einem bild | |
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE2557553C2 (de) | Maschinelles Verfahren zur Verdichtung und -Wiederausdehnung eines beliebigen Schwarzweiß-Bildes und Einrichtung zur Durchführung des Verfahrens | |
DE60303202T2 (de) | System und verfahren zum identifizieren und extrahieren von zeichenketten aus erfassten bilddaten | |
DE69428082T2 (de) | Verfahren zur Detektion finanzieller Beträge in binären Bildern | |
DE69029594T2 (de) | Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument | |
DE69230633T2 (de) | Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich | |
DE69230031T2 (de) | Mustererkennung und -echtheitsprüfung, insbesondere für handgeschriebene Unterschriften | |
DE69530566T2 (de) | Hough-Transform mit Fuzzy-Gradient und Wahl | |
DE10043460C2 (de) | Auffinden von Körperpartien durch Auswerten von Kantenrichtungsinformation | |
DE69230127T2 (de) | Diagrammerkennungssystem | |
DE10036110A1 (de) | Verfahren zur Bestimmung des Schrägwinkels eines zweidimensionalen Barcodes | |
DE2752421A1 (de) | Anordnung fuer die abtastung und digitalisierung von grafischen darstellungen oder daten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8100 | Publication of patent without earlier publication of application | ||
D1 | Grant (no unexamined application published) patent law 81 | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: SIEMENS AG, 80333 MUENCHEN, DE AB & M GMBH, 76131 |
|
8339 | Ceased/non-payment of the annual fee |