DE19531392C1 - Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen - Google Patents

Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen

Info

Publication number
DE19531392C1
DE19531392C1 DE19531392A DE19531392A DE19531392C1 DE 19531392 C1 DE19531392 C1 DE 19531392C1 DE 19531392 A DE19531392 A DE 19531392A DE 19531392 A DE19531392 A DE 19531392A DE 19531392 C1 DE19531392 C1 DE 19531392C1
Authority
DE
Germany
Prior art keywords
contour
image
lines
line
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE19531392A
Other languages
English (en)
Inventor
Christopher Asp
Ruediger Mierzwa
Michael Boldt
Udo Miletzki
Torsten Lange
Wolfgang Dr Uebel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
& M AB GmbH
AEG Electrocom GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by & M AB GmbH, AEG Electrocom GmbH filed Critical & M AB GmbH
Priority to DE19531392A priority Critical patent/DE19531392C1/de
Application granted granted Critical
Publication of DE19531392C1 publication Critical patent/DE19531392C1/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/168Smoothing or thinning of the pattern; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

Die vorliegende Erfindung betrifft das Gebiet der automatischen Bilderkennung, insbesondere die Erkennung von Schriften, vor allem von handgeschriebenen Wörtern und Buchstaben.
Allgemein ist die Erkennung von handgeschriebenen Schriften eine schwierigere Aufgabe, als die Erkennung von Maschinenschrift. In beiden Fällen geht es allerdings um die Klassifizierung von Objekten mit bedeutungsvollen Regelmäßigkeiten in einer komplexen Umgebung. Generell dabei auftretende Probleme betreffen die erforderliche Speicherkapazität und die erforderliche Rechenzeit, da in einem typischen automatischen Zeichenerkennungssystem eine Referenzbibliothek sämtlicher zu erwartender Zeichen angelegt wird, mit deren Inhalt zu erkennende Zeichen verglichen werden.
Zur Lösung dieses Problems sind bisher verschiedene Ansätze vorgeschlagen worden, so unter anderem die Verwendung neuronaler Netze, direkte Musterextraktion und Matrixverfahren. Eine kurze Übersicht über das Gesamtgebiet ist in dem Artikel "Document analysis - from pixels to contents" Proceedings of the IEEE, Vol. 18, No. 7, Juli 1992, S. 1101-1118, zu finden.
Es ist auch bereits bekannt, nicht unmittelbar von der Binärdarstellung der Bildvorlage, sondern von einer Konturbeschreibung auszugehen. Eine solche Konturbeschreibung ist z. B. aus dem Artikel "General data structure for image analyses based on a description of connected components", computing 42, S. 17-34, (1989) bekannt. Aus diesem Dokument ist auch bereits bekannt, die Konturlinien durch linienorientierte Bildprimitive, d. h. durch Polygone, zu approximieren.
Aus der Druckschrift JAKUB SEGEN "Model Learning and Recognition of Nonrigid Objects", IEEE 597-602 (1989) ist bereits die Repräsentation zweidimensionaler Objekte durch eine Menge lokaler Features bekannt. Als lokales Feature wird ein lokales Extremum der Krümmung einer zweidimensionalen Kurve herangezogen. Andere Typen lokaler Features sind gemäß diesem Dokument Wendepunkte, gerade Linien und Kreissegmente. Hiervon ausgehend wird vorgeschlagen, eine Hierarchie von Gestaltprimitiven zu konstruieren, mit dem Ziel, allgemeine Formen durch eine Menge von Beziehungen zwischen lokalen Features zu charakterisieren.
Die Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen anzugeben, wobei jeder Graph aus Knoten und Linien, z. B. repräsentiert als Polygonzüge, besteht.
Diese Aufgabe wird durch die Merkmale des Patentanspruchs 1 gelöst.
Die Erfindung ermöglicht die besonders schnelle und robuste Erzeugung einer strukturellen Repräsentation der Bildvorlage.
Weitere vorteilhafte Ausbildungen der Erfindung sind in den Unteransprüchen sowie der Beschreibung und den Zeichnungen zu entnehmen.
Das erfindungsgemäße Verfahren ist vorzugsweise Bestandteil eines Systems, bei dem ausgehend von einem durch einen optischen Scanner erzeugten Abbild der Bildvorlage und der nachfolgenden Erzeugung eines Binärbildes der Bildvorlage bei verschiedenen Abstraktionsstufen eine Bildbearbeitung erfolgt. Ein solches System wird z. B. in automatischen Anschriftenlesern oder Beleglesern eingesetzt.
Das Verfahren wird vorzugsweise in einem System verwendet, das aus verschiedenen Modulen besteht. Die wesentlichen Module betreffen dabei Bildvorverarbeitung, Bildabstrahierung, Bestimmung von Graphmerkmalen, Filterung von Erkennungsvorschlägen aus einer Referenzbibliothek, die eigentliche Zeichenerkennung und Auswertung der von der Zeichenerkennung gelieferten Wortvorschlagslisten, wobei Wortglaubwürdigkeiten zugeordnet werden.
Grundsätzlich ist das erfindungsgemäße Verfahren generell zur strukturellen Bilddatenreduktion und zur Bildspeicherung geeignet.
Im folgenden wird die Erfindung anhand von Zeichnungen genauer erläutert.
Es zeigen:
Fig. 1 eine Modulübersicht eines Systems zur Schrifterkennung;
Fig. 2 ein typisches Binärbild;
Fig. 3 die Beschreibung eines Binärbildes durch Linien und Knotengebiete;
Fig. 4 die durch Konturcodierung repräsentierte geometrische Grenzlinie des Binärbildes gem. Fig. 2;
Fig. 5 zusammengefaßte Linien und Knotengebiete gem. Fig. 4;
Fig. 6 die Linien und Knotengebiete der Linienrepräsentation eines Binär­ bildes und Linien und Knoten einer entsprechenden Graphre­ präsentation;
Fig. 7 die Struktur einer Graphmenge;
Fig. 8 das Verfahren zur Maximalpunktfindung einer Kontur;
Fig. 9 die Beziehung zwischen Maximalpunkten und Polygonapproximation einer Kontur.
In Fig. 1 ist eine Übersicht über die verschiedenen Prozeßmodule eines Schrifterkennungssystems dargestellt. Erkennbar ist, daß es sich bei der Schrifterkennung um einen Multilevelprozess handelt, bei dem ausgehend von dem durch eine optische Abtasteinrichtung und einer anschließenden Bildvorverarbeitung gelieferten Binärbild eines Schriftbildes über verschie­ dene Verarbeitungsstufen ein Teilwörterbuch mit Glaubwürdigkeiten zuge­ ordneter Bedeutungsklassen erzeugt wird. Ein System nach Fig. 1 wird vorzugsweise als echtzeitfähiges Script-Worterkennungssystem verwendet. Dabei bedeutet "Scrip" alle Ausprägungen von freier Handschrift, d. h. von einer Handblockschrift mit isolierten "Kleinbuchstaben" über die verschiedenen Mischformen bis hin zu vollständig gebundener Schreib­ schrift sowie handschriftliche Maschinenschriftfonds und verklebte, d. h. mit üblichen Schriftsegmentierungsverfahren nicht segmentierbare Maschi­ nenschriftfonds. Grundsätzlich ist jedoch dieses System auch für die Erkennung von anderen Schriftarten und andere Anwendungsgebiete der Bilderkennung, wie z. B. flow-chart-Analyse, geeignet.
Ausgehend von dem von der optischen Abtastvorrichtung gelieferten Abbild 10 erfolgt in der Bildvorverarbeitung 12 eine Rauschverringerung, bei der das Binärbild geglättet wird. Bei Schriftbildern erfolgt üblicherweise eine Identifizierung und Isolierung von signifikanten Layout-Elementen, wie z. B. Adreßzeichen. Anschließend wird eine Abstraktion des Bildes 14 er­ zeugt, vorzugsweise erfolgt eine Linienrepräsentation des Bildes 15, anschließend eine Graphrepräsentation 16 sowie eine Normierung auf der Graphebene 17.
In einem weiteren Schritt werden die globalen Graphmerkmale 18 be­ stimmt; insbesondere erfolgt eine Partitionierung der Graphen 19 und eine merkmalsgesteuerte Reduktion der aus einem Gesamtwörterbuch 22 gewonnenen Wörter mit nachfolgender Filterung 24, die mittels eines Teil­ wörterbuchs 26 gesteuert wird.
Bei der eigentlichen Zeichenerkennung 28 werden Bedeutungsklassen gefunden, die durch ein oder mehrere Graphmodelle repräsentiert werden, denen in der Auswertung 34 Wortglaubwürdigkeiten zugeordnet werden. Das Ergebnis des Gesamtprozesses ist ein Teilwörterbuch, mit den einzel­ nen Wörtern zugeordneten Glaubwürdigkeiten.
Fig. 2 zeigt ein Binärbild einer handgeschriebenen Ziffer 4. In diesem Beispiel werden die Bildpunkte als quadratische Flächenelemente reprä­ sentiert, deren Kantenlänge die Einheitsmenge ist. Zur Beschreibung in einem kartesischen Koordinatensystem wird grundsätzlich zwischen den Eck- und Pixelkoordinaten unterschieden. Die Eckkoordinaten sind auf die geometrischen Grenzen der Bildpunkte ausgerichtet. Beispielsweise haben die vier Ecken des Bildpunktes in der linken unteren Ecke die Koordinaten E₁ = (0,0), E₂ = (1,0), E₃ = (1,1), E₄ = (0,1). Die Pixelkoordinaten indi­ zieren die einzelnen Bildpunkte. Z. B. hat der Bildpunkt in der linken unte­ ren Ecke die Koordinaten P = (0,0).
Binärbilder können durch Linien- und Knotengebiete beschrieben werden. Fig. 3 illustriert eine solche Beschreibung eines Binärbildes. Das Beispiel in Fig. 3 besteht aus zwei Liniengebieten 30, 31 und einem Knotengebiet 40. Jedes Liniengebiet weist eine Linienseite 1 und eine Linienseite 2 auf. Eine Linien- und Knotengebietrepräsentation kann man mittels einer Kon­ turcodierung erhalten, die auf dem Rasterchaincode (RC-Code) basiert und den Verlauf der geometrischen Grenzlinie eines Schwarzgebiets der Binär­ darstellung beschreibt. Diese Codierung beschreibt jedes zusammen­ hängende Schwarzgebiet durch eine Liste von Konturprimitiven, die die absoluten Richtungen right, up, left, down der Bildpunktkanten einer Kontur enthalten.
Fig. 4 zeigt für das Binärbild der Fig. 3 die durch eine Konturcodierung erhaltene geometrische Grenzlinie. Bei einem beliebigen Bild ist es möglich, durch Ablaufen der Kontur die Flächen der einzelnen Schwarzgebiete, die Anzahl der konkaven und konvexen Ecken der Kontur und das umschrei­ bende Rechteck aller Schwarzgebiete zu bestimmen.
Zusammen mit lokalen Merkmalen der Kontur werden diese globalen Merkmale benutzt um Linienhypothesen zu bilden. Implizit sind nach der Bestimmung der Linienhypothesen die Knotengebiete schon bekannt und zwar als die Gebiete, die zu keiner Linie gehören.
Fig. 5 zeigt die zum Binärbild der Fig. 2 gehörenden Linien und Kno­ tengebiete. Generell wird durch das Bild eine komplexe, hierarchiche Struktur aus Knoten und Linien und gleichen Konturelementen reprä­ sentiert. Die oberste Hierarchieebene bildet eine Beschreibung der globalen Merkmale des jeweiligen Bildes. Bei der Implementierung in einer Datenver­ arbeitungsanlage ist von dieser Ebene ein Zugriff auf die nächsttiefere Hier­ archieebene, die der Knoten, vorgesehen. Für jeden Knoten existiert eine Zugriffsmöglichkeit auf diejenigen Linien, die von diesem Knoten ausgehen und die dritte Ebene der Hierarchie bilden. Von der Linie besteht über die Endkonturelemente Zugriff auf die gesamte Konturbeschreibung beider Seiten der Linie. In Fig. 3 sind die Endkonturelemente mit S11, S12, S21 und S22 für jede Linie bezeichnet.
Als globale Merkmale zur Bildbeschreibung werden vorzugsweise Höhe und Breite und mittlere Strichdicke des Wortbildes verwendet. Zur Be­ schreibung der Knoten werden X- und Y-Koordinaten des Umfangs­ schwerpunktes und die Ordnung des Knotens d. h. die Anzahl der von ihm ausgehenden Linien verwendet. Eine Linie wird durch die Merkmale der ersten und zweiten Konturseite der Linie, mittlere Länge der Linie und Richtungsinformation an den beiden Linienenden beschrieben. Ein Konturpunkt wird durch die Merkmale X- und Y-Position des Konturpunktes und Winkel der Tangente durch diesen Konturpunkt charakterisiert.
In der oben beschriebenen Linienrepräsentation des Binärbildes wird dieses im wesentlichen durch Linien- und Knotengebiete und die Ver­ bindungsstruktur dieser Gebiete charakterisiert. Grundsätzlich läßt sich aus dieser Darstellung noch das Binärbild rekonstruieren. Für die Zeichener­ kennung ist jedoch eine kompaktere Beschreibung des Bildes wesentlich, bei dem die Knoten- und die Liniengebiete bzw. Konturen in geeigneter Weise zusammengefaßt werden. Dies geschieht durch eine Graphreprä­ sentation des Bildes.
Fig. 6 zeigt einen Ausschnitt eines Schriftbildes in der Linienrepräsentation und in der daraus gewonnenen Graphrepräsentation. Es ist ersichtlich, daß aus Liniengebieten Polygone mit Stützpunkten und aus Knotengebieten Knoten mit vorzugsweise nur einem geometrischen Merkmal geworden sind.
Fig. 7 illustriert die Struktur der Graphmenge. Die Graphmenge hat demnach eine komplexe hierarchiche Struktur bestehend aus Graphen 1 bis P, die jeweils aus Knoten und Linien bestehen, wobei letztere aus Punkten aufgebaut sind.
Auf der obersten Hierarchiebene wird die Graphmenge durch das Merkmal der Dimension beschrieben, das vorzugsweise die Untermerkmale X- und Y-Koordinaten der Seiten des umschreibenden Rechtecks, Breite und Höhe des Rechtecks, Koordinaten des Rechteckmittelpunktes sowie die Gesamt­ länge der zur Graphmenge gehörenden Linien aufweist.
Ein Graph wird vorzugsweise durch die Merkmale: umschreibendes Rechteck des Graphen, relative Koordinaten innerhalb des umschreibenden Rechtecks der Graphmenge, Verbindungen zu Linien und Knoten und Verbindungen zu anderen Graphen charakterisiert.
Ein Knoten wird vorzugsweise durch die Koordinaten des Knotenschwer­ punktes und die Verbindungen zu den abgehenden Linien beschrieben.
Eine Linie weist folgende Merkmale auf: vorzugsweise umschreibendes Rechteck der Linie, akkumulierter Gesamtwinkel der Linie, relative Lage der Linie innerhalb des umschreibenden Rechtecks des Graphen, Winkel an den beiden Linienenden, Verbindung zu den beiden Endknoten der Linie sowie notwendigerweise die Verbindung zu den Punkten auf dieser Linie.
Ein Punkt wird vorzugsweise durch folgende Merkmale beschrieben: Ko­ ordinaten des Punktes, Abstand zum nächsten Punkt auf der Linie; bei Endpunkten Endausrichtung der Linie; bei Maximalpunkten Winkel der zugehörigen Projektionsachse.
Beim Übergang zur Graphrepräsentation des Bildes werden die Linienge­ biete bzw. Konturen durch die beiden Endpunkte des Liniengebiets sowie gegebenenfalls durch einen oder mehrere Stützstellenpunkte approximiert. Wesentlich für das erfindungsgemäße Verfahren ist die Bestimmung dieser Stützstellenpunkte aus Maximalpunkten der Kontur, die durch Projektion auf vorgegebenen festen Achsen erhalten werden.
In einer bevorzugten Ausführungsform der Erfindung werden die Stützstel­ lenpunkte aus der längeren der beiden Konturen eines Liniengebiets bestimmt. In einer weiteren bevorzugten Ausführungsform wird von einer Art Mittelachse des Liniengebiets ausgegangen.
Im folgenden wird am Beispiel der Fig. 8 die Approximation durch Maxi­ malpunkte der Kontur genauer beschrieben. In Fig. 8 ist der Rand eines Schwarzgebietes vereinfacht als kontinuierliche Kurve dargestellt. Die Kurve wird generell auf eine vorgegebene Anzahl von Achsen mit jeweils unterschiedlichem Winkel α gegenüber einem vorgegebenen festen kartesi­ schen Koordinatensystem projiziert. Fig. 8 zeigt die Situation vereinfacht lediglich für eine Projektion auf die X-Achse. Es sei S der beliebige Start­ punkt für die Suche der Maxima. Dann wird die Kurve durchlaufen und dabei eine Projektion auf die X-Achse gebildet. Beim Durchlaufen der Kurve variiert der Wert für die Projektion entsprechend. In der resultierenden Projektionskurve auf die X-Achse werden die lokalen Maxima gesucht. In Fig. 8 erhält man an den Punkten A und C lokale Maxima, an den Punkten B und D lokale Minima.
Ein Minimum der Projektion auf eine X-Achse entspricht offensichtlich einem Maximum der Projektion zu einer Achse, die gegenüber der X-Achse um 180° gedreht ist.
Eine Kontur weist üblicherweise kleine lokale Schwankungen auf. Um zu verhindern, daß dadurch zu viele unsignifikante Maxima bzw. Minima er­ halten werden, werden nur signifikante lokale Maxima gesucht. Als Krite­ rium hierfür wird auf beiden Seiten eines Maximums jeweils ein Minimum gefordert, das einen Mindestabstand zum Maximum besitzt. Beispielsweise wird in Fig. 8 das relative Maximum bei A nur dann als signifikantes Maxi­ mum akzeptiert, wenn die Differenzen a-d und a-b eine bestimmte Schwelle überschreiten. Entsprechend ist b nur dann ein Minimalpunkt, wenn sowohl a-b als auch c-b diese Schwelle überschreiten.
Allgemeiner kann auch die Bedingung bestimmt werden, daß ein Maximum dann signifikant ist, wenn es links und rechts von der Position des Ma­ ximums Projektionspunkte gibt, die mindestens um eine vorgegebene Diffe­ renz δ tieferliegen, und wenn es das höchste lokale Maximum in dieser Umgebung ist. Dies führt dazu, daß lokale Schwankungen der Kontur, die kleiner als der Wert δ sind, bei der Polygonapproximation ignoriert werden. Vorteilhaft ist es, δ proportional zur Wurzel der mittleren Strichdicke zu wählen.
Bei der praktischen Implementierung des Verfahrens braucht nicht immer überprüft zu werden, ob z. B. auf beiden Seiten eines Maximums ein Mini­ mum liegt. Tatsächlich genügt die Überprüfung der im Umlaufsinn nachfol­ genden Seite, da Minima- und Maximawerte abwechselnd auftreten. Aller­ dings müßten beim ersten potentiellen Maximalpunkt beide Seiten überprüft werden. Daher wird der erste gefundene potentielle Maximalpunkt ignoriert und die Suche nach Maximalpunkten nach einem ganzen Umlauf um die Kontur bis zum ersten tatsächlich gefundenen Maximalpunkt nach dem Anfangspunkt S weitergeführt werden.
Statt auf die X-Achse, kann die Projektion natürlich auch auf Achsen belie­ biger Richtung erfolgen. Besonders vorteilhaft ist die Verwendung von mehreren Achsen der Neigung 0,45°, 90° und 135° bzw. ein System von acht festen Achsen mit jeweils gleicher Winkeldifferenz. Dadurch wird die Kontur als Folge von Maximalpunkten verschiedener Projektionsachsen beschrieben.
Fig. 9 zeigt den Zusammenhang zwischen den Maximalpunkten und der Polygonapproximation. Ersichtlicherweise wird durch Verbinden der auf der Kontur aufeinanderfolgenden Maximalpunkte ein Polygonzug erzeugt, der eine Approximation des ursprünglichen Bildes liefert.
Die gesamte Graphmenge wird aufbauend auf der Linienrepräsentation des Bildes rekursiv erzeugt. Hierzu wird zunächst eine neue Menge angelegt. Für alle noch nicht benutzten Knotengebiete gilt:
  • 1) Beginne einen neuen Graphen.
  • 2) Lasse den Graphen rekursiv wachsen. Durchflute dabei die ver­ bundenen Linien- und Knotengebiete und lege innen entsprechende Linien und Knoten für die Graphbeschreibung an. Alle verbundenen Linien und Knoten werden= zu einem Graphen zusammengefaßt.
Im folgenden werden die Linien- und Knotengebiete als L-Linien und L-Knoten bezeichnet, die Entsprechungen der Graphenbeschreibung als G-Linien und G-Knoten.
Im Schritt 2) wird der neue Graph so lange erweitert, bis von allen verbun­ denen L-Linien bzw. L-Knoten eine korrespondierende Version von G-Linien und G-Knoten für den Graphen erzeugt worden ist:
  • - Markiere, daß der aktuelle L-Knoten benutzt worden ist.
  • - Erzeuge den entsprechenden G-Knoten.
Für alle L-Linien, die vom aktuellen L-Knoten ausgehen:
  • - Erzeuge eine entsprechende G-Linie, falls sie nicht schon von einem anderen G-Knoten aus erzeugt worden ist.
  • - Erzeuge einen Verweis von der G-Linie auf den G-Knoten und umge­ kehrt.
Für alle L-Linien, die vom aktuellen L-Knoten ausgehen:
  • - Gehe zum L-Knoten am anderen Ende der L-Linie. Falls dieser L-Knoten noch nicht als benutzt markiert worden ist, führe die gleiche Prozedur mit diesem L-Knoten als aktuellem Knoten aus.
Nach Ausführung der bisherigen Verfahrensschritte wird die Bildvorlage durch eine Graphmenge durch Knoten, Linien und Stützstellenpunkten repräsentiert. In einem weiteren Schritt können die entstandenen Graphen noch einmal transformiert werden, insbesondere um den Erkennungsprozeß bei ganzen Worten im Gegensatz zu Einzelzeichen zu erleichtern. Hierzu wird die Repräsentation des Graphen derart geändert, daß die Stützstellen­ punkte der Polygonapproximation als Knoten zweiter Ordnung dargestellt werden. Daher wird in dieser transformierten Graphrepräsentation eine Linie mit Stützstellenpunkten ersetzt durch eine homogene Struktur mit abwechselnden Linien und Knoten. Dies kann rekursiv erfolgen analog zur Vorgehensweise, wie sie bei der ursprünglichen Graphrepräsentation aus den Ergebnissen der Linienrepräsentation angewandt wird.
Die Ausführung des erfindungsgemäßen Verfahrens erfolgt durch ein Computersystem, das zumindest eine Einrichtung zum Anlegen und zur Speicherung von Datenstrukturen aufweist, mit denen die oben beschrie­ bene Linienrepräsentation der Fig. 6, bestehend aus Linien- und Knotenge­ bieten sowie der Verbindungsstruktur dieser Gebiete, repräsentiert wird, sowie einer Einrichtung zum Speichern einer Datenstruktur, durch die die Graphrepräsentation der Fig. 7 repräsentiert wird, bestehend aus Graphen, die jeweils aus Knoten und Linien bestehen, wobei letztere aus Punkten aufgebaut sind. Vorzugsweise werden dabei die Elemente der Linien bzw. Graphrepräsentation als Objekte im Sinne der objektorientierten Technolo­ gie aufgefaßt. Darüber hinaus sind bei dem Computersystem eine Einrich­ tung zur Erzeugung von Binärbildern aus den Signalen einer optischen Abtastvorrichtung sowie weitere Vorrichtungen zur Weiterverarbeitung der Graphrepräsentation vorgesehen, wie in Fig. 1 dargestellt ist.

Claims (7)

1. Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen wobei aus einem Binärbild der Bildvorlage eine Konturdarstellung erzeugt wird, die Graphrepräsentation aus einer Menge von Graphen besteht und jeder Graph aus Knoten und Linien besteht, dadurch gekennzeichnet, daß eine Projektion der Konturlinien auf eine vorgegebene Anzahl von festen Achsen erfolgt und die Stützstellenpunkte der Polygon­ züge aus den signifikanten lokalen Maxima der Projektionskurve jeder Achse bestimmt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Projektion der längeren der beiden Konturlinien eines Liniengebiets der Konturdarstellung verwendet wird.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Projektion der Mittelachse der beiden Konturlinien eines Liniengebiets der Konturdarstellung verwendet wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeich­ net, daß ein System von Achsen mit gleicher Winkeldifferenz vorge­ sehen ist.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeich­ net, daß bei der Bestimmung der lokalen Maxima lokale Schwankun­ gen der Konturlinien kleiner als ein vorgegebenes δ ignoriert werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeich­ net, daß die Graphrepräsentation zur Bildspeicherung verwendet wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeich­ net, daß die Graphrepräsentation in einem Bilderkennungssystem, insbesondere zur Erkennung von Script-Schriften verwendet wird.
DE19531392A 1995-08-26 1995-08-26 Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen Expired - Fee Related DE19531392C1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19531392A DE19531392C1 (de) 1995-08-26 1995-08-26 Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19531392A DE19531392C1 (de) 1995-08-26 1995-08-26 Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen

Publications (1)

Publication Number Publication Date
DE19531392C1 true DE19531392C1 (de) 1997-01-23

Family

ID=7770439

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19531392A Expired - Fee Related DE19531392C1 (de) 1995-08-26 1995-08-26 Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen

Country Status (1)

Country Link
DE (1) DE19531392C1 (de)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19624977A1 (de) * 1996-06-22 1998-01-02 Siemens Ag Verfahren zur Verarbeitung von Postsachen
EP0848350A1 (de) * 1996-12-11 1998-06-17 Hewlett-Packard Company Vorrichtung und Verfahren zur Handschriftkomprimierung
DE19718805A1 (de) * 1997-05-03 1998-11-19 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen
DE19742771C1 (de) * 1997-09-27 1998-12-10 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen
US6018591A (en) * 1994-07-04 2000-01-25 Hewlett-Packard Company Scribble matching
DE19646522C2 (de) * 1996-11-12 2000-08-10 Siemens Ag Verfahren und Vorrichtung zur Erkennung von Verteilinformationen auf Sendungen
DE19922788C1 (de) * 1999-05-18 2000-10-05 Siemens Ag Verfahren zum Sortieren von Sendungen
DE10010241C1 (de) * 2000-03-02 2001-03-01 Siemens Ag Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen
DE10064529C1 (de) * 2000-12-22 2002-01-24 Siemens Production & Logistics Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
DE10064226A1 (de) * 2000-12-22 2002-07-18 Siemens Production & Logistics Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
DE10337831A1 (de) * 2003-08-18 2005-03-24 Sick Ag Verfahren zur optischen Erkennung von alphanumerischen Zeichen
WO2005049233A1 (en) 2003-11-18 2005-06-02 Siemens Ag Method and apparatus for video coding by validation matrix
US7181045B2 (en) 2002-09-03 2007-02-20 Siemens Ag Method and device for reading the addresses of items of mail
US7215794B2 (en) 2002-03-19 2007-05-08 Siemens Ag Method and device for reading the addresses on items of mail
WO2007094326A1 (ja) 2006-02-15 2007-08-23 Konami Digital Entertainment Co., Ltd. 軌跡情報処理装置、軌跡情報処理方法、情報記録媒体、ならびに、プログラム
EP1450295B2 (de) 2003-02-19 2011-02-23 Solystic Verfahren zur optischen Erkennung von Postsendungen mittels mehrfacher Binarisierung

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IEEE Trans. on PAMI, Vol. 16, Nr. 4, 1994, pp. 393-404 *
JAKUB SEGEN: "Model Learning and Recognition of Nonrigid Objects", CH 2752-4/89 IEEE, pp. 597-602 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6018591A (en) * 1994-07-04 2000-01-25 Hewlett-Packard Company Scribble matching
US6909789B1 (en) 1996-06-22 2005-06-21 Siemens Aktiengesellschaft Method of processing postal matters
DE19624977A1 (de) * 1996-06-22 1998-01-02 Siemens Ag Verfahren zur Verarbeitung von Postsachen
US6665422B1 (en) 1996-11-12 2003-12-16 Siemens Aktiengesellchaft Method and device for recognizing distribution data on postal packets
DE19646522C2 (de) * 1996-11-12 2000-08-10 Siemens Ag Verfahren und Vorrichtung zur Erkennung von Verteilinformationen auf Sendungen
EP0848350A1 (de) * 1996-12-11 1998-06-17 Hewlett-Packard Company Vorrichtung und Verfahren zur Handschriftkomprimierung
DE19718805A1 (de) * 1997-05-03 1998-11-19 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen
DE19718805C2 (de) * 1997-05-03 1999-11-04 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen
DE19742771C1 (de) * 1997-09-27 1998-12-10 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen
DE19922788C1 (de) * 1999-05-18 2000-10-05 Siemens Ag Verfahren zum Sortieren von Sendungen
US6570115B1 (en) 1999-05-18 2003-05-27 Siemens Aktiengesellschaft Method for sorting mail
US6917009B2 (en) 2000-03-02 2005-07-12 Siemens Aktiengesellschaft Method and apparatus for processing mail pieces
DE10010241C1 (de) * 2000-03-02 2001-03-01 Siemens Ag Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen
DE10064529C1 (de) * 2000-12-22 2002-01-24 Siemens Production & Logistics Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
DE10064226A1 (de) * 2000-12-22 2002-07-18 Siemens Production & Logistics Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
DE10064226B4 (de) * 2000-12-22 2006-04-20 Siemens Ag Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
US7215794B2 (en) 2002-03-19 2007-05-08 Siemens Ag Method and device for reading the addresses on items of mail
US7181045B2 (en) 2002-09-03 2007-02-20 Siemens Ag Method and device for reading the addresses of items of mail
EP1450295B2 (de) 2003-02-19 2011-02-23 Solystic Verfahren zur optischen Erkennung von Postsendungen mittels mehrfacher Binarisierung
DE10337831A1 (de) * 2003-08-18 2005-03-24 Sick Ag Verfahren zur optischen Erkennung von alphanumerischen Zeichen
US7346213B2 (en) 2003-08-18 2008-03-18 Sick Ag Method for optically recognizing alpha-numerical characters
WO2005049233A1 (en) 2003-11-18 2005-06-02 Siemens Ag Method and apparatus for video coding by validation matrix
WO2007094326A1 (ja) 2006-02-15 2007-08-23 Konami Digital Entertainment Co., Ltd. 軌跡情報処理装置、軌跡情報処理方法、情報記録媒体、ならびに、プログラム
EP1985340A1 (de) * 2006-02-15 2008-10-29 Konami Digital Entertainment Co., Ltd. Vorrichtung zur verarbeitung von trace-informationen, verfahren zur verarbeitung von trace-informationen, informationsaufzeichnungsverfahren und programm
EP1985340A4 (de) * 2006-02-15 2009-03-25 Konami Digital Entertainment Vorrichtung zur verarbeitung von trace-informationen, verfahren zur verarbeitung von trace-informationen, informationsaufzeichnungsverfahren und programm

Similar Documents

Publication Publication Date Title
DE19531392C1 (de) Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE60129872T2 (de) Verfahren zur Extrahierung von Titeln aus numerischen Bildern
DE3716787C2 (de)
DE3689416T2 (de) Mustermerkmalextraktion.
DE3485953T2 (de) Verfahren und anlage zur on-line-erkennung handgeschriebener muster.
DE60222722T2 (de) Verfahren und Vorrichtung zur Korrektur von perspektivischen Verzerrungen in Dokumentbildern und zur Summierung von Bildzeilen
EP2100258B1 (de) Vorrichtung, verfahren und computerprogramm zum identifizieren eines verkehrszeichens in einem bild
DE60303202T2 (de) System und verfahren zum identifizieren und extrahieren von zeichenketten aus erfassten bilddaten
DE69535098T2 (de) Verfahren und -vorrichtung zur Suche von Bildern in einer Datenbank
DE69032421T2 (de) Verfahren und Gerät zur Dokumentschräglage-Ermittlung
DE69029594T2 (de) Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument
DE68924612T2 (de) Bildverarbeitungsmethode zur Gestalterkennung.
DE3419063C2 (de)
DE69530566T2 (de) Hough-Transform mit Fuzzy-Gradient und Wahl
DE10043460C2 (de) Auffinden von Körperpartien durch Auswerten von Kantenrichtungsinformation
DE10036110A1 (de) Verfahren zur Bestimmung des Schrägwinkels eines zweidimensionalen Barcodes
DE2752421A1 (de) Anordnung fuer die abtastung und digitalisierung von grafischen darstellungen oder daten
EP2082357B1 (de) Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild
DE2410306C3 (de) Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen
DE102020202160A1 (de) Verfahren zum Bestimmen einer Symmetrieeigenschaft in Bilddaten, Verfahren zum Steuern einer Funktion und Vorrichtung
EP0402868A2 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE102006044595B4 (de) Bildverarbeitungsvorrichtung zur Segmentierung anhand von Konturpunkten
EP0394959A2 (de) Verfahren zur Bildauswertung
DE60317455T2 (de) Segmentierung eines zusammengesetzten Bildes mittels Basis-Rechtecken

Legal Events

Date Code Title Description
8100 Publication of patent without earlier publication of application
D1 Grant (no unexamined application published) patent law 81
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: SIEMENS AG, 80333 MUENCHEN, DE AB & M GMBH, 76131

8339 Ceased/non-payment of the annual fee