DE69932167T2

DE69932167T2 - Zeichenerkennung

Info

Publication number: DE69932167T2
Application number: DE69932167T
Authority: DE
Inventors: Gunnar Sparr; Rikard Berthilsson
Original assignee: Zi Decuma AB
Current assignee: Zi Decuma AB
Priority date: 1998-08-26
Filing date: 1999-08-25
Publication date: 2006-11-23
Anticipated expiration: 2019-08-26
Also published as: EP1105833A1; CA2341266A1; JP2002523844A; CA2341266C; AU749849B2; CN1315024A; RU2001107822A; US20010026639A1; JP4580554B2; IL141294A; SE9802832L; CN1163842C; KR100615124B1; EP1105833B1; KR20010090435A; DE69932167D1; US7139430B2; AU5890799A; ATE331994T1; US6711290B2

Description

Technisches Sachgebiet
Die vorliegende Erfindung bezieht sich auf ein Verfahren zur Zeichenerkennung gemäß dem Oberbegriff des Anspruchs 1. „Zeichen" ist in diesem Zusammenhang eine neutrale, entsprechende Zahl, d.h. getrennte Zeichen, wie beispielsweise Buchstaben und Ziffern, ebenso wie Zusammensetzungen von mehreren Zeichen, wie beispielsweise Worte, auf die hier Bezug genommen wird. Sowohl allgemein verwendete Zeichen als auch imaginäre Zeichen sind natürlich eingeschlossen.
Hintergrund
Es existiert eine Vielzahl von bekannten Verfahren für eine Zeichenerkennung, insbesondere zum Erkennen von handgeschriebenen Zeichen, die eine besonders gute Interpretation des Zeichens erfordern. Mehrere der bekannten Verfahren basieren auf der Erfassung jedes Strichs des Stifts, wenn ein handgeschriebenes Zeichen gebildet werden soll. Geometrische Charakteristika, wie beispielsweise Richtungen, Neigungen und Winkel jedes Strichs oder eines Teils eines Strichs, werden bestimmt und mit entsprechenden Daten von gespeicherten, bekannten Zeichen verglichen. Es wird angenommen, dass das geschriebene Zeichen das gespeicherte Zeichen ist, dessen geometrische Charakteristika am besten den geometrischen Charakteristika des geschriebenen Zeichens entsprechen. Die geometrischen Charakteristika sind zu einem xy-Koordinatensystem in Bezug gesetzt, das die benutzte Schreibfläche abdeckt. Solche bekannten Verfahren sind in, zum Beispiel, der US-5,481,625 und der US-5,710,916 offenbart. Ein Problem in solchen Verfahren ist dasjenige, dass sie für eine Rotation empfindlich sind. Zum Beispiel besitzt, wenn man diagonal über die Schreibfläche schreibt, das Verfahren Schwierigkeiten beim korrekten Bestimmen, welche Zeichen geschrieben werden.
Die US-5,537,489 offenbart ein Verfahren zum Vorverarbeiten der Zeichen, indem sie normiert werden. Das geschriebene Zeichen wird abgetastet und jede Abtastung wird als ein Paar Koordinaten dargestellt. Anstelle nur eines Vergleichens der Zeichen in der Koordinatenebene wird die Transformation bestimmt, die am besten das geschriebene Zeichen auf ein Modell-Zeichen einstellt. Indirekt werden so auch eine Rotation und bestimmte Typen von Deformationen, die die vorstehend erwähnten Verfahren nicht handhaben können, entsprechend berücksichtigt. Die Transformation wird dazu verwendet, das geschriebene Zeichen zu normieren. Insbesondere wird das Zeichen dadurch normiert, dass es so translatiert wird, dass sein zentraler Punkt in dem Ursprung der Koordinaten liegt, wo auch der zentrale Punkt des Modell-Zeichens vorgefunden wird, wonach das Zeichen in einer solchen Art und Weise skaliert und gedreht bzw. rotiert wird, dass es dem Modell-Zeichen in der bestmöglichen Art und Weise entspricht.
Ein Nachteil dieses Verfahrens ist derjenige, dass die Normierung Berechnungsleistung erfordert und dass in jedem Fall die Auswahl von Modell-Zeichen durch Bestimmen stattfinden muss, welches Modell-Zeichen dem geschriebenen Zeichen am meisten ähnelt.
Die US-5,559,897 offenbart ein anderes Verfahren zum Vorverarbeiten eines empfangenen Datensatzes, der für eine handgeschriebene Probe repräsentativ ist. Die Vorverarbeitungstechniken umfassen ein Filtern und Normieren des empfangenen Datensatzes. Wenn gefiltert wird, umfassen die Techniken ein Identifizieren von handschriftlichen Spitzen bzw. Scheitelpunkten innerhalb des Datensatzes und ein Herausfiltern des übermäßigen Rauschens von dem Datensatz. Ein Normieren kann ein Skalieren auf eine Standardgröße, eine Rotation der Textgrundlinie, ein Geradestellen von schräg verlaufenden, handgeschriebenen Proben, usw., einsetzen.
Ein anderes Verfahren, das sicher Drehungen handhaben kann, ist in der US-5,768,420 offenbart. In diesem bekannten Verfahren wird eine Kurvenerkennung mittels eines Verhältnisses, das als „Verhältnis von Tangenten" bezeichnet ist, beschrieben. Eine Kurve, zum Beispiel ein Teil eines Zeichens, wird durch Auswählen einer Folge von Paaren von Punkten entlang der Kurve aufgelistet, wobei die Tangenten in den zwei Punkten jedes Paars unter einem bestimmten Winkel schneiden. Das Verhältnis zwischen den Abständen von dem Schnittpunkt zu den jeweiligen Punkten des Paars wird berechnet und bildet eine Identifikation der Kurve. Dieses Verfahren ist im Prinzip nicht empfindlich für eine Translation, Skalierung und Drehung. Allerdings ist es in vieler Hinsicht beschränkt. In allererster Linie lässt es nicht bestimmte Kurvenformen zu, in denen nicht zwei Punkte, deren Tangenten unter dem vorbestimmten Winkeln schneiden, vorhanden sind. Es ist üblich, dass zumindest Bereiche eines Zeichens solche unbestimmbaren Kurvenformen für einen ausgewählten Schnittwinkel aufweisen. Dies verringert die Zuverlässigkeit des Verfahrens.
Die EP 0 782 090 offenbart ein Verfahren zum Codieren der handgeschriebenen Signatur einer Person. Die codierte, handgeschriebene Signatur soll bei einer Verifizierung einer Versuchssignatur verwendet werden. Das Verfahren weist ein digitales Abtasten der Bahn eines Stifts, um eine digitalisierte Signatur-Aufzeichnung bereitzustellen, ein Unterteilen der Signatur in einer zeitlich geordneten Folge von orientierten Verbindungen, ein Zuordnen zu jeder Verbindung eines quantisierten Strich-Richtungs-Werts entsprechend zu der jeweiligen Orientierung dieser Verbindung, um dadurch für die Signatur als ein Ganzes eine geordnete Folge von Strich-Richtungs-Werten zu erhalten, und Speichern der geordneten Folge der Strich-Richtungs-Werte in einem digitalen Speicher auf.
Zusammenfassung der Erfindung
Eine Aufgabe der Erfindung ist es, ein Verfahren für eine Zeichenerkennung zu schaffen, das nicht die vorstehend angegebenen Nachteile besitzt, und das in einem größeren Umfang individuelle Arten von handgeschriebenen Zeichen und ungewöhnlichen Schriftarten von mit Maschinenschrift-Zeichen akzeptiert und einfach mit einer begrenzten Rechenleistung auszuführen ist.
Die Aufgabe wird durch ein Verfahren gemäß der Erfindung, wie es in Anspruch 1 definiert ist, gelöst.
Gemäß der Erfindung bedeutet der Ausdruck „Vorlagensymbol", wie er in dem Anspruch definiert ist, irgend etwas von einem Teil eines getrennten Zeichens, wobei der Bereich, zum Beispiel, ein Bogen oder ein Teilstrich ist und das Zeichen ein Buchstaben oder eine Zahl ist, bis zu Verbundworten oder anderen, komplexen Zeichen. In einer ähnlichen Art und Weise bedeutet der Ausdruck „Verbund von Zeichen" irgend etwas von einem separaten Zeichen bis zu Zusammensetzungen von mehreren Zeichen. Die Reichweite der erwähnten Ausdrücke wird aus der nachfolgenden Beschreibung von Ausführungsformen ersichtlich werden.
Kurze Beschreibung der Zeichnungen
Die Erfindung und weitere Vorteile davon werden in weiterem Detail nachfolgend anhand von Ausführungsformen, unter Bezugnahme auf die beigefügten Zeichnungen, beschrieben, in denen:
1 stellt ein Beispiel eines Verbunds von Zeichen dar, der ein handgeschriebenes Zeichen aufweist, und das einige Schritte in einer bevorzugten Ausführungsform des Verfahrens gemäß der Erfindung darstellt,
2 und 3 stellen Beispiele von verschiedenen Transformationen eines Verbunds von Zeichen dar, der ein handgeschriebenes Zeichen aufweist,
4 stellt ein Beispiel einer Erkennung eines Verbunds von Zeichen dar, der mehrere Zeichen aufweist, und
5 stellt eine Ausführungsform einer Vorrichtung zum Ausführen des Verfahrens dar.
Beschreibung von Ausführungsformen
Gemäß der Erfindung weist das Verfahren für eine Zeichenerkennung eine Anzahl von Hauptschritten auf:

a) ein Verbund von Zeichen wird erfasst,
b) der Verbund von Zeichen wird vorverarbeitet,
c) der vorverarbeitete Verbund von Zeichen wird mit einem oder mehreren Vorlagensymbol(en) verglichen, und
d) eine Entscheidungsregel wird angewandt, um zu bestimmen, ob irgendeines der Vorlagensymbole in dem Verbund von Zeichen umfasst ist oder nicht.

Gemäß einer bevorzugten Ausführungsform werden die verschiedenen Hauptschritte entsprechend der folgenden Beschreibung ausgeführt. Die Ausführungsform ist bevorzugt zur Erkennung von Verbunden von Zeichen vorgesehen, die auf einer druckempfindlichen Anzeige geschrieben sind, die auf dem Markt erhältlich ist. Es sollte angemerkt werden, dass die Erfindung nützlich für die Erkennung von maschinengeschriebenen ebenso wie für handgeschriebene Verbunde von Zeichen ist, die von einer Hardcopy stammen, die, zum Beispiel, in einen Computer eingescannt ist. Eine Ausführungsform, die insbesondere an die Erkennung von Maschinenschriften, eingescannten Verbunden von Zeichen, angepasst ist, wird nachfolgend beschrieben. In der nachfolgenden Beschreibung der Schritte dieser Ausführungsform wird zum Zwecke der Vereinfachung angenommen, dass der Verbund von Zeichen ein Zeichen aufweist.
In einem Schritt a) werden Punkte auf den Zeichen unter regelmäßigen Zeitintervallen gleichzeitig dann erfasst, wenn das Zeichen auf einer druckempfindlichen Anzeige geschrieben wird. Demzufolge wird eine geordnete Folge von Punkten erhalten. In einem Schritt b) werden die nachfolgenden Vorgänge ausgeführt. Durch Interpolation zwischen den Punkten wird eine Kurvendarstellung des Zeichens erzeugt. Die Kurvendarstellung weist eine oder mehrere Kurve(n) auf, die durch die Folge von Punkten hindurchführen. Irgendein Anheben des Stifts wird erfasst, um zu verhindern, dass sich die Interpolation über Räume zwischen Punkten hinaus erstreckt, wo der Stift angehoben worden ist. Die Interpolation führt zu Zeichen, wie beispielsweise „t", „a" und „s", die dahingehend angesehen werden, dass sie aus einer oder mehreren Kurve(n) bestehen. Jede Kurve oder jede Zusammensetzung von Kurven wird holistisch als eine unteilbare, geometrische Einheit angesehen. Dies bedeutet, zum Beispiel, dass das Verfahren gemäß der vorliegenden Erfindung auf viele Arten und Weisen in Bezug auf vollständige Zeichen arbeitet (globale Zeicheninterpretation). Jeder Punkt ist als zwei Koordinaten dargestellt, die die Position des Punkts in der begrenzten Ebene, die die Anzeige bildet, anzeigen. Eine der Koordinaten, die nachfolgend als x1 bezeichnet wird, zeigt die Position seitlich an, und die zweite Position, die als x2 nachfolgend bezeichnet wird, zeigt die Position in der vertikalen Richtung an. Die Kurve wird passend als ϕ(t) = (ϕ₁(t), ϕ₂(t)), a ≤ t ≤ b parametrisiert, wobei, für den Zweck einer Vereinfachung, a = 0 und b = 1 gilt, und wird in einer Anzahl n von Punkten t₁ < t₂ ... < t_n, entsprechend irgendeiner geeigneten Parametrisierungsregel, abgetastet. Um zu beginnen, ist eine Bogenlänge die Regel, entsprechend zu der die Parametrisierung vorzugsweise ausgeführt wird, was bedeutet, dass die Punkte äquidistant angeordnet werden. Es sollte angemerkt werden, dass, aufgrund der unregelmäßigen Geschwindigkeit einer Bewegung des Schreibers, dies nicht der Fall mit den anfänglichen Koordinaten-Proben ist. Die Verwendung der Bogenlänge kann als eine Standardisierung der Parametrisierung angesehen werden, die den folgenden Vergleich mit Vorlagensymbolen erleichtert, die in einer entsprechenden Art und Weise parametrisiert und abgetastet werden. Für einige Klassen von Transformationen kann es notwendig sein, zu Reparametrisieren, was auch nachfolgend beschrieben werden wird.
Um das Zeichen mit Vorlagensymbolen zu vergleichen, ist es notwendig, eine Darstellung zu formen, die quantitative Vergleiche zulässt. Einige Abweichungen von einem Vorlagensymbol, definiert im voraus, müssen zugelassen werden, d.h. zum Beispiel muss ein „a" als ein „a" auch dann in Bezug auf seine Form interpretiert werden, wenn es sich in einem bestimmten Umfang von dem Vorlagensymbol unterscheidet. Gemäß der Erfindung wird eine Definition angewandt, die auf unterschiedlichen Transformationen basiert. In Abhängigkeit von Anforderungen in Bezug auf Flexibilität und Exaktheit, können verschiedene Klassen von Transformationen zugelassen werden, wobei die Klassen einen Typ oder mehrere Typen einer Transformation, wie beispielsweise Translation, Rotation, Skalierung, Scherung und Reflexion, aufweisen. Dies ist in 2 und 3 dargestellt. 2 stellt ein handgeschriebenes „a" in einem Kasten 2a dar. Die anderen drei Zeichen sind verschiedenen, affinen Transformationen unterworfen worden. Die Klasse von Transformationen, die aus affinen Transformationen zusammengesetzt sind, lassen eine Rotation, eine Scherung, eine Reflexion, eine Skalierung und eine Translation zu. Die Zeichen in den Kästen 2b und 2c sind einer Translation, einer Rotation, einer Skalierung und einer Scherung in Bezug auf das Zeichen in dem Kasten 2a unterworfen worden. Das Zeichen in dem Kasten 2d ist einer Translation, einer Reflexion, einer Rotation und einer Skalierung unterworfen worden.
3 stellt positive Ähnlichkeits-Transformationen dar, die nur ein Skalieren, eine Rotation und eine Translation aufweisen. Gemäß dieser Ausführungsform des Verfahrens gemäß der Erfindung sind zulässige Abweichungen auf positive Ähnlichkeits-Transformationen beschränkt. Dies bedeutet, dass ein handgeschriebenes Zeichen oder ein Teil eines Zeichens, das eine geeignete Kombination einer Skalierung, einer Rotation und einer Translation ist, das in Übereinstimmung mit einem Vorlagensymbol gebracht werden kann, als dasselbe Zeichen oder ein Teil des Zeichens interpretiert wird, das durch das Vorlagensymbol dargestellt ist. Die Übereinstimmung muss nicht vollständig sein, was nachfolgend beschrieben werden wird.
Die Darstellung, die, gemäß dieser Erfindung, zu bevorzugen ist, wird durch Bilden einer Invarianten der parametrisierten Kurve erzielt. Nützliche Invarianten sollten gemäß der Erfindung eine Interpretation zulassen, die nahe zu der Interpretation einer Person ist, die ein bestimmtes Zeichen erstellt. Dies bedeutet, dass Zeichen, in Bezug auf die eine Person in der Lage ist, sie mit einer großen Genauigkeit korrekt zu interpretieren, d.h. sie als die Zeichen zu interpretieren, die der Schreiber sagen würde, dass er sie geschrieben hat, korrekt und mit einer großen Genauigkeit durch das Verfahren gemäß der Erfindung interpretiert werden sollten. Es ist demzufolge wichtig, dass eine konstruierte Invariante in einer gut ausbalancierten Art und Weise selektiv ist. Gemäß der Erfindung werden deshalb Invarianten auf der Basis der folgenden Definition aufgebaut. Falls ϕ eine parametrisierte Kurve gemäß dem Vorstehenden ist und G eine Gruppe von Transformationen von Kurven ist, dann werden der Satz d(ϕ) = {ψ |ψ = g(ϕ), g ∈ G} und äquivalente Umschreibungen davon als die Form von ϕ bezeichnet. Es wird für Fachleute auf dem betreffenden Fachgebiet ersichtlich werden, dass die Definition viele mögliche Invarianten ermöglicht, die, allerdings, alle gemeinsam haben, dass sie die Kurve als die vorstehend erwähnte, untrennbare Einheit handhaben.
Gemäß der bevorzugten Ausführungsform der Erfindung ist die Form entsprechend zu der Gruppe von positiven Ähnlichkeits-Transformationen durch s(ϕ) = linhull({(ϕ₁, ϕ₂), (–ϕ₂, ϕ₁), (1,0), (0,1)}), d.h. einen linearen Raum, aufgebaut aus der parametrisierten Kurve ϕ, gegeben. Wie durch Fachleute auf dem betreffenden Fachgebiet ersichtlich werden wird, ist s(ϕ) vorzugsweise eine äquivalente Paraphrase von d(ϕ). In der Praxis vermittelt die Verwendung dieser Form, dass alle parametrisierten Kurven, die ineinander durch positive Ähnlichkeits-Transformationen transformiert werden können, denselben linearen Raum als eine Form haben.
Im Gegensatz dazu sind, gemäß einer anderen Ausführungsform der Erfindung, affine Transformationen zulässig. Dann ist die Form, nach einem Umschreiben, gegeben durch s(ϕ) = linhull(ϕ₁, ϕ₂, 1), was in weiterem Detail, zum Beispiel, in „Extension of affine shape", Technical report, Dept. of Mathematics, Lund Institute of Technology 1997, von R. Berthilsson, beschrieben ist.
In einem Schritt c) wird die Form des geschriebenen Zeichens mit entsprechend geformten Formen für eine Anzahl von Vorlagensymbolen verglichen. In dieser Ausführungsform der Erfindung werden diese Vorlagensymbole durch Einführen bereitgestellt, indem man einen Benutzer mit der Hand auf einer Anzeige alle Zeichen, die er benötigen könnte, gleichzeitig schreiben lässt, die entsprechend den vorstehend beschriebenen Schritten a) und b) verarbeitet werden und als Vorlagensymbole gespeichert werden. Wie vorstehend erwähnt ist, weist jedes Vorlagensymbol eine oder mehrere Kurve(n) auf, die einen Teil eines Zeichens oder das vollständige Zeichen darstellen, was in der Praxis bedeutet, dass mehrere Vorlagensymbole erforderlich sein können, um ein Zeichen aufzu bauen. Allerdings kann, wie weiter nachfolgend angegeben werden wird, ein Vorlagensymbol, im Gegensatz dazu, auch eine Folge von verschiedenen Zeichen darstellen.
Gemäß der Erfindung ist eine Art und Weise, die Formen zu vergleichen, die Verwendung eines geometrischen Maßes einer Nähe. Für die vorstehenden, geformten Formen gemäß der bevorzugten Ausführungsform und der alternativen Ausführungsform kann, jeweils, ein geometrisches Näherungsmaß μ für Formen, die lineare Unterräume innerhalb des Raums möglicher, parametrisierter Kurven S aufweisen, verwendet werden. Ein Beispiel eines solchen geometrischen Näherungsmaßes ist: μ = |(I – Ps(ϕ)Ps(ψ)|HS wobei HS die Hilbert-Schmidt-Norm darstellt und I die Identität ist.
In der Definition stellen s(ϕ) und s(ψ) solche linearen Unterräume dar. P_s(ϕ) und P_s(ψ) stellen weiterhin orthogonale Projektionen auf s(ϕ) und s(ψ), jeweils, dar. HS stellt die Hilbert-Schmidt-Norm dar und I ist die identität. Die Berechnung des geometrischen Näherungsmaßes μ umfasst ein Auswählen eines skalaren Produkts.
Ein allgemeines Beispiel eines skalaren Produkts von zwei Funktionen ϕ(t) und ψ(t) mit Werten in IR_n ist:
wobei dm_k positive Radon-Maße sind und · das Skalarprodukt auf IRⁿ darstellt.
Da jede abgetastete Kurve eine Vielzahl von Punkten aufweist, jeder mit zwei Koordinaten, ist es passend, eine Matrix-Schreibweise für eine vergleichende Verarbeitung der Formen zu verwenden. Die Schritte eines Beschreibens der Kurven in einer Matrix-Schreibweise und ein Aufbauen eines geometrischen Näherungsmaßes können mathematisch wie folgt beschrieben und ausgeführt werden:
Es wird die Kurve des erfassten Zeichens als ψ(t) = ψ₁(t), ψ₂(t)), 0 ≤ t ≤ 1, bezeichnet und die Kurve eines Vorlagensymbols wird mit ϕ(t) = (ϕ₁(t), = ϕ₂(t)), 0 ≤ t ≤ 1, bezeichnet. Durch Abtasten der Kurve an den Zeitpunkten 0 = t₁ < t₂ ... < t_n = 1 können die folgenden Matrizen gebildet werden:
Die Matrizen werden mit QR in einer für Fachleute bekannten Art und Weise faktorisiert, wie beispielsweise so, dass M₁ = Q₁R₁ und M₂ = Q₂R₂ gelten, wobei Q₁ und Q₂ orthogonale Matrizen sind und R₁ und R₂ ein oberes Dreieck sind. Die Matrizen Q₁ und Q₂ stellen die Formen des erfassten Zeichens und des Vorlagensymbols, jeweils, dar, was die Parametrisierungen und die Abtastung ergibt.
Ein geometrisches Näherungsmaß μ kann wie folgt konstruiert werden: μ(Q1Q2) = ∥⁣Q2 – Q1QT1 Q2∥⁣2F wobei die Norm ∥⁣·∥⁣_F die Frobenius-Norm bezeichnet. Wenn I = 0 und dm₀ das gewöhnliche Lebesgue-Maß an dem Intervall [0, 1] in dem vorstehenden, allgemeinen Beispiel eines skalaren Produkts ist, wird exakt dieses geometrische Näherungsmaß erhalten. Die Wahl des Skalarprodukts beeinflusst die Funktionsweise des Verfahrens.
Nach der Bestimmung der Werte des Näherungsmaßes zwischen der Form des erfassten Zeichens und den Formen aller oder einer Untermenge der Vorlagensymbole wird Schritt d) ausgeführt. In diesem Schritt wird jeder Wert mit einer individuellen Akzeptanzgrenze verglichen, die für jedes Vorlagensymbol definiert ist. Die Vorlagensymbole, deren Werte des Näherungsmaßes kleiner als deren jeweilige Akzeptanzgrenzen sind, werden als plausible Interpretationen des geschriebenen Zeichens betrachtet. Von diesen plausiblen Interpretationen wird das Vorlagensymbol, dessen Wert der kleinste ist, ausgewählt. Im Gegensatz dazu wird, wenn kein Wert kleiner als dessen Akzeptanzgrenze ist, eine verfeinerte Bestimmung vorgenommen. Die Akzeptanzgrenzen können auch ein und dieselbe für die Vorlagensymbole sein. Ein Vorteil einer Verwendung von individuellen Akzeptanzgrenzen ist derjenige, dass kompliziertere Zeichen, wie beispielsweise „@“, dazu tendieren, dass sie einen ziemlich hohen Wert des Näherungsmaßes auch in dem Fall einer Übereinstimmung haben, während einfachere Zeichen, wie beispielsweise „1", allgemein einen niedrigen Wert des Näherungsmaßes in dem Fall einer Korrespondenz haben. Weitere Varianten sind möglich, wobei einige davon nachfolgend beschrieben werden.
Theoretisch muss das Näherungsmaß μ(s(ϕ), s(ψ) = 0) erfüllen, wenn ϕ und ψ Parametrisierungen derselben Kurve sind, wenn die Kurven voneinander mit einer positiven Ähnlichkeitstransformation erhalten werden. Da sich Personen, wenn sie schreiben, nicht exakt an die zulässigen Ähnlichkeits-Transformationen der Vorlagensymbole halten, sollten allerdings die Akzeptanzgrenzen so ausgewählt werden, dass sie größer als 0 sind.
Andererseits werden die Akzeptanzgrenzen deshalb so bestimmt, dass sie Werte sind, die >0 sind, und andererseits wird der Fall, wo kein Wert kleiner als seine Akzeptanzgrenze ist, nicht wie dann interpretiert, wenn das geschriebene Zeichen kein Äquivalent unter den Vorlagensymbolen besitzt. Anstelle davon wird, gemäß dieser Ausführungsform, eine Reparametrisierung ausgeführt, da die Parametrisierung das Endergebnis in einem ziemlich großen Umfang beeinflusst. Eine bevorzugte Reparametrisierung der Kurve ψ bedeutet, dass sie zusammen mit einer eins-zu-eins Funktion γ:[0,1] → [0,1] genommen wird. Zum Beispiel erfüllt γ(t) = 1 – t dies, was bedeutet, dass das Zeichen in der entgegengesetzten Richtung geschrieben ist. Welche Art einer Reparametrisierung vorgenommen werden muss, wird durch Lösen des Problems einer Minimierung
bestimmt, wobei die Minimierung über alle γ durchgeführt wird, die vorstehend beschrieben worden sind.
Die vorstehend beschriebenen Schritte werden dann wiederholt und neue Werte des Näherungsmaßes werden erhalten. Falls keiner davon unterhalb seiner Akzeptanzgrenze liegt, wird das geschriebene Zeichen zurückgewiesen und der Benutzer wird hierüber informiert, zum Beispiel durch Auffordern von diesem, das Zeichen erneut zu schreiben. Falls man wünscht, die Bestimmung des Näherungsmaßes nach der Reparametrisierung zu beschleunigen, kann eine Gruppe, die aus den kleinsten, zum Beispiel den drei kleinsten, Werten der Näherungsmaße besteht, von der ersten Bestimmung ausgewählt werden und nur in der zweiten Bestimmung mit den Vorlagensymbolen verglichen werden, die in der Gruppe umfasst sind. Allerdings kann dies in bestimmten Fällen ein Endergeb nis, ein anderes als in dem Fall, in dem alle Vorlagensymbole in der zweiten Bestimmung berücksichtigt werden, hervorgerufen.
Das geometrische Näherungsmaß μ führt nicht nur zu einer Bewertungsreihenfolge zwischen unterschiedlichen Interpretationen eines Zeichens, sondern auch dazu, dass es ein Maß darüber angibt, wie ähnlich zwei Zeichen sind. Dies führt zu der Möglichkeit, auch das vorliegende Verfahren für eine Verifizierung und Identifikation, jeweils, von Signaturen (Initialen werden hier als Signaturen wahrgenommen) zu verwenden. Bei dieser Benutzung ist allerdings die Bogenlängen-Parametrisierung kein bevorzugter Typ einer Parametrisierung, da sie Informationen über die Dynamiken, wenn geschrieben wird, ausschließt. Solche Informationen sind bei dieser Benutzung wertvoll. Allerdings sind andere Varianten vorhanden, die geeigneter sind.
Die bevorzugte Ausführungsform ist hier auf der Basis der Tatsache beschrieben worden, dass geeignete Vorlagensymbole vorhanden sind, mit denen das geschriebene Zeichen verglichen werden kann. Weiterhin ist eine Beschreibung für ein Zeichen vorgenommen worden. Normalerweise sind es keine gesonderten Zeichen, sondern ein laufender Text mit vollständigen Worten, die auf der Anzeige geschrieben werden. Von dem Sichtpunkt des Benutzers aus gesehen ist es erwünscht, in der Lage zu sein, einen laufenden Text zu schreiben, der viel von dem Verfahren fordert.
Ein Problem in diesem Zusammenhang ist dasjenige, dass die Einheit von Zeichen eine Vielzahl von Zeichenkombinationen enthalten kann. Es ist nicht möglich, den Benutzer zu fragen, alle möglichen Zeichen oder Worte als Vorlagensymbole zu schreiben.
Gleichzeitig ist es vorteilhaft, wenn eine Begrenzung der Formen des Schreibens vermieden werden kann. Wenn die Benutzer stark eingeschränkt werden, zum Beispiel indem nur zugelassen wird, ein Zeichen zu einem Zeitpunkt zu schreiben, so dass der vorstehend beschriebene Fall immer existiert, ist die Situation relativ klar, allerdings nicht benutzerfreundlich. Gemäß der Erfindung wird dem Benutzer erlaubt, einen laufenden Text zu schreiben. Es ist demzufolge schwierig zu wissen, wo in der Kurve/den Kurven, zum Beispiel, ein Zeichen endet und beginnt. Die Punkte, die den Beginn und das Ende eines Zeichens anzeigen, werden als Unterbrechungspunkte bezeichnet, und das Auffinden möglicher Unterbrechungspunkte trägt zu der Komplexität des Problems einer Erkennung bei. Dieses Problem einer Komplexität wird gemäß einer Ausführungsform des Verfahrens gemäß der Erfindung in der nachfolgenden Art und Weise gelöst. Es sollte er wähnt werden, dass die vorstehenden Schritte in derselben Art und Weise in dieser Ausführungsform ausgeführt werden. Die nachfolgende Beschreibung bezieht sich im Wesentlichen auf den Schritt einer Vorverarbeitung der Einheit von Zeichen und den Schritt eines Vergleichens.
Wenn der Stift nach jedem Zeichen in einem Wort angehoben wird, kann dies als Vorteil herangezogen werden. Jedes Anheben des Stifts gibt Anlass zu einer Diskontinuität und kann durch zwei Punkte, die relativ weit voneinander in Raum und Zeit entfernt sind, erfasst werden. Natürlich wird diese Erfassung vor der Bogenlängen-Parametrisierung ausgeführt. Der Verbund von Zeichen hier besteht aus n Kurven. Die Punkte einer Diskontinuität können als plausible Unterbrechungspunkte herangezogen werden, um zwei Zeichen voneinander zu unterscheiden. Dies fokussiert das Problem auf Zeichen, die mehrere Striche enthalten, die durch Anheben des Stifts dazwischen geschrieben werden. Ein solches Zeichen wird durch mehrere Kurven mittels der Erfassung einer Diskontinuität repräsentiert. Allerdings kann jede Kurve mit einer umskalierten Bogenlänge reparametrisiert werden, was bedeutet, dass jede Kurve dieselbe Anzahl von Abtastpunkten enthält. Es wird angenommen, dass I₁, I₂, ..., I_n die Kurven sind und dass s_k eine Zusammensetzung der Kurven 1 bis k ist. Es werden die Zusammensetzungen der Kurven s₁, s₂, ..., s_k mit der Datenbank von Vorlagensymbolen verglichen, wobei k die größte Anzahl von Kurven, enthalten in irgendeinem Vorlagensymbol, ist. Es wird angenommen, dass s_k1 die längste Zusammensetzung von Kurven ist, die eine Korrespondenz/Korrespondenzen ergibt, d.h. die, wenn mit Vorlagensymbolen verglichen wird, einen Wert oder mehrere Werten von Näherungsmaßen ergibt, die unterhalb der Akzeptanzgrenze/den Akzeptanzgrenzen liegen. Gerade wenn s_k1 einem oder mehreren Versuchsymbol(en) entspricht, ist es nicht sicher, dass dies zu einer korrekten Interpretation führt. Gemäß dieser Ausführungsform des Verfahrens wird deshalb ein Plausibilitätstest durchgeführt, der nachfolgend beschrieben werden wird. Wenn die Interpretation nicht plausibel ist, wird s_k1 auf die längste Zusammensetzung von Kurven s_k2 verkürzt, allerdings eine solche, die eine Korrespondenz ergibt. Der Plausibilitätstest wird noch einmal ausgeführt.
Wenn keine Interpretation für irgendein s_k plausibel ist, wird die beste Interpretation von s₁ ausgewählt. Die verbleibenden Kurven werden entsprechend verarbeitet. Nur die Punkte einer Diskontinuität sind ausreichend als plausible Unterbrechungspunkte, soweit wie ein kohärentes Schreiben betroffen ist, allerdings sind dabei auch Unterbrechungs punkte innerhalb einer Kurve vorhanden. Es sollte angemerkt werden, dass es eine Tatsache ist, dass der vorstehende Vorgang, um Unterbrechungspunkte aufzufinden, mit Reparametrisierungen der Zusammensetzung aller geschriebenen Kurven erreicht wird.
Der Ausdruck „Plausibilitätstest" deckt, inter alia, sogenannte Zuversichtssätze (confidence sets) ab. Der vorstehende Grund der Erkennung von Einheiten von Zeichen, die aus mehreren Zeichen bestehen, und Zeichen, die aus mehreren Kurven, jeweils, bestehen, wird nun beispielhaft anhand der 4 angegeben, wobei die Zuversichtssätze als Plausibilitätstests verwendet werden.
Es wird angenommen, dass das geschriebene Zeichen „äta" (Englisch „eat"), d.h. ein vollständiges Wort, geschrieben entsprechend 4a, ist. Mittels einer Erfassung von Diskontinuitäten und einer Reparametrisierung mit einer umskalierten Bogenlänge, ist „ä" identifiziert worden, und „t" ist daraufhin das nächste. Der horizontale ebenso wie der vertikale Strich können als „1" interpretiert werden, d.h. „t" kann als „11" interpretiert werden. Die Vorlagensymbole werden mit zugeordneten Zuversichtssätzen gemäß 4b gespeichert, wobei die Vorlagensymbole „1" und „t" mit den jeweiligen Zuversichtssätzen als der schattierte Bereich dargestellt sind. Es wird angenommen, dass der vertikale Strich von „t" als das Vorlagensymbol „1" interpretiert wird. Die Transformation a:R² → R² kann dann bestimmt werden – innerhalb der Klasse, die die Form erzeugt –, die das Vorlagensymbol in den vertikalen Strich überführt. Wenn a auf den Zuversichtssatz angewandt wird, wird das Ergebnis der 4c erreicht. Die nächste Kurve, d.h. der horizontale Strich, ist der Zuversichtssatz, der verboten ist, und die Interpretation wird als nicht plausibel klassifiziert. Die Zuversichtssätze müssen nicht nur durch gerade Striche identifiziert werden, wie Fachleute auf dem betreffenden Fachgebiet realisieren werden, sondern können ein allgemeineres Aussehen haben. Mit jedem Vorlagensymbol kann ein anderer Zuversichtssatz verbunden werden, der den ersten Satz enthält. Wenn dann die nächste Kurve auch außerhalb des zweiten Zuversichtssatzes liegt, wird sie so interpretiert werden, als wäre das nächste Zeichen das erste in einem neuen Wort.
Ein alternativer Plausibilitätstest bedeutet, dass die Transformation, die in der Beschreibung von Zuversichtssätzen bestimmt wurde, studiert ist. Wenn die Transformation über einen bestimmten Umfang hinausgeht, wird die Interpretation als nicht plausibel klassifiziert werden. Ein solcher Umfang kann, zum Beispiel, eine Bestimmung sein, welcher Umfang der Transformation zugelassen ist, um das Zeichen zu drehen, in Bezug auf das, wie stark früher interpretierte Zeichen gedreht worden sind. Auch können übermäßige Deformationen vorhanden sein. Um, zum Beispiel, „@“ von „s“ zu unterscheiden, kann die Vergrößerung der Transformation in Bezug auf die Vergrößerung von Symbolen, die zuvor interpretiert worden sind, berechnet werden.
Die vorstehend beschriebenen Ausführungsformen des Verfahrens gemäß der Erfindung sollten nur als nicht einschränkende Beispiele angesehen werden, und viele Modifikationen, die außerhalb der vorstehenden liegen, sind innerhalb des Schutzumfangs der Erfindung, wie er in den beigefügten Ansprüchen definiert ist, möglich. Beispiele von weiteren solchen Modifikationen folgen nachfolgend.
Als eine Alternative zu der vorstehend beschriebenen Reparametrisierung wird die Entscheidung direkt auf der Basis des ersten, bestimmten, kleinsten Werts eines Näherungsmaßes herangezogen.
Beispiele von anderen Modifikationen sind die Auswahl eines anderen Näherungsmaßes, verschiedene Auswahlen von Werten von Akzeptanzgrenzen, die eine bestimmte Adaption an verschiedene Benutzer erfordern, unterschiedliche Typen einer Reparametrisierung und unterschiedliche Typen einer Form, zum Beispiel einer affinen Form.
Soweit verschiedene Typen einer Form betroffen sind, werden zwei oder mehr Formen, als eine Alternative, parallel für jede Einheit von Zeichen verwendet. Dies bedeutet, dass mehrere Invarianten für jede Einheit von Zeichen vorgesehen werden und dann parallel in den folgenden Schritten verarbeitet werden. Dies führt zu einem höheren Grad einer Genauigkeit und einer schnelleren Erkennung.
In der Praxis kann das Verfahren gemäß der Erfindung, zum Beispiel, in elektronischen Notebooks, und dergleichen, und in Mobiltelefonen mit einer erhöhten Möglichkeit einer Kommunikation durch ein beschreibbares Fenster verwendet werden.
Das Verfahren gemäß der Erfindung kann als ein Computerprogramm in einem Computer unter Verwendung einer kommerziell verfügbaren Programmiersprache für mathematische Berechnungen, wie beispielsweise C, C++ oder FORTRAN, oder als eine speziell eingebaute Vorrichtung, gemäß der Erfindung, was nachfolgend beschrieben werden wird, ausgeführt werden. In beiden Fällen werden die Vorlagensymbole als eine Datenbank gespeichert. Falls erforderlich, kann die Datenbank geändert werden.
Wie in 5 dargestellt ist, weist eine Ausführungsform einer Vorrichtung, die das Verfahren realisiert, eine druckempfindliche Anzeige 42, eine Anzeige- Kommunikationseinheit 44 mit einem Detektor 46, eine Steuereinheit 48, eine Speichersteuereinheit 50, eine Speichereinheit 52 und eine Verarbeitungseinheit 54 auf. Die Anzeige-Kommunikationseinheit 44, die Steuereinheit 48, die Speichersteuereinheit 50 und die Verarbeitungseinheit 54 kommunizieren über einen Bus 56, der Daten, Adressen- und Steuersignale zwischen den Einheiten überträgt. Einheiten von Zeichen werden auf der Anzeige 42 geschrieben und durch den Detektor 46 erfasst, der die geordnete Folge von Punkten bereitstellt. In der Speichereinheit 52 werden die Vorlagensymbole und die erfassten Einheiten von Zeichen gespeichert. Mittels der Verarbeitungseinheit werden Berechnungsvorgänge ausgeführt, die die Interpretation der Sequenzen von Punkten als eine oder mehrere Kurve(n), die Parametrisierung jeder Kurve, den Vergleich der verarbeiteten Einheit von Zeichen mit Vorlagensymbolen und die Anwendung der Entscheidungsregel aufweist. In der Speichereinheit 50 ist auch eine Software zum Durchführen des Verfahrens gespeichert. Die Steuereinheit 48 lässt das Programm laufen und kommuniziert mit dem Benutzer über die Anzeige-Kommunikationseinheit 44 und die Anzeige 42.
Die Vorrichtung ist auch für optionale Einstellungen angepasst, die, inter alia, die Auswahl von Formen, die Auswahl des Näherungsmaßes, die Auswahl von Parametrisierungen und die Auswahl einer Entscheidungsregel aufweisen können. Die Auswahlen werden über die Anzeige 42 vorgenommen.
Vorstehend ist die Beschreibung im Wesentlichen auf der Basis der Zeichen, die auf einer Anzeige geschrieben werden und die gleichzeitig erfasst werden, wenn sie geschrieben werden, vorgenommen worden. Eine Alternative ist diejenige, dass die Zeichen erfasst werden, zum Beispiel abgetastet werden, wenn sie bereits auf einem Stück Papier geschrieben sind. Dies bezieht sich auf handgeschriebene Zeichen ebenso wie auf maschinengeschriebenen Zeichen. Demzufolge weist die Erfassung anstelle des Vorgangs eines Erkennens der Anzeige-Schrift den Vorgang eines Lesens (Abtastens) der Zeichen auf dem Stück Papier auf. In vorteilhafter Weise werden gelesene Daten in die geordnete Sequenz von Punkten durch eine Kantenerfassung transformiert. Allerdings ist dies auch eine Modifikation innerhalb des Schutzumfangs dieser Erfindung. In dieser Ausführungsform weist die Vorverarbeitung ein Bilden von einer oder mehreren Zeichenkurve(n), zum Beispiel die Kantenkurve oder die Kantenkurven des Zeichens, auf der Basis der Kantenerfassung und der Parametrisierung auf. Wenn die Kantenkurven so definiert worden sind, sind die nachfolgenden Schritte dieselben wie in der vorstehend beschriebenen, bevorzugten Ausführungsform.
Die Entscheidungsregel kann auf viele unterschiedliche Arten und Weisen ausgewählt werden. Eine Variante des Vorstehenden ist diejenige, dass alle Vorlagensymbole, für die der Wert des Näherungsmaßes unterhalb der Akzeptanzgrenze liegt, ausgewählt werden. Darauf folgend können die Vorlagensymbole weiter entsprechend irgendeiner verfeinerten Bestimmung des vorstehend beschriebenen Typs verarbeitet werden. Es ist auch möglich, eine Kombination mit einem anderen Auswahlverfahren vorzunehmen, das sich als die plausibelste Alternative herausstellt. Ein Beispiel eines solchen Verfahrens sind Statistiken von Zeichen, die die Wahrscheinlichkeit des Vorhandenseins von separaten Zeichen oder Zusammenstellungen von Zeichen in Texten anzeigen.
Weiterhin ist eine Alternative zum Bestimmen der Akzeptanzgrenzen diejenige, dass die Vorlagensymbole gruppiert werden, wobei in einem solchen Fall dieselbe Grenze innerhalb einer Gruppe gilt.
Das Verfahren gemäß der Erfindung ist dahingehend zuverlässig, dass es in der Lage ist, ziemlich deformierte Zeichen zu erkennen und einen laufenden Text zu handhaben. Die Inhalte der Datenbank sind nicht kritisch, sondern im Prinzip ist ein Satz von separaten Zeichen ausreichend. Um eine Vielfalt von Schriftarten und Handschriften mit einem hohen Grad einer Genauigkeit zu erkennen, kann es allerdings ein Vorteil sein, verschiedene Varianten jedes Zeichens zu speichern, die Deformationen aufweisen, die außerhalb der Klasse von Transformationen liegen, die in dem Vergleich geeignet und zulässig sind. Es kann auch vorteilhaft sein, bestimmte Zusammensetzungen von Zeichen zu speichern, zum Beispiel indem man in der Lage ist, sicherer zwei 1'en „11", die miteinander verbunden sind, von einem „u" zu unterscheiden.

Claims

Verfahren zur Zeichenerkennung, das die folgenden Schritte umfasst: Erfassen eines separaten Zeichens oder eines Zeichens in einer Zusammenstellung von Zeichen, Vorverarbeiten des Zeichens, Vergleichen des vorverarbeiteten Zeichens mit einem oder mehreren Vorlagensymbolen, und Anwenden einer Entscheidungsregel, um ein Vorlagensymbol entweder zu verwerfen oder zu entscheiden, dass das Vorlagensymbol in dem Zeichen enthalten ist, wobei der Schritt des Vorverarbeitens des Zeichens die folgenden Schritte umfasst: Darstellen des Zeichens als eine oder mehrere Kurven, wobei die Darstellung so geformt ist, dass sie quantitativen Vergleich ermöglicht, und Parameterisieren der Kurve oder Kurven, dadurch gekennzeichnet, dass der Schritt des Vorverarbeitens des Zeichens des Weiteren den Schritt des Ausbildens einer oder mehrerer Formen für die Kurve oder Kurven unter Berücksichtigung verschiedener Klassen von Transformationen umfasst, wobei die eine oder mehrere Formen für die Kurve oder Kurven definiert sind als d(Φ) = {ψ|ψ = g(Φ), g∈ G}wobei Φ die parameterisierte Kurve ist, d(Φ) die Form für die Kurve ist und G die Klasse von Transformationen ist, wobei die Form in Bezug auf die Klasse von Transformationen invariant ist, und dadurch, dass der Schritt des Vergleichens die folgenden Schritte umfasst: Ausbilden eines oder mehrerer geometrischer Näherungsmaße, für jede Form Bestimmen der Werte der geometrischen Näherungsmaße zwischen der Form und entsprechend bestimmten Formen für die Vorlagensymbole, und dass der Schritt des Anwendens einer Entscheidungsregel den folgenden Schritt umfasst: Auswählen eines oder mehrerer Vorlagensymbole unter Berücksichtung der Werte.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Erfassens eines separaten Zeichens oder eines Zeichens in einer Zusammenstellung von Zeichen den Schritt des Darstellens des Zeichens als einen Satz von Punkten umfasst, und dass der Schritt des Darstellens des Zeichens als eine oder mehrere Kurven die folgenden Schritte umfasst: Erzeugen einer geordneten Sequenz von Punkten aus dem Satz von Punkten, und Interpolieren zwischen den Punkten, um die eine oder mehrere Kurven zu erzeugen.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Schritt des Parameterisierens die folgenden Schritte umfasst: Einrichten einer Funktion, die der Kurve folgt, gemäß einer geeigneten Parameterisierungsregel, und Abtasten der Funktion an einer Vielzahl gleichmäßig beabstandeter Punkte.
Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Parameterisierungsregel eine Bogenlänge ist.
Verfahren nach einem der vorangehenden Ansprüche, wobei das separate Zeichen oder das Zeichen in einer Zusammenstellung von Zeichen auf einer Anzeigeeinrichtung erfasst wird, auf der es direkt geschrieben wird, dadurch gekennzeichnet, dass der Schritt des Erfassens während des Schreibens ausgeführt wird.
Verfahren nach einem der Ansprüche 1–4, dadurch gekennzeichnet, dass das separate Zeichen oder das Zeichen in einer Zusammenstellung von Zeichen in einer Datenmenge erfasst wird, die von einem Scanner stammt.
Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass der Schritt des Vorverarbeitens des Zeichens Kantenerfassung des Zeichens umfasst.
Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass der Schritt des Anwendens einer Entscheidungsregel Bestimmen von Akzeptanzgrenzen der Werte der Näherungsmaße und Auswählen eines Vorlagensymbols nur dann umfasst, wenn wenigstens ein Wert bezüglich des Vorlagensymbols innerhalb der Akzeptanzgrenzen liegt.
Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass jedem Vorlagensymbol individuelle Akzeptanzgrenzen zugewiesen werden.
Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass wenigstens zwei Vorlagensymbole die gleichen Akzeptanzgrenzen haben.
Verfahren nach einem der Ansprüche 8–10, gekennzeichnet durch den Schritt des Reparameterisierens einer parameterisierten Kurve, wenn alle Werte der Näherungsmaße zwischen der Form der parameterisierten Kurve und den Vorlagensymbolen jenseits der Akzeptanzgrenzen liegen, so dass ein oder mehrere Werte des entsprechenden Näherungsmaßes zwischen den Vorlagensymbolen und der Form der reparameterisierten Kurve abnehmen.
Verfahren nach einem der Ansprüche 8–11, dadurch gekennzeichnet, dass die Akzeptanzgrenzen auf Basis der Tatsache bestimmt werden, dass nur Ähnlichkeitstransformationen zugelassen werden.
Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass der Schritt des Anwendens einer Entscheidungsregel das Ausführen einer Plausibilitätsprüfung umfasst, indem eine Transformation zum Transformieren der ausgewählten Vorlagensymbole zu dem Zeichen bestimmt wird und die Transformation analysiert wird.
Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass das Analysieren in der Plausibilitätsprüfung auf den Konfidenzmengen basiert.
Verfahren nach einem der vorangehenden Ansprüche, wobei die vorgegebene Form gegeben ist durch: s(Φ) = linhull ({(Φ1,Φ2),(–Φ2,Φ1),(1,0),(0,1)})wobei Φ die parameterisierte Kurve oder Kurven ist/sind, und Φ in zwei Teile Φ₁ und Φ₂ parameterisiert wird, die zwei Koordinaten von Punkten auf der Kurve oder den Kurven darstellen.
Verfahren nach einem der vorangehenden Ansprüche, wobei die vorgegebene Form gegeben ist durch: s(Φ) = linhull (Φ1,Φ2,1)wobei Φ die parameterisierte Kurve oder Kurven ist/sind und Φ in zwei Teile Φ₁ und Φ₂ parameterisiert wird, die zwei Koordinaten von Punkten auf der Kurve oder den Kurven darstellen.
Verfahren nach einem der vorangehenden Ansprüche, wobei der Schritt des Ausbildens eines oder mehrerer geometrischer Näherungsmaße Auswählen eines Skalarproduktes umfasst, das Ableitungen der Kurve oder Kurven umfasst.
Verfahren nach einem der vorangehenden Ansprüche, wobei der Schritt des Ausbildens eines oder mehrerer geometrischer Näherungsmaße Auswählen eines Skalarproduktes umfasst, das verschiedenen Teilen der Kurve oder Kurven verschiedene Gewichte verleiht.
Einsatz des Verfahrens nach einem der vorangehenden Ansprüche zum Prüfen oder Identifizieren von Unterschriften.