DE69932167T2 - Zeichenerkennung - Google Patents

Zeichenerkennung Download PDF

Info

Publication number
DE69932167T2
DE69932167T2 DE69932167T DE69932167T DE69932167T2 DE 69932167 T2 DE69932167 T2 DE 69932167T2 DE 69932167 T DE69932167 T DE 69932167T DE 69932167 T DE69932167 T DE 69932167T DE 69932167 T2 DE69932167 T2 DE 69932167T2
Authority
DE
Germany
Prior art keywords
character
curve
template
curves
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69932167T
Other languages
English (en)
Other versions
DE69932167D1 (de
Inventor
Gunnar Sparr
Rikard Berthilsson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zi Decuma AB
Original Assignee
Zi Decuma AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zi Decuma AB filed Critical Zi Decuma AB
Application granted granted Critical
Publication of DE69932167D1 publication Critical patent/DE69932167D1/de
Publication of DE69932167T2 publication Critical patent/DE69932167T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Holo Graphy (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

  • Technisches Sachgebiet
  • Die vorliegende Erfindung bezieht sich auf ein Verfahren zur Zeichenerkennung gemäß dem Oberbegriff des Anspruchs 1. „Zeichen" ist in diesem Zusammenhang eine neutrale, entsprechende Zahl, d.h. getrennte Zeichen, wie beispielsweise Buchstaben und Ziffern, ebenso wie Zusammensetzungen von mehreren Zeichen, wie beispielsweise Worte, auf die hier Bezug genommen wird. Sowohl allgemein verwendete Zeichen als auch imaginäre Zeichen sind natürlich eingeschlossen.
  • Hintergrund
  • Es existiert eine Vielzahl von bekannten Verfahren für eine Zeichenerkennung, insbesondere zum Erkennen von handgeschriebenen Zeichen, die eine besonders gute Interpretation des Zeichens erfordern. Mehrere der bekannten Verfahren basieren auf der Erfassung jedes Strichs des Stifts, wenn ein handgeschriebenes Zeichen gebildet werden soll. Geometrische Charakteristika, wie beispielsweise Richtungen, Neigungen und Winkel jedes Strichs oder eines Teils eines Strichs, werden bestimmt und mit entsprechenden Daten von gespeicherten, bekannten Zeichen verglichen. Es wird angenommen, dass das geschriebene Zeichen das gespeicherte Zeichen ist, dessen geometrische Charakteristika am besten den geometrischen Charakteristika des geschriebenen Zeichens entsprechen. Die geometrischen Charakteristika sind zu einem xy-Koordinatensystem in Bezug gesetzt, das die benutzte Schreibfläche abdeckt. Solche bekannten Verfahren sind in, zum Beispiel, der US-5,481,625 und der US-5,710,916 offenbart. Ein Problem in solchen Verfahren ist dasjenige, dass sie für eine Rotation empfindlich sind. Zum Beispiel besitzt, wenn man diagonal über die Schreibfläche schreibt, das Verfahren Schwierigkeiten beim korrekten Bestimmen, welche Zeichen geschrieben werden.
  • Die US-5,537,489 offenbart ein Verfahren zum Vorverarbeiten der Zeichen, indem sie normiert werden. Das geschriebene Zeichen wird abgetastet und jede Abtastung wird als ein Paar Koordinaten dargestellt. Anstelle nur eines Vergleichens der Zeichen in der Koordinatenebene wird die Transformation bestimmt, die am besten das geschriebene Zeichen auf ein Modell-Zeichen einstellt. Indirekt werden so auch eine Rotation und bestimmte Typen von Deformationen, die die vorstehend erwähnten Verfahren nicht handhaben können, entsprechend berücksichtigt. Die Transformation wird dazu verwendet, das geschriebene Zeichen zu normieren. Insbesondere wird das Zeichen dadurch normiert, dass es so translatiert wird, dass sein zentraler Punkt in dem Ursprung der Koordinaten liegt, wo auch der zentrale Punkt des Modell-Zeichens vorgefunden wird, wonach das Zeichen in einer solchen Art und Weise skaliert und gedreht bzw. rotiert wird, dass es dem Modell-Zeichen in der bestmöglichen Art und Weise entspricht.
  • Ein Nachteil dieses Verfahrens ist derjenige, dass die Normierung Berechnungsleistung erfordert und dass in jedem Fall die Auswahl von Modell-Zeichen durch Bestimmen stattfinden muss, welches Modell-Zeichen dem geschriebenen Zeichen am meisten ähnelt.
  • Die US-5,559,897 offenbart ein anderes Verfahren zum Vorverarbeiten eines empfangenen Datensatzes, der für eine handgeschriebene Probe repräsentativ ist. Die Vorverarbeitungstechniken umfassen ein Filtern und Normieren des empfangenen Datensatzes. Wenn gefiltert wird, umfassen die Techniken ein Identifizieren von handschriftlichen Spitzen bzw. Scheitelpunkten innerhalb des Datensatzes und ein Herausfiltern des übermäßigen Rauschens von dem Datensatz. Ein Normieren kann ein Skalieren auf eine Standardgröße, eine Rotation der Textgrundlinie, ein Geradestellen von schräg verlaufenden, handgeschriebenen Proben, usw., einsetzen.
  • Ein anderes Verfahren, das sicher Drehungen handhaben kann, ist in der US-5,768,420 offenbart. In diesem bekannten Verfahren wird eine Kurvenerkennung mittels eines Verhältnisses, das als „Verhältnis von Tangenten" bezeichnet ist, beschrieben. Eine Kurve, zum Beispiel ein Teil eines Zeichens, wird durch Auswählen einer Folge von Paaren von Punkten entlang der Kurve aufgelistet, wobei die Tangenten in den zwei Punkten jedes Paars unter einem bestimmten Winkel schneiden. Das Verhältnis zwischen den Abständen von dem Schnittpunkt zu den jeweiligen Punkten des Paars wird berechnet und bildet eine Identifikation der Kurve. Dieses Verfahren ist im Prinzip nicht empfindlich für eine Translation, Skalierung und Drehung. Allerdings ist es in vieler Hinsicht beschränkt. In allererster Linie lässt es nicht bestimmte Kurvenformen zu, in denen nicht zwei Punkte, deren Tangenten unter dem vorbestimmten Winkeln schneiden, vorhanden sind. Es ist üblich, dass zumindest Bereiche eines Zeichens solche unbestimmbaren Kurvenformen für einen ausgewählten Schnittwinkel aufweisen. Dies verringert die Zuverlässigkeit des Verfahrens.
  • Die EP 0 782 090 offenbart ein Verfahren zum Codieren der handgeschriebenen Signatur einer Person. Die codierte, handgeschriebene Signatur soll bei einer Verifizierung einer Versuchssignatur verwendet werden. Das Verfahren weist ein digitales Abtasten der Bahn eines Stifts, um eine digitalisierte Signatur-Aufzeichnung bereitzustellen, ein Unterteilen der Signatur in einer zeitlich geordneten Folge von orientierten Verbindungen, ein Zuordnen zu jeder Verbindung eines quantisierten Strich-Richtungs-Werts entsprechend zu der jeweiligen Orientierung dieser Verbindung, um dadurch für die Signatur als ein Ganzes eine geordnete Folge von Strich-Richtungs-Werten zu erhalten, und Speichern der geordneten Folge der Strich-Richtungs-Werte in einem digitalen Speicher auf.
  • Zusammenfassung der Erfindung
  • Eine Aufgabe der Erfindung ist es, ein Verfahren für eine Zeichenerkennung zu schaffen, das nicht die vorstehend angegebenen Nachteile besitzt, und das in einem größeren Umfang individuelle Arten von handgeschriebenen Zeichen und ungewöhnlichen Schriftarten von mit Maschinenschrift-Zeichen akzeptiert und einfach mit einer begrenzten Rechenleistung auszuführen ist.
  • Die Aufgabe wird durch ein Verfahren gemäß der Erfindung, wie es in Anspruch 1 definiert ist, gelöst.
  • Gemäß der Erfindung bedeutet der Ausdruck „Vorlagensymbol", wie er in dem Anspruch definiert ist, irgend etwas von einem Teil eines getrennten Zeichens, wobei der Bereich, zum Beispiel, ein Bogen oder ein Teilstrich ist und das Zeichen ein Buchstaben oder eine Zahl ist, bis zu Verbundworten oder anderen, komplexen Zeichen. In einer ähnlichen Art und Weise bedeutet der Ausdruck „Verbund von Zeichen" irgend etwas von einem separaten Zeichen bis zu Zusammensetzungen von mehreren Zeichen. Die Reichweite der erwähnten Ausdrücke wird aus der nachfolgenden Beschreibung von Ausführungsformen ersichtlich werden.
  • Kurze Beschreibung der Zeichnungen
  • Die Erfindung und weitere Vorteile davon werden in weiterem Detail nachfolgend anhand von Ausführungsformen, unter Bezugnahme auf die beigefügten Zeichnungen, beschrieben, in denen:
  • 1 stellt ein Beispiel eines Verbunds von Zeichen dar, der ein handgeschriebenes Zeichen aufweist, und das einige Schritte in einer bevorzugten Ausführungsform des Verfahrens gemäß der Erfindung darstellt,
  • 2 und 3 stellen Beispiele von verschiedenen Transformationen eines Verbunds von Zeichen dar, der ein handgeschriebenes Zeichen aufweist,
  • 4 stellt ein Beispiel einer Erkennung eines Verbunds von Zeichen dar, der mehrere Zeichen aufweist, und
  • 5 stellt eine Ausführungsform einer Vorrichtung zum Ausführen des Verfahrens dar.
  • Beschreibung von Ausführungsformen
  • Gemäß der Erfindung weist das Verfahren für eine Zeichenerkennung eine Anzahl von Hauptschritten auf:
    • a) ein Verbund von Zeichen wird erfasst,
    • b) der Verbund von Zeichen wird vorverarbeitet,
    • c) der vorverarbeitete Verbund von Zeichen wird mit einem oder mehreren Vorlagensymbol(en) verglichen, und
    • d) eine Entscheidungsregel wird angewandt, um zu bestimmen, ob irgendeines der Vorlagensymbole in dem Verbund von Zeichen umfasst ist oder nicht.
  • Gemäß einer bevorzugten Ausführungsform werden die verschiedenen Hauptschritte entsprechend der folgenden Beschreibung ausgeführt. Die Ausführungsform ist bevorzugt zur Erkennung von Verbunden von Zeichen vorgesehen, die auf einer druckempfindlichen Anzeige geschrieben sind, die auf dem Markt erhältlich ist. Es sollte angemerkt werden, dass die Erfindung nützlich für die Erkennung von maschinengeschriebenen ebenso wie für handgeschriebene Verbunde von Zeichen ist, die von einer Hardcopy stammen, die, zum Beispiel, in einen Computer eingescannt ist. Eine Ausführungsform, die insbesondere an die Erkennung von Maschinenschriften, eingescannten Verbunden von Zeichen, angepasst ist, wird nachfolgend beschrieben. In der nachfolgenden Beschreibung der Schritte dieser Ausführungsform wird zum Zwecke der Vereinfachung angenommen, dass der Verbund von Zeichen ein Zeichen aufweist.
  • In einem Schritt a) werden Punkte auf den Zeichen unter regelmäßigen Zeitintervallen gleichzeitig dann erfasst, wenn das Zeichen auf einer druckempfindlichen Anzeige geschrieben wird. Demzufolge wird eine geordnete Folge von Punkten erhalten. In einem Schritt b) werden die nachfolgenden Vorgänge ausgeführt. Durch Interpolation zwischen den Punkten wird eine Kurvendarstellung des Zeichens erzeugt. Die Kurvendarstellung weist eine oder mehrere Kurve(n) auf, die durch die Folge von Punkten hindurchführen. Irgendein Anheben des Stifts wird erfasst, um zu verhindern, dass sich die Interpolation über Räume zwischen Punkten hinaus erstreckt, wo der Stift angehoben worden ist. Die Interpolation führt zu Zeichen, wie beispielsweise „t", „a" und „s", die dahingehend angesehen werden, dass sie aus einer oder mehreren Kurve(n) bestehen. Jede Kurve oder jede Zusammensetzung von Kurven wird holistisch als eine unteilbare, geometrische Einheit angesehen. Dies bedeutet, zum Beispiel, dass das Verfahren gemäß der vorliegenden Erfindung auf viele Arten und Weisen in Bezug auf vollständige Zeichen arbeitet (globale Zeicheninterpretation). Jeder Punkt ist als zwei Koordinaten dargestellt, die die Position des Punkts in der begrenzten Ebene, die die Anzeige bildet, anzeigen. Eine der Koordinaten, die nachfolgend als x1 bezeichnet wird, zeigt die Position seitlich an, und die zweite Position, die als x2 nachfolgend bezeichnet wird, zeigt die Position in der vertikalen Richtung an. Die Kurve wird passend als ϕ(t) = (ϕ1(t), ϕ2(t)), a ≤ t ≤ b parametrisiert, wobei, für den Zweck einer Vereinfachung, a = 0 und b = 1 gilt, und wird in einer Anzahl n von Punkten t1 < t2 ... < tn, entsprechend irgendeiner geeigneten Parametrisierungsregel, abgetastet. Um zu beginnen, ist eine Bogenlänge die Regel, entsprechend zu der die Parametrisierung vorzugsweise ausgeführt wird, was bedeutet, dass die Punkte äquidistant angeordnet werden. Es sollte angemerkt werden, dass, aufgrund der unregelmäßigen Geschwindigkeit einer Bewegung des Schreibers, dies nicht der Fall mit den anfänglichen Koordinaten-Proben ist. Die Verwendung der Bogenlänge kann als eine Standardisierung der Parametrisierung angesehen werden, die den folgenden Vergleich mit Vorlagensymbolen erleichtert, die in einer entsprechenden Art und Weise parametrisiert und abgetastet werden. Für einige Klassen von Transformationen kann es notwendig sein, zu Reparametrisieren, was auch nachfolgend beschrieben werden wird.
  • Um das Zeichen mit Vorlagensymbolen zu vergleichen, ist es notwendig, eine Darstellung zu formen, die quantitative Vergleiche zulässt. Einige Abweichungen von einem Vorlagensymbol, definiert im voraus, müssen zugelassen werden, d.h. zum Beispiel muss ein „a" als ein „a" auch dann in Bezug auf seine Form interpretiert werden, wenn es sich in einem bestimmten Umfang von dem Vorlagensymbol unterscheidet. Gemäß der Erfindung wird eine Definition angewandt, die auf unterschiedlichen Transformationen basiert. In Abhängigkeit von Anforderungen in Bezug auf Flexibilität und Exaktheit, können verschiedene Klassen von Transformationen zugelassen werden, wobei die Klassen einen Typ oder mehrere Typen einer Transformation, wie beispielsweise Translation, Rotation, Skalierung, Scherung und Reflexion, aufweisen. Dies ist in 2 und 3 dargestellt. 2 stellt ein handgeschriebenes „a" in einem Kasten 2a dar. Die anderen drei Zeichen sind verschiedenen, affinen Transformationen unterworfen worden. Die Klasse von Transformationen, die aus affinen Transformationen zusammengesetzt sind, lassen eine Rotation, eine Scherung, eine Reflexion, eine Skalierung und eine Translation zu. Die Zeichen in den Kästen 2b und 2c sind einer Translation, einer Rotation, einer Skalierung und einer Scherung in Bezug auf das Zeichen in dem Kasten 2a unterworfen worden. Das Zeichen in dem Kasten 2d ist einer Translation, einer Reflexion, einer Rotation und einer Skalierung unterworfen worden.
  • 3 stellt positive Ähnlichkeits-Transformationen dar, die nur ein Skalieren, eine Rotation und eine Translation aufweisen. Gemäß dieser Ausführungsform des Verfahrens gemäß der Erfindung sind zulässige Abweichungen auf positive Ähnlichkeits-Transformationen beschränkt. Dies bedeutet, dass ein handgeschriebenes Zeichen oder ein Teil eines Zeichens, das eine geeignete Kombination einer Skalierung, einer Rotation und einer Translation ist, das in Übereinstimmung mit einem Vorlagensymbol gebracht werden kann, als dasselbe Zeichen oder ein Teil des Zeichens interpretiert wird, das durch das Vorlagensymbol dargestellt ist. Die Übereinstimmung muss nicht vollständig sein, was nachfolgend beschrieben werden wird.
  • Die Darstellung, die, gemäß dieser Erfindung, zu bevorzugen ist, wird durch Bilden einer Invarianten der parametrisierten Kurve erzielt. Nützliche Invarianten sollten gemäß der Erfindung eine Interpretation zulassen, die nahe zu der Interpretation einer Person ist, die ein bestimmtes Zeichen erstellt. Dies bedeutet, dass Zeichen, in Bezug auf die eine Person in der Lage ist, sie mit einer großen Genauigkeit korrekt zu interpretieren, d.h. sie als die Zeichen zu interpretieren, die der Schreiber sagen würde, dass er sie geschrieben hat, korrekt und mit einer großen Genauigkeit durch das Verfahren gemäß der Erfindung interpretiert werden sollten. Es ist demzufolge wichtig, dass eine konstruierte Invariante in einer gut ausbalancierten Art und Weise selektiv ist. Gemäß der Erfindung werden deshalb Invarianten auf der Basis der folgenden Definition aufgebaut. Falls ϕ eine parametrisierte Kurve gemäß dem Vorstehenden ist und G eine Gruppe von Transformationen von Kurven ist, dann werden der Satz d(ϕ) = {ψ |ψ = g(ϕ), g ∈ G} und äquivalente Umschreibungen davon als die Form von ϕ bezeichnet. Es wird für Fachleute auf dem betreffenden Fachgebiet ersichtlich werden, dass die Definition viele mögliche Invarianten ermöglicht, die, allerdings, alle gemeinsam haben, dass sie die Kurve als die vorstehend erwähnte, untrennbare Einheit handhaben.
  • Gemäß der bevorzugten Ausführungsform der Erfindung ist die Form entsprechend zu der Gruppe von positiven Ähnlichkeits-Transformationen durch s(ϕ) = linhull({(ϕ1, ϕ2), (–ϕ2, ϕ1), (1,0), (0,1)}), d.h. einen linearen Raum, aufgebaut aus der parametrisierten Kurve ϕ, gegeben. Wie durch Fachleute auf dem betreffenden Fachgebiet ersichtlich werden wird, ist s(ϕ) vorzugsweise eine äquivalente Paraphrase von d(ϕ). In der Praxis vermittelt die Verwendung dieser Form, dass alle parametrisierten Kurven, die ineinander durch positive Ähnlichkeits-Transformationen transformiert werden können, denselben linearen Raum als eine Form haben.
  • Im Gegensatz dazu sind, gemäß einer anderen Ausführungsform der Erfindung, affine Transformationen zulässig. Dann ist die Form, nach einem Umschreiben, gegeben durch s(ϕ) = linhull(ϕ1, ϕ2, 1), was in weiterem Detail, zum Beispiel, in „Extension of affine shape", Technical report, Dept. of Mathematics, Lund Institute of Technology 1997, von R. Berthilsson, beschrieben ist.
  • In einem Schritt c) wird die Form des geschriebenen Zeichens mit entsprechend geformten Formen für eine Anzahl von Vorlagensymbolen verglichen. In dieser Ausführungsform der Erfindung werden diese Vorlagensymbole durch Einführen bereitgestellt, indem man einen Benutzer mit der Hand auf einer Anzeige alle Zeichen, die er benötigen könnte, gleichzeitig schreiben lässt, die entsprechend den vorstehend beschriebenen Schritten a) und b) verarbeitet werden und als Vorlagensymbole gespeichert werden. Wie vorstehend erwähnt ist, weist jedes Vorlagensymbol eine oder mehrere Kurve(n) auf, die einen Teil eines Zeichens oder das vollständige Zeichen darstellen, was in der Praxis bedeutet, dass mehrere Vorlagensymbole erforderlich sein können, um ein Zeichen aufzu bauen. Allerdings kann, wie weiter nachfolgend angegeben werden wird, ein Vorlagensymbol, im Gegensatz dazu, auch eine Folge von verschiedenen Zeichen darstellen.
  • Gemäß der Erfindung ist eine Art und Weise, die Formen zu vergleichen, die Verwendung eines geometrischen Maßes einer Nähe. Für die vorstehenden, geformten Formen gemäß der bevorzugten Ausführungsform und der alternativen Ausführungsform kann, jeweils, ein geometrisches Näherungsmaß μ für Formen, die lineare Unterräume innerhalb des Raums möglicher, parametrisierter Kurven S aufweisen, verwendet werden. Ein Beispiel eines solchen geometrischen Näherungsmaßes ist: μ = |(I – Ps(ϕ)Ps(ψ)|HS wobei HS die Hilbert-Schmidt-Norm darstellt und I die Identität ist.
  • In der Definition stellen s(ϕ) und s(ψ) solche linearen Unterräume dar. Ps(ϕ) und Ps(ψ) stellen weiterhin orthogonale Projektionen auf s(ϕ) und s(ψ), jeweils, dar. HS stellt die Hilbert-Schmidt-Norm dar und I ist die identität. Die Berechnung des geometrischen Näherungsmaßes μ umfasst ein Auswählen eines skalaren Produkts.
  • Ein allgemeines Beispiel eines skalaren Produkts von zwei Funktionen ϕ(t) und ψ(t) mit Werten in IRn ist:
    Figure 00080001
    wobei dmk positive Radon-Maße sind und · das Skalarprodukt auf IRn darstellt.
  • Da jede abgetastete Kurve eine Vielzahl von Punkten aufweist, jeder mit zwei Koordinaten, ist es passend, eine Matrix-Schreibweise für eine vergleichende Verarbeitung der Formen zu verwenden. Die Schritte eines Beschreibens der Kurven in einer Matrix-Schreibweise und ein Aufbauen eines geometrischen Näherungsmaßes können mathematisch wie folgt beschrieben und ausgeführt werden:
    Es wird die Kurve des erfassten Zeichens als ψ(t) = ψ1(t), ψ2(t)), 0 ≤ t ≤ 1, bezeichnet und die Kurve eines Vorlagensymbols wird mit ϕ(t) = (ϕ1(t), = ϕ2(t)), 0 ≤ t ≤ 1, bezeichnet. Durch Abtasten der Kurve an den Zeitpunkten 0 = t1 < t2 ... < tn = 1 können die folgenden Matrizen gebildet werden:
    Figure 00090001
  • Die Matrizen werden mit QR in einer für Fachleute bekannten Art und Weise faktorisiert, wie beispielsweise so, dass M1 = Q1R1 und M2 = Q2R2 gelten, wobei Q1 und Q2 orthogonale Matrizen sind und R1 und R2 ein oberes Dreieck sind. Die Matrizen Q1 und Q2 stellen die Formen des erfassten Zeichens und des Vorlagensymbols, jeweils, dar, was die Parametrisierungen und die Abtastung ergibt.
  • Ein geometrisches Näherungsmaß μ kann wie folgt konstruiert werden: μ(Q1Q2) = ∥⁣Q2 – Q1QT1 Q2∥⁣2F wobei die Norm ∥⁣·∥⁣F die Frobenius-Norm bezeichnet. Wenn I = 0 und dm0 das gewöhnliche Lebesgue-Maß an dem Intervall [0, 1] in dem vorstehenden, allgemeinen Beispiel eines skalaren Produkts ist, wird exakt dieses geometrische Näherungsmaß erhalten. Die Wahl des Skalarprodukts beeinflusst die Funktionsweise des Verfahrens.
  • Nach der Bestimmung der Werte des Näherungsmaßes zwischen der Form des erfassten Zeichens und den Formen aller oder einer Untermenge der Vorlagensymbole wird Schritt d) ausgeführt. In diesem Schritt wird jeder Wert mit einer individuellen Akzeptanzgrenze verglichen, die für jedes Vorlagensymbol definiert ist. Die Vorlagensymbole, deren Werte des Näherungsmaßes kleiner als deren jeweilige Akzeptanzgrenzen sind, werden als plausible Interpretationen des geschriebenen Zeichens betrachtet. Von diesen plausiblen Interpretationen wird das Vorlagensymbol, dessen Wert der kleinste ist, ausgewählt. Im Gegensatz dazu wird, wenn kein Wert kleiner als dessen Akzeptanzgrenze ist, eine verfeinerte Bestimmung vorgenommen. Die Akzeptanzgrenzen können auch ein und dieselbe für die Vorlagensymbole sein. Ein Vorteil einer Verwendung von individuellen Akzeptanzgrenzen ist derjenige, dass kompliziertere Zeichen, wie beispielsweise „@“, dazu tendieren, dass sie einen ziemlich hohen Wert des Näherungsmaßes auch in dem Fall einer Übereinstimmung haben, während einfachere Zeichen, wie beispielsweise „1", allgemein einen niedrigen Wert des Näherungsmaßes in dem Fall einer Korrespondenz haben. Weitere Varianten sind möglich, wobei einige davon nachfolgend beschrieben werden.
  • Theoretisch muss das Näherungsmaß μ(s(ϕ), s(ψ) = 0) erfüllen, wenn ϕ und ψ Parametrisierungen derselben Kurve sind, wenn die Kurven voneinander mit einer positiven Ähnlichkeitstransformation erhalten werden. Da sich Personen, wenn sie schreiben, nicht exakt an die zulässigen Ähnlichkeits-Transformationen der Vorlagensymbole halten, sollten allerdings die Akzeptanzgrenzen so ausgewählt werden, dass sie größer als 0 sind.
  • Andererseits werden die Akzeptanzgrenzen deshalb so bestimmt, dass sie Werte sind, die >0 sind, und andererseits wird der Fall, wo kein Wert kleiner als seine Akzeptanzgrenze ist, nicht wie dann interpretiert, wenn das geschriebene Zeichen kein Äquivalent unter den Vorlagensymbolen besitzt. Anstelle davon wird, gemäß dieser Ausführungsform, eine Reparametrisierung ausgeführt, da die Parametrisierung das Endergebnis in einem ziemlich großen Umfang beeinflusst. Eine bevorzugte Reparametrisierung der Kurve ψ bedeutet, dass sie zusammen mit einer eins-zu-eins Funktion γ:[0,1] → [0,1] genommen wird. Zum Beispiel erfüllt γ(t) = 1 – t dies, was bedeutet, dass das Zeichen in der entgegengesetzten Richtung geschrieben ist. Welche Art einer Reparametrisierung vorgenommen werden muss, wird durch Lösen des Problems einer Minimierung
    Figure 00100001
    bestimmt, wobei die Minimierung über alle γ durchgeführt wird, die vorstehend beschrieben worden sind.
  • Die vorstehend beschriebenen Schritte werden dann wiederholt und neue Werte des Näherungsmaßes werden erhalten. Falls keiner davon unterhalb seiner Akzeptanzgrenze liegt, wird das geschriebene Zeichen zurückgewiesen und der Benutzer wird hierüber informiert, zum Beispiel durch Auffordern von diesem, das Zeichen erneut zu schreiben. Falls man wünscht, die Bestimmung des Näherungsmaßes nach der Reparametrisierung zu beschleunigen, kann eine Gruppe, die aus den kleinsten, zum Beispiel den drei kleinsten, Werten der Näherungsmaße besteht, von der ersten Bestimmung ausgewählt werden und nur in der zweiten Bestimmung mit den Vorlagensymbolen verglichen werden, die in der Gruppe umfasst sind. Allerdings kann dies in bestimmten Fällen ein Endergeb nis, ein anderes als in dem Fall, in dem alle Vorlagensymbole in der zweiten Bestimmung berücksichtigt werden, hervorgerufen.
  • Das geometrische Näherungsmaß μ führt nicht nur zu einer Bewertungsreihenfolge zwischen unterschiedlichen Interpretationen eines Zeichens, sondern auch dazu, dass es ein Maß darüber angibt, wie ähnlich zwei Zeichen sind. Dies führt zu der Möglichkeit, auch das vorliegende Verfahren für eine Verifizierung und Identifikation, jeweils, von Signaturen (Initialen werden hier als Signaturen wahrgenommen) zu verwenden. Bei dieser Benutzung ist allerdings die Bogenlängen-Parametrisierung kein bevorzugter Typ einer Parametrisierung, da sie Informationen über die Dynamiken, wenn geschrieben wird, ausschließt. Solche Informationen sind bei dieser Benutzung wertvoll. Allerdings sind andere Varianten vorhanden, die geeigneter sind.
  • Die bevorzugte Ausführungsform ist hier auf der Basis der Tatsache beschrieben worden, dass geeignete Vorlagensymbole vorhanden sind, mit denen das geschriebene Zeichen verglichen werden kann. Weiterhin ist eine Beschreibung für ein Zeichen vorgenommen worden. Normalerweise sind es keine gesonderten Zeichen, sondern ein laufender Text mit vollständigen Worten, die auf der Anzeige geschrieben werden. Von dem Sichtpunkt des Benutzers aus gesehen ist es erwünscht, in der Lage zu sein, einen laufenden Text zu schreiben, der viel von dem Verfahren fordert.
  • Ein Problem in diesem Zusammenhang ist dasjenige, dass die Einheit von Zeichen eine Vielzahl von Zeichenkombinationen enthalten kann. Es ist nicht möglich, den Benutzer zu fragen, alle möglichen Zeichen oder Worte als Vorlagensymbole zu schreiben.
  • Gleichzeitig ist es vorteilhaft, wenn eine Begrenzung der Formen des Schreibens vermieden werden kann. Wenn die Benutzer stark eingeschränkt werden, zum Beispiel indem nur zugelassen wird, ein Zeichen zu einem Zeitpunkt zu schreiben, so dass der vorstehend beschriebene Fall immer existiert, ist die Situation relativ klar, allerdings nicht benutzerfreundlich. Gemäß der Erfindung wird dem Benutzer erlaubt, einen laufenden Text zu schreiben. Es ist demzufolge schwierig zu wissen, wo in der Kurve/den Kurven, zum Beispiel, ein Zeichen endet und beginnt. Die Punkte, die den Beginn und das Ende eines Zeichens anzeigen, werden als Unterbrechungspunkte bezeichnet, und das Auffinden möglicher Unterbrechungspunkte trägt zu der Komplexität des Problems einer Erkennung bei. Dieses Problem einer Komplexität wird gemäß einer Ausführungsform des Verfahrens gemäß der Erfindung in der nachfolgenden Art und Weise gelöst. Es sollte er wähnt werden, dass die vorstehenden Schritte in derselben Art und Weise in dieser Ausführungsform ausgeführt werden. Die nachfolgende Beschreibung bezieht sich im Wesentlichen auf den Schritt einer Vorverarbeitung der Einheit von Zeichen und den Schritt eines Vergleichens.
  • Wenn der Stift nach jedem Zeichen in einem Wort angehoben wird, kann dies als Vorteil herangezogen werden. Jedes Anheben des Stifts gibt Anlass zu einer Diskontinuität und kann durch zwei Punkte, die relativ weit voneinander in Raum und Zeit entfernt sind, erfasst werden. Natürlich wird diese Erfassung vor der Bogenlängen-Parametrisierung ausgeführt. Der Verbund von Zeichen hier besteht aus n Kurven. Die Punkte einer Diskontinuität können als plausible Unterbrechungspunkte herangezogen werden, um zwei Zeichen voneinander zu unterscheiden. Dies fokussiert das Problem auf Zeichen, die mehrere Striche enthalten, die durch Anheben des Stifts dazwischen geschrieben werden. Ein solches Zeichen wird durch mehrere Kurven mittels der Erfassung einer Diskontinuität repräsentiert. Allerdings kann jede Kurve mit einer umskalierten Bogenlänge reparametrisiert werden, was bedeutet, dass jede Kurve dieselbe Anzahl von Abtastpunkten enthält. Es wird angenommen, dass I1, I2, ..., In die Kurven sind und dass sk eine Zusammensetzung der Kurven 1 bis k ist. Es werden die Zusammensetzungen der Kurven s1, s2, ..., sk mit der Datenbank von Vorlagensymbolen verglichen, wobei k die größte Anzahl von Kurven, enthalten in irgendeinem Vorlagensymbol, ist. Es wird angenommen, dass sk1 die längste Zusammensetzung von Kurven ist, die eine Korrespondenz/Korrespondenzen ergibt, d.h. die, wenn mit Vorlagensymbolen verglichen wird, einen Wert oder mehrere Werten von Näherungsmaßen ergibt, die unterhalb der Akzeptanzgrenze/den Akzeptanzgrenzen liegen. Gerade wenn sk1 einem oder mehreren Versuchsymbol(en) entspricht, ist es nicht sicher, dass dies zu einer korrekten Interpretation führt. Gemäß dieser Ausführungsform des Verfahrens wird deshalb ein Plausibilitätstest durchgeführt, der nachfolgend beschrieben werden wird. Wenn die Interpretation nicht plausibel ist, wird sk1 auf die längste Zusammensetzung von Kurven sk2 verkürzt, allerdings eine solche, die eine Korrespondenz ergibt. Der Plausibilitätstest wird noch einmal ausgeführt.
  • Wenn keine Interpretation für irgendein sk plausibel ist, wird die beste Interpretation von s1 ausgewählt. Die verbleibenden Kurven werden entsprechend verarbeitet. Nur die Punkte einer Diskontinuität sind ausreichend als plausible Unterbrechungspunkte, soweit wie ein kohärentes Schreiben betroffen ist, allerdings sind dabei auch Unterbrechungs punkte innerhalb einer Kurve vorhanden. Es sollte angemerkt werden, dass es eine Tatsache ist, dass der vorstehende Vorgang, um Unterbrechungspunkte aufzufinden, mit Reparametrisierungen der Zusammensetzung aller geschriebenen Kurven erreicht wird.
  • Der Ausdruck „Plausibilitätstest" deckt, inter alia, sogenannte Zuversichtssätze (confidence sets) ab. Der vorstehende Grund der Erkennung von Einheiten von Zeichen, die aus mehreren Zeichen bestehen, und Zeichen, die aus mehreren Kurven, jeweils, bestehen, wird nun beispielhaft anhand der 4 angegeben, wobei die Zuversichtssätze als Plausibilitätstests verwendet werden.
  • Es wird angenommen, dass das geschriebene Zeichen „äta" (Englisch „eat"), d.h. ein vollständiges Wort, geschrieben entsprechend 4a, ist. Mittels einer Erfassung von Diskontinuitäten und einer Reparametrisierung mit einer umskalierten Bogenlänge, ist „ä" identifiziert worden, und „t" ist daraufhin das nächste. Der horizontale ebenso wie der vertikale Strich können als „1" interpretiert werden, d.h. „t" kann als „11" interpretiert werden. Die Vorlagensymbole werden mit zugeordneten Zuversichtssätzen gemäß 4b gespeichert, wobei die Vorlagensymbole „1" und „t" mit den jeweiligen Zuversichtssätzen als der schattierte Bereich dargestellt sind. Es wird angenommen, dass der vertikale Strich von „t" als das Vorlagensymbol „1" interpretiert wird. Die Transformation a:R2 → R2 kann dann bestimmt werden – innerhalb der Klasse, die die Form erzeugt –, die das Vorlagensymbol in den vertikalen Strich überführt. Wenn a auf den Zuversichtssatz angewandt wird, wird das Ergebnis der 4c erreicht. Die nächste Kurve, d.h. der horizontale Strich, ist der Zuversichtssatz, der verboten ist, und die Interpretation wird als nicht plausibel klassifiziert. Die Zuversichtssätze müssen nicht nur durch gerade Striche identifiziert werden, wie Fachleute auf dem betreffenden Fachgebiet realisieren werden, sondern können ein allgemeineres Aussehen haben. Mit jedem Vorlagensymbol kann ein anderer Zuversichtssatz verbunden werden, der den ersten Satz enthält. Wenn dann die nächste Kurve auch außerhalb des zweiten Zuversichtssatzes liegt, wird sie so interpretiert werden, als wäre das nächste Zeichen das erste in einem neuen Wort.
  • Ein alternativer Plausibilitätstest bedeutet, dass die Transformation, die in der Beschreibung von Zuversichtssätzen bestimmt wurde, studiert ist. Wenn die Transformation über einen bestimmten Umfang hinausgeht, wird die Interpretation als nicht plausibel klassifiziert werden. Ein solcher Umfang kann, zum Beispiel, eine Bestimmung sein, welcher Umfang der Transformation zugelassen ist, um das Zeichen zu drehen, in Bezug auf das, wie stark früher interpretierte Zeichen gedreht worden sind. Auch können übermäßige Deformationen vorhanden sein. Um, zum Beispiel, „@“ von „s“ zu unterscheiden, kann die Vergrößerung der Transformation in Bezug auf die Vergrößerung von Symbolen, die zuvor interpretiert worden sind, berechnet werden.
  • Die vorstehend beschriebenen Ausführungsformen des Verfahrens gemäß der Erfindung sollten nur als nicht einschränkende Beispiele angesehen werden, und viele Modifikationen, die außerhalb der vorstehenden liegen, sind innerhalb des Schutzumfangs der Erfindung, wie er in den beigefügten Ansprüchen definiert ist, möglich. Beispiele von weiteren solchen Modifikationen folgen nachfolgend.
  • Als eine Alternative zu der vorstehend beschriebenen Reparametrisierung wird die Entscheidung direkt auf der Basis des ersten, bestimmten, kleinsten Werts eines Näherungsmaßes herangezogen.
  • Beispiele von anderen Modifikationen sind die Auswahl eines anderen Näherungsmaßes, verschiedene Auswahlen von Werten von Akzeptanzgrenzen, die eine bestimmte Adaption an verschiedene Benutzer erfordern, unterschiedliche Typen einer Reparametrisierung und unterschiedliche Typen einer Form, zum Beispiel einer affinen Form.
  • Soweit verschiedene Typen einer Form betroffen sind, werden zwei oder mehr Formen, als eine Alternative, parallel für jede Einheit von Zeichen verwendet. Dies bedeutet, dass mehrere Invarianten für jede Einheit von Zeichen vorgesehen werden und dann parallel in den folgenden Schritten verarbeitet werden. Dies führt zu einem höheren Grad einer Genauigkeit und einer schnelleren Erkennung.
  • In der Praxis kann das Verfahren gemäß der Erfindung, zum Beispiel, in elektronischen Notebooks, und dergleichen, und in Mobiltelefonen mit einer erhöhten Möglichkeit einer Kommunikation durch ein beschreibbares Fenster verwendet werden.
  • Das Verfahren gemäß der Erfindung kann als ein Computerprogramm in einem Computer unter Verwendung einer kommerziell verfügbaren Programmiersprache für mathematische Berechnungen, wie beispielsweise C, C++ oder FORTRAN, oder als eine speziell eingebaute Vorrichtung, gemäß der Erfindung, was nachfolgend beschrieben werden wird, ausgeführt werden. In beiden Fällen werden die Vorlagensymbole als eine Datenbank gespeichert. Falls erforderlich, kann die Datenbank geändert werden.
  • Wie in 5 dargestellt ist, weist eine Ausführungsform einer Vorrichtung, die das Verfahren realisiert, eine druckempfindliche Anzeige 42, eine Anzeige- Kommunikationseinheit 44 mit einem Detektor 46, eine Steuereinheit 48, eine Speichersteuereinheit 50, eine Speichereinheit 52 und eine Verarbeitungseinheit 54 auf. Die Anzeige-Kommunikationseinheit 44, die Steuereinheit 48, die Speichersteuereinheit 50 und die Verarbeitungseinheit 54 kommunizieren über einen Bus 56, der Daten, Adressen- und Steuersignale zwischen den Einheiten überträgt. Einheiten von Zeichen werden auf der Anzeige 42 geschrieben und durch den Detektor 46 erfasst, der die geordnete Folge von Punkten bereitstellt. In der Speichereinheit 52 werden die Vorlagensymbole und die erfassten Einheiten von Zeichen gespeichert. Mittels der Verarbeitungseinheit werden Berechnungsvorgänge ausgeführt, die die Interpretation der Sequenzen von Punkten als eine oder mehrere Kurve(n), die Parametrisierung jeder Kurve, den Vergleich der verarbeiteten Einheit von Zeichen mit Vorlagensymbolen und die Anwendung der Entscheidungsregel aufweist. In der Speichereinheit 50 ist auch eine Software zum Durchführen des Verfahrens gespeichert. Die Steuereinheit 48 lässt das Programm laufen und kommuniziert mit dem Benutzer über die Anzeige-Kommunikationseinheit 44 und die Anzeige 42.
  • Die Vorrichtung ist auch für optionale Einstellungen angepasst, die, inter alia, die Auswahl von Formen, die Auswahl des Näherungsmaßes, die Auswahl von Parametrisierungen und die Auswahl einer Entscheidungsregel aufweisen können. Die Auswahlen werden über die Anzeige 42 vorgenommen.
  • Vorstehend ist die Beschreibung im Wesentlichen auf der Basis der Zeichen, die auf einer Anzeige geschrieben werden und die gleichzeitig erfasst werden, wenn sie geschrieben werden, vorgenommen worden. Eine Alternative ist diejenige, dass die Zeichen erfasst werden, zum Beispiel abgetastet werden, wenn sie bereits auf einem Stück Papier geschrieben sind. Dies bezieht sich auf handgeschriebene Zeichen ebenso wie auf maschinengeschriebenen Zeichen. Demzufolge weist die Erfassung anstelle des Vorgangs eines Erkennens der Anzeige-Schrift den Vorgang eines Lesens (Abtastens) der Zeichen auf dem Stück Papier auf. In vorteilhafter Weise werden gelesene Daten in die geordnete Sequenz von Punkten durch eine Kantenerfassung transformiert. Allerdings ist dies auch eine Modifikation innerhalb des Schutzumfangs dieser Erfindung. In dieser Ausführungsform weist die Vorverarbeitung ein Bilden von einer oder mehreren Zeichenkurve(n), zum Beispiel die Kantenkurve oder die Kantenkurven des Zeichens, auf der Basis der Kantenerfassung und der Parametrisierung auf. Wenn die Kantenkurven so definiert worden sind, sind die nachfolgenden Schritte dieselben wie in der vorstehend beschriebenen, bevorzugten Ausführungsform.
  • Die Entscheidungsregel kann auf viele unterschiedliche Arten und Weisen ausgewählt werden. Eine Variante des Vorstehenden ist diejenige, dass alle Vorlagensymbole, für die der Wert des Näherungsmaßes unterhalb der Akzeptanzgrenze liegt, ausgewählt werden. Darauf folgend können die Vorlagensymbole weiter entsprechend irgendeiner verfeinerten Bestimmung des vorstehend beschriebenen Typs verarbeitet werden. Es ist auch möglich, eine Kombination mit einem anderen Auswahlverfahren vorzunehmen, das sich als die plausibelste Alternative herausstellt. Ein Beispiel eines solchen Verfahrens sind Statistiken von Zeichen, die die Wahrscheinlichkeit des Vorhandenseins von separaten Zeichen oder Zusammenstellungen von Zeichen in Texten anzeigen.
  • Weiterhin ist eine Alternative zum Bestimmen der Akzeptanzgrenzen diejenige, dass die Vorlagensymbole gruppiert werden, wobei in einem solchen Fall dieselbe Grenze innerhalb einer Gruppe gilt.
  • Das Verfahren gemäß der Erfindung ist dahingehend zuverlässig, dass es in der Lage ist, ziemlich deformierte Zeichen zu erkennen und einen laufenden Text zu handhaben. Die Inhalte der Datenbank sind nicht kritisch, sondern im Prinzip ist ein Satz von separaten Zeichen ausreichend. Um eine Vielfalt von Schriftarten und Handschriften mit einem hohen Grad einer Genauigkeit zu erkennen, kann es allerdings ein Vorteil sein, verschiedene Varianten jedes Zeichens zu speichern, die Deformationen aufweisen, die außerhalb der Klasse von Transformationen liegen, die in dem Vergleich geeignet und zulässig sind. Es kann auch vorteilhaft sein, bestimmte Zusammensetzungen von Zeichen zu speichern, zum Beispiel indem man in der Lage ist, sicherer zwei 1'en „11", die miteinander verbunden sind, von einem „u" zu unterscheiden.

Claims (19)

  1. Verfahren zur Zeichenerkennung, das die folgenden Schritte umfasst: Erfassen eines separaten Zeichens oder eines Zeichens in einer Zusammenstellung von Zeichen, Vorverarbeiten des Zeichens, Vergleichen des vorverarbeiteten Zeichens mit einem oder mehreren Vorlagensymbolen, und Anwenden einer Entscheidungsregel, um ein Vorlagensymbol entweder zu verwerfen oder zu entscheiden, dass das Vorlagensymbol in dem Zeichen enthalten ist, wobei der Schritt des Vorverarbeitens des Zeichens die folgenden Schritte umfasst: Darstellen des Zeichens als eine oder mehrere Kurven, wobei die Darstellung so geformt ist, dass sie quantitativen Vergleich ermöglicht, und Parameterisieren der Kurve oder Kurven, dadurch gekennzeichnet, dass der Schritt des Vorverarbeitens des Zeichens des Weiteren den Schritt des Ausbildens einer oder mehrerer Formen für die Kurve oder Kurven unter Berücksichtigung verschiedener Klassen von Transformationen umfasst, wobei die eine oder mehrere Formen für die Kurve oder Kurven definiert sind als d(Φ) = {ψ|ψ = g(Φ), g∈ G}wobei Φ die parameterisierte Kurve ist, d(Φ) die Form für die Kurve ist und G die Klasse von Transformationen ist, wobei die Form in Bezug auf die Klasse von Transformationen invariant ist, und dadurch, dass der Schritt des Vergleichens die folgenden Schritte umfasst: Ausbilden eines oder mehrerer geometrischer Näherungsmaße, für jede Form Bestimmen der Werte der geometrischen Näherungsmaße zwischen der Form und entsprechend bestimmten Formen für die Vorlagensymbole, und dass der Schritt des Anwendens einer Entscheidungsregel den folgenden Schritt umfasst: Auswählen eines oder mehrerer Vorlagensymbole unter Berücksichtung der Werte.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt des Erfassens eines separaten Zeichens oder eines Zeichens in einer Zusammenstellung von Zeichen den Schritt des Darstellens des Zeichens als einen Satz von Punkten umfasst, und dass der Schritt des Darstellens des Zeichens als eine oder mehrere Kurven die folgenden Schritte umfasst: Erzeugen einer geordneten Sequenz von Punkten aus dem Satz von Punkten, und Interpolieren zwischen den Punkten, um die eine oder mehrere Kurven zu erzeugen.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Schritt des Parameterisierens die folgenden Schritte umfasst: Einrichten einer Funktion, die der Kurve folgt, gemäß einer geeigneten Parameterisierungsregel, und Abtasten der Funktion an einer Vielzahl gleichmäßig beabstandeter Punkte.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Parameterisierungsregel eine Bogenlänge ist.
  5. Verfahren nach einem der vorangehenden Ansprüche, wobei das separate Zeichen oder das Zeichen in einer Zusammenstellung von Zeichen auf einer Anzeigeeinrichtung erfasst wird, auf der es direkt geschrieben wird, dadurch gekennzeichnet, dass der Schritt des Erfassens während des Schreibens ausgeführt wird.
  6. Verfahren nach einem der Ansprüche 1–4, dadurch gekennzeichnet, dass das separate Zeichen oder das Zeichen in einer Zusammenstellung von Zeichen in einer Datenmenge erfasst wird, die von einem Scanner stammt.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass der Schritt des Vorverarbeitens des Zeichens Kantenerfassung des Zeichens umfasst.
  8. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass der Schritt des Anwendens einer Entscheidungsregel Bestimmen von Akzeptanzgrenzen der Werte der Näherungsmaße und Auswählen eines Vorlagensymbols nur dann umfasst, wenn wenigstens ein Wert bezüglich des Vorlagensymbols innerhalb der Akzeptanzgrenzen liegt.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass jedem Vorlagensymbol individuelle Akzeptanzgrenzen zugewiesen werden.
  10. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass wenigstens zwei Vorlagensymbole die gleichen Akzeptanzgrenzen haben.
  11. Verfahren nach einem der Ansprüche 8–10, gekennzeichnet durch den Schritt des Reparameterisierens einer parameterisierten Kurve, wenn alle Werte der Näherungsmaße zwischen der Form der parameterisierten Kurve und den Vorlagensymbolen jenseits der Akzeptanzgrenzen liegen, so dass ein oder mehrere Werte des entsprechenden Näherungsmaßes zwischen den Vorlagensymbolen und der Form der reparameterisierten Kurve abnehmen.
  12. Verfahren nach einem der Ansprüche 8–11, dadurch gekennzeichnet, dass die Akzeptanzgrenzen auf Basis der Tatsache bestimmt werden, dass nur Ähnlichkeitstransformationen zugelassen werden.
  13. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass der Schritt des Anwendens einer Entscheidungsregel das Ausführen einer Plausibilitätsprüfung umfasst, indem eine Transformation zum Transformieren der ausgewählten Vorlagensymbole zu dem Zeichen bestimmt wird und die Transformation analysiert wird.
  14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass das Analysieren in der Plausibilitätsprüfung auf den Konfidenzmengen basiert.
  15. Verfahren nach einem der vorangehenden Ansprüche, wobei die vorgegebene Form gegeben ist durch: s(Φ) = linhull ({(Φ12),(–Φ21),(1,0),(0,1)})wobei Φ die parameterisierte Kurve oder Kurven ist/sind, und Φ in zwei Teile Φ1 und Φ2 parameterisiert wird, die zwei Koordinaten von Punkten auf der Kurve oder den Kurven darstellen.
  16. Verfahren nach einem der vorangehenden Ansprüche, wobei die vorgegebene Form gegeben ist durch: s(Φ) = linhull (Φ12,1)wobei Φ die parameterisierte Kurve oder Kurven ist/sind und Φ in zwei Teile Φ1 und Φ2 parameterisiert wird, die zwei Koordinaten von Punkten auf der Kurve oder den Kurven darstellen.
  17. Verfahren nach einem der vorangehenden Ansprüche, wobei der Schritt des Ausbildens eines oder mehrerer geometrischer Näherungsmaße Auswählen eines Skalarproduktes umfasst, das Ableitungen der Kurve oder Kurven umfasst.
  18. Verfahren nach einem der vorangehenden Ansprüche, wobei der Schritt des Ausbildens eines oder mehrerer geometrischer Näherungsmaße Auswählen eines Skalarproduktes umfasst, das verschiedenen Teilen der Kurve oder Kurven verschiedene Gewichte verleiht.
  19. Einsatz des Verfahrens nach einem der vorangehenden Ansprüche zum Prüfen oder Identifizieren von Unterschriften.
DE69932167T 1998-08-26 1999-08-25 Zeichenerkennung Expired - Lifetime DE69932167T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9802832 1998-08-26
SE9802832A SE514377C2 (sv) 1998-08-26 1998-08-26 Teckenigenkänning
PCT/SE1999/001448 WO2000013131A1 (en) 1998-08-26 1999-08-25 Character recognition

Publications (2)

Publication Number Publication Date
DE69932167D1 DE69932167D1 (de) 2006-08-10
DE69932167T2 true DE69932167T2 (de) 2006-11-23

Family

ID=20412341

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69932167T Expired - Lifetime DE69932167T2 (de) 1998-08-26 1999-08-25 Zeichenerkennung

Country Status (14)

Country Link
US (2) US6711290B2 (de)
EP (1) EP1105833B1 (de)
JP (1) JP4580554B2 (de)
KR (1) KR100615124B1 (de)
CN (1) CN1163842C (de)
AT (1) ATE331994T1 (de)
AU (1) AU749849B2 (de)
CA (1) CA2341266C (de)
DE (1) DE69932167T2 (de)
HK (1) HK1038975A1 (de)
IL (2) IL141294A0 (de)
RU (1) RU2001107822A (de)
SE (1) SE514377C2 (de)
WO (1) WO2000013131A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202010007896U1 (de) 2010-06-07 2010-10-07 Benyoucef, Dirk, Dr.-Ing. Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern
DE102010023557A1 (de) 2010-06-07 2011-12-08 Dirk Benyoucef Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US7821503B2 (en) 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
JP4519381B2 (ja) * 1999-05-27 2010-08-04 テジック コミュニケーションズ インク 自動訂正機能を備えたキーボード・システム
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US20040037463A1 (en) * 2002-01-28 2004-02-26 Calhoun Christopher L. Recognizing multi-stroke symbols
US8238718B2 (en) * 2002-06-19 2012-08-07 Microsoft Corporaton System and method for automatically generating video cliplets from digital video
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
SE0202446D0 (sv) 2002-08-16 2002-08-16 Decuma Ab Ideon Res Park Presenting recognised handwritten symbols
JP4145873B2 (ja) * 2002-08-19 2008-09-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 走査信号における異常検出装置及び方法
US20050281467A1 (en) * 2003-01-24 2005-12-22 Stahovich Thomas F Recognizing multi-stroke symbols
CN1305003C (zh) 2003-09-29 2007-03-14 摩托罗拉公司 用户界面上的书写标记识别
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
EP1744696A1 (de) * 2004-05-14 2007-01-24 Cardima, Inc. Ablationssonde mit stabilisierendem element
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
WO2006135394A2 (en) * 2004-08-20 2006-12-21 The Regents Of The University Of Colorado, A Body Corporate Biometric signature and identification through the use of projective invariants
US20060227066A1 (en) * 2005-04-08 2006-10-12 Matsushita Electric Industrial Co., Ltd. Human machine interface method and device for automotive entertainment systems
US20060227065A1 (en) * 2005-04-08 2006-10-12 Matsushita Electric Industrial Co. Ltd. Human machine interface system for automotive application
KR100787134B1 (ko) * 2005-08-05 2007-12-21 한국정보통신주식회사 정규화된 전자서명 인쇄 장치
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
KR100825209B1 (ko) * 2005-11-17 2008-04-25 김진우 서명 데이터의 암호화장치 및 암호화방법
US7587378B2 (en) * 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
TW200809660A (en) * 2006-03-01 2008-02-16 Zi Decuma Ab A method for additive character recognition and an apparatus thereof
US7580925B2 (en) 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
US20080154576A1 (en) * 2006-12-21 2008-06-26 Jianchao Wu Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
US8225203B2 (en) * 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
JP2009199102A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 文字認識プログラム、文字認識装置及び文字認識方法
US20090245646A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Online Handwriting Expression Recognition
US8917935B2 (en) * 2008-05-19 2014-12-23 Microsoft Corporation Detecting text using stroke width based text detection
US20100166314A1 (en) * 2008-12-30 2010-07-01 Microsoft Corporation Segment Sequence-Based Handwritten Expression Recognition
JP5343617B2 (ja) 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法
US8310461B2 (en) 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
US10061997B2 (en) 2011-04-11 2018-08-28 Apple Inc. Handwriting capture techniques
CN103324925A (zh) * 2012-03-22 2013-09-25 佳能株式会社 用于获得用于手写字符识别的字符数据的方法和装置
US10748031B1 (en) * 2019-05-22 2020-08-18 Read-Ink Corporation Handwriting recognition systems and methods

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3614736A (en) 1968-05-21 1971-10-19 Ibm Pattern recognition apparatus and methods invariant to translation, scale change and rotation
US3636513A (en) 1969-10-17 1972-01-18 Westinghouse Electric Corp Preprocessing method and apparatus for pattern recognition
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
US5333209A (en) * 1992-03-24 1994-07-26 At&T Bell Laboratories Method of recognizing handwritten symbols
JPH05290221A (ja) 1992-04-15 1993-11-05 Pioneer Electron Corp オンライン手書文字認識装置
CA2097095A1 (en) 1992-07-29 1994-01-30 Frank William Sinden Method of normalizing handwritten symbols
WO1994004992A1 (en) * 1992-08-20 1994-03-03 Communication Intelligence Corporation A method for dynamic reconstruction of handwritten data
JP3113769B2 (ja) * 1993-10-15 2000-12-04 株式会社日本デジタル研究所 文字認識装置
US5745599A (en) 1994-01-19 1998-04-28 Nippon Telegraph And Telephone Corporation Character recognition method
US5768420A (en) * 1994-01-21 1998-06-16 Lucent Technologies Inc. Method and apparatus for handwriting recognition using invariant features
US5699456A (en) * 1994-01-21 1997-12-16 Lucent Technologies Inc. Large vocabulary connected speech recognition system and method of language representation using evolutional grammar to represent context free grammars
US5710916A (en) 1994-05-24 1998-01-20 Panasonic Technologies, Inc. Method and apparatus for similarity matching of handwritten data objects
US5854855A (en) * 1994-09-09 1998-12-29 Motorola, Inc. Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
JPH08163270A (ja) * 1994-12-05 1996-06-21 Nippon Telegr & Teleph Corp <Ntt> 無声電話通信端末装置
JP3454335B2 (ja) * 1995-07-17 2003-10-06 日本電信電話株式会社 オンライン手書き文字認識方法及びその装置
JPH0962773A (ja) * 1995-08-19 1997-03-07 Ricoh Co Ltd 文字認識装置
JPH0957204A (ja) * 1995-08-24 1997-03-04 Toshiba Corp 郵便物の宛先自動読取システム
US5828772A (en) * 1995-12-27 1998-10-27 Lucent Technologies Inc. Method and apparatus for parametric signature verification using global features and stroke-direction codes
JP3534537B2 (ja) * 1996-05-10 2004-06-07 日本電信電話株式会社 形状マッチング方法および装置
US6044174A (en) * 1996-10-11 2000-03-28 Lucent Technologies Inc. Method and apparatus for parametric representation of handwritten symbols
US6208757B1 (en) * 1996-10-11 2001-03-27 Lucent Technologies Inc. Method and apparatus for reconstructing handwritten symbols from parametric representations thereof
US5889889A (en) * 1996-12-13 1999-03-30 Lucent Technologies Inc. Method and apparatus for machine recognition of handwritten symbols from stroke-parameter data
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202010007896U1 (de) 2010-06-07 2010-10-07 Benyoucef, Dirk, Dr.-Ing. Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern
DE102010023557A1 (de) 2010-06-07 2011-12-08 Dirk Benyoucef Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern

Also Published As

Publication number Publication date
EP1105833A1 (de) 2001-06-13
CA2341266A1 (en) 2000-03-09
JP2002523844A (ja) 2002-07-30
CA2341266C (en) 2009-05-19
AU749849B2 (en) 2002-07-04
CN1315024A (zh) 2001-09-26
RU2001107822A (ru) 2003-02-20
US20010026639A1 (en) 2001-10-04
JP4580554B2 (ja) 2010-11-17
IL141294A (en) 2007-02-11
SE9802832L (sv) 2000-02-27
CN1163842C (zh) 2004-08-25
KR100615124B1 (ko) 2006-09-11
EP1105833B1 (de) 2006-06-28
KR20010090435A (ko) 2001-10-18
DE69932167D1 (de) 2006-08-10
US7139430B2 (en) 2006-11-21
AU5890799A (en) 2000-03-21
ATE331994T1 (de) 2006-07-15
US6711290B2 (en) 2004-03-23
SE9802832D0 (sv) 1998-08-26
IL141294A0 (en) 2002-03-10
SE514377C2 (sv) 2001-02-19
US20040234129A1 (en) 2004-11-25
HK1038975A1 (zh) 2002-04-04
WO2000013131A1 (en) 2000-03-09

Similar Documents

Publication Publication Date Title
DE69932167T2 (de) Zeichenerkennung
DE60204005T2 (de) Verfahren und einrichtung zur erkennung eines handschriftlichen musters
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE60316503T2 (de) Klassifikationsanalyse von Freiformeingaben mit digitaler Tinte
DE69633809T2 (de) Verarbeitung von maschinell lesbaren Vordrucken
DE69333431T2 (de) Verfahren zum Erkennen von handgeschriebenen Symbolen
DE60308944T2 (de) Layoutanalyse eines handschriftlichen Dokuments für Freiform-Eingabe mit digitaler Tinte
DE19960555B4 (de) Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes
DE60217299T2 (de) Holistisch-analytische erkennung von handgeschriebenem text
EP0780002B1 (de) Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE60225170T2 (de) Verfahren und vorrichtung zum dekodieren handschriftlicher zeichen
DE19953608B4 (de) Vorrichtung und Verfahren zum Erkennen eines Fonts eines Textes in einem Dokumentenverarbeitungssystem
DE19610759C2 (de) Verfahren zum Codieren eines Dokumentes und Verfahren zum Senden eines Dokumentes von einem Sendecomputersystem zu einem Empfangscomputersystem
EP0059240A2 (de) Verfahren zum automatischen Erkennen von Bild- und Text- oder Graphikbereichen auf Druckvorlagen
DE3716787A1 (de) Zeichenerkennungsverfahren
DE19705757A1 (de) Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems
DE19511470C1 (de) Verfahren zur Ermittlung eines Referenzschriftzuges anhand einer Menge von schreiberidentischen Musterschriftzügen
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE3515159A1 (de) Bildverarbeitungseinrichtung
DE19511472C1 (de) Verfahren zur dynamischen Verifikation eines Schriftzuges anhand eines Referenzschriftzuges
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
WO2005119580A1 (de) Verfahren und einrichtung zur strukturanalyse eines dokuments
DE112021000371T5 (de) Digitale bildbearbeitung
DE102009034939A1 (de) System und Verfahren zur Erkennung von Ein-Strich-Zeichen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition