DE4345583B4 - Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match - Google Patents

Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match Download PDF

Info

Publication number
DE4345583B4
DE4345583B4 DE4345583A DE4345583A DE4345583B4 DE 4345583 B4 DE4345583 B4 DE 4345583B4 DE 4345583 A DE4345583 A DE 4345583A DE 4345583 A DE4345583 A DE 4345583A DE 4345583 B4 DE4345583 B4 DE 4345583B4
Authority
DE
Germany
Prior art keywords
word
metastroke
metastrokes
input
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE4345583A
Other languages
German (de)
Inventor
Shelja A. Guberman
Ilia Lossev
Alexander V. Pahintsev
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US07/954,351 external-priority patent/US5313527A/en
Application filed by Microsoft Corp filed Critical Microsoft Corp
Priority to DE4394624A priority Critical patent/DE4394624B4/en
Priority claimed from DE4394624A external-priority patent/DE4394624B4/en
Application granted granted Critical
Publication of DE4345583B4 publication Critical patent/DE4345583B4/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2264Character recognition characterised by the type of writing of cursive writing using word shape
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

The recognition method involves receiving input signals having values representative of a sequence of points symbolizing handwriting. A beginning point and ending point of the sequence is also provided by the input signals. A sequence of points, bounded by the beginning point and the end point, is selected as a candidate word. The candidate word is replaced with a string of input metastrokes in sequential order. Each metastroke is representative of an element of a cursive handwritten cipher to obtain a preliminary metastroke string for each candidate word. Word correlation tables are constructed by using a feature correlation table of all metastrokes forming a vocabulary. The feature correlation table relates input metastrokes to vocabulary metastrokes. Strings of vocabulary metastrokes are selected corresponding to the candidate word. The strings of vocabulary metastrokes comprise a listing of entries compiled from variants of known strings of the metastrokes. A single candidate maximum score is extracted for each one of the word correlation tables only upon completion of the word correlation table. The most likely match between the candidate word and one of the strings of the vocabulary metastrokes is identified to an output device.

Description

TECHNISCHER HINTERGRUNDTECHNICAL BACKGROUND

Die Erfindung betrifft die Handschrifterkennung und bezieht sich insbesondere auf Handschrifterkennungsverfahren und eine Vorrichtung zur Handschrifterkennung, d.h. die Erkennung von aus einem durchgehenden Linienzug bestehenden Zeichen und Wörtern, wobei Informationen über die Strichfolge in Verbindung mit der Eingabe von Strichpositionsinformationen vorgesehen sind.The The invention relates to handwriting recognition and relates in particular Handwriting recognition method and apparatus for handwriting recognition, i.e. the recognition of existing from a continuous polyline Signs and words, being information about the stroke sequence in connection with the input of bar position information are provided.

Der Bereich der computerunterstützten Handschrifterkennung ist von Interesse, seitdem viele Menschen nicht die Fähigkeit haben, über eine Tastatur zu kommunizieren und seitdem viele Aufgaben durch eine direkte Eingabe in einen Computer mit einem vertrauten Schreibinstrument, z.B. einem Stift, Kugelschreiber oder Füller entscheidend beschleunigt werden. Die Handschrifterkennung ist insbesondere deshalb eine Herausforderung, weil die Schriftzeichen aus durchgehenden Strichen bestehen und weil sich die Handschriften der Menschen stark voneinander unterscheiden.Of the Field of computer-aided Handwriting recognition is of interest, since many people do not the ability have, over a keyboard to communicate and since then many tasks through a direct input to a computer with a familiar writing instrument, e.g. a pen, pen or pen significantly accelerated become. Handwriting recognition is therefore a particular challenge, because the characters consist of solid lines and because people's manuscripts are very different from each other.

Die Arbeit des Herrn Dr. Shelja A. Guberman der ehemaligen Sowjetunion, einer der Miterfinder, bildet die Grundlage der Erfindung. In einem Aufsatz, der in russischer Sprache in der Zeitschrift Avtomatika i Telemekhanika, von Shelja A. Guberman und V. V. Rozentsveig unter dem Titel "Algorithmus zur Erkennung eines handgeschriebenen Textes" (Nr. 5, Mai, 1976, Seiten 122–129, UDC 681.39.06) veröffentlicht wurde, beschreiben die Erfinder den Stand der Technik der Handschrifterkennung und schlagen vor, daß die dynamischen Parameter der Schreibstiftlinienführung in Verbindung mit verschiedenen Erkennungsalgorithmen herangezogen werden. Zu den Erkennungsalgorithmen zählen eine Merkmalsgegenüberstellung zur Identifikation der Striche, die Erkennung des Anfangs und Endes der Trajektorie und die Unterteilung einer Trajektorie in Elemente, die nachfolgend auch als Metastriche bezeichnet werden. Die Erfinder haben ihr Metastrich-Alphabet auf gerade sieben sich selbst schneidende Elemente und drei Bogenelemente beschränkt. Die Arbeit schweigt aber zu der Möglichkeit einer Verwirrung der Elemente in dem Erkennungsprozeß und berücksichtigt nicht die Verwendung von dynamischen Programmierungstechniken. Folglich war die weitere Entwicklung darauf gerichtet, die Zuverlässigkeit und Brauchbarkeit der Erkennung zu verbessern.The Work of Dr. med. Shelja A. Guberman of the former Soviet Union, one of the co-inventors, forms the basis of the invention. In one Essay written in Russian in the journal Avtomatika i Telemekhanika, by Shelja A. Guberman and V.V. Rozentsveig the title "Algorithm for the recognition of a handwritten text "(No. 5, May, 1976, pages 122-129, UDC 681.39.06) The inventors describe the state of the art of handwriting recognition and suggest that the dynamic parameters of the pen line guide in conjunction with various Detection algorithms are used. To the recognition algorithms counting a feature comparison to identify the lines, the recognition of the beginning and end the trajectory and the subdivision of a trajectory into elements that hereinafter also referred to as metastrokes. The inventors have their metastroke alphabet on just seven self-cutting Limited elements and three arc elements. But the work is silent The possibility a confusion of elements in the recognition process and taken into account not the use of dynamic programming techniques. consequently Further development was focused on reliability and to improve the usability of recognition.

In der Vergangenheit wurden Elemente von verschiedenen Techniken offenbart, die denen ähnlich sind, die in Verbindung mit der Erfindung benutzt werden. Diese Entgegenhaltungen dienen dazu, den Stand der Technik zu veranschaulichen. Daher sind Details von speziellen Ausführungsformen der Erfindung, die von diesen bekannten Techniken Gebrauch machen, nicht im einzelnen beschrieben. Die folgenden Druckschriften sind aber dennoch auf dem Gebiet der Handschrifterkennung von Bedeutung.In In the past, elements of various techniques were revealed which are similar to those which are used in connection with the invention. These citations serve to illustrate the state of the art. Therefore are Details of special embodiments of the invention making use of these known techniques, not described in detail. The following pamphlets are but still important in the field of handwriting recognition.

Ehrich und Koehler, "Experiments in the Contextual Recognition of Cursive Script, " IEEE Transactions on Computers, Vol. C-24, Nr. 2, Februar 1975, Seiten 182–194. Dieser Aufsatz beschreibt die Verwendung von Trennungstechniken zwischen den Hauptteilen der Buchstaben und den Ober- und Unterlängen der Buchstaben als Teil eines Vorerkennungsschemas.Ehrich and Koehler, "Experiments in the Contextual Recognition of Cursive Script, "IEEE Transactions on Computers, Vol. C-24, No. 2, February 1975, pages 182-194. This Essay describes the use of separation techniques between the main parts of the letters and the ascenders and descenders of the Letters as part of a pre-recognition scheme.

US-A-3,996,557 (Donahey) beschreibt eine Technik, die der von Ehrich u.a. ähnlich ist.US-A-3,996,557 (Donahey) describes a technique similar to that of Ehrich et al. is similar.

US-A-3,133,266 (Frischkopf) beschreibt die Standardisierung in Y-Richtung, die Verwendung von Wörterbuchgegenüberstellungen zur Erkennung und Abschätzung der Wahrscheinlichkeit der Genauigkeit der Erkennung von einzelnen Wörtern.US-A-3,133,266 (Frischkopf) describes the standardization in the Y direction, the Use of dictionary contrasts for detection and estimation the probability of accuracy of detection of individual Words.

US-A-3,969,698 (Bollinger u.a.) beschreibt eine Vorrichtung zur nachträglichen Verarbeitung von Wörtern, die von einer Worterkennungsmaschine, einem Sprachanalysator oder einer standardmäßigen Tastatur falsch erkannt wurden.US-A-3,969,698 (Bollinger et al.) Describes a device for retrofitting Processing words, that of a word recognition engine, a language analyzer, or a standard keyboard incorrectly were detected.

US-A-4,610,025 (Blum u.a.) beschreibt die Isolation von Ober- und Unterlängen der Buchstaben als Bestandteil eines vorausgehenden analytischen Schrittes und die Isolation von Wörtern zur Identifikation.US-A-4,610,025 (Blum et al.) Describes the isolation of upper and lower lengths of the Letters as part of a previous analytical step and the isolation of words for identification.

US-A-4,731,857 (Tappert) und US-A-4,764,972 (Yoshida u.a) beschreiben die Wortisolation als Bestandteil eines Analyseverfahrens.US-A-4,731,857 (Tappert) and US-A-4,764,972 (Yoshida et al.) Describe word isolation as part of an analysis procedure.

US-A-4,933,977 und US-A-4,987,603 (Ohnishi u.a.) beschreiben die Elimination von fremden Zeichen in einem Eingabemuster sowie das Konzept der Erkennung von Elementen, die nichtvollständige Zeichen darstellen, z.B. gerade Striche, Bögen und Schleifen.US-A-4,933,977 and US-A-4,987,603 (Ohnishi et al.) Describe the elimination of foreign characters in an input pattern as well as the concept of recognizing elements that are not complete characters, eg straight lines, arcs and loops.

US-A-3,111,646 und US-A-3,127,588 (Harmon) beschreiben Systeme, die von Erkennungstechniken für die Extraktion charakteristischer Merkmale sowie Strichsequenzinformationen Gebrauch machen.US-A-3,111,646 and US-A-3,127,588 (Harmon) describe systems used by detection techniques for extraction characteristic features as well as bar sequence information usage do.

US-A-4,754,489 (Bosker) beschreibt ein System zur Erkennung von Buchstabengruppen, die als Digramms und Trigramms bezeichnet werden.US-A-4,754,489 (Bosker) describes a system for recognizing letter groups, which are called digrams and trigrams.

US-A-5,034,989 (Loh) beschreibt ein Verfahren zur Identifikation einzelner handgeschriebener Buchstaben.US-A-5,034,989 (Loh) describes a method for identifying individual handwritten ones Letters.

Aus GB-A-2087616 ist eine Vorrichtung sowie ein Verfahren zum Erzeugen einer alphanumerischen Ausgabe basierend auf Kurzschrift bekannt. Die auf einem Tablett 10 eingegebenen Kurzzeichen werden erkannt und auf einem Bildschirm dargestellt.Out GB-A-2087616 is an apparatus and method for generating an alphanumeric output based on shorthand known. The short characters entered on a tablet 10 are recognized and displayed on a screen.

Weitere Techniken zur computerbasierten Eingabe von Handschrift mittels Kurzzeichen sind aus US-A-5140645, US-A-4718102 sowie aus Kamel, K.; Imam, I. „A computerized transcription system for cursive shorthand writing" Southeastcon '88., IEEE Conference Proceedings, 11–13, Apr 1988, Pages: 336–339 bekannt.Further Techniques for computer-based input of handwriting by means of Abbreviations are from US-A-5140645, US-A-4718102 and camel, K .; Imam, I. "A computerized transcription system for cursive shorthand writing "Southeastcon '88., IEEE Conference Proceedings, 11-13, Apr 1988, Pages: 336-339 known.

Im Hinblick auf den Stand der Technik besteht die Aufgabe der folgenden Erfindung darin, ein Verfahren sowie ein System anzugeben, mit dem handgeschriebene Worte effizienter und zuverlässiger erkannt werden können.in the In view of the prior art, the object of the following The invention is to provide a method and a system with which handwritten words can be recognized more efficiently and reliably.

Diese Aufgabe wird gelöst durch den Gegenstand des Anspruchs 1 sowie 9.These Task is solved by the subject matter of claims 1 and 9.

Bevorzugte Ausführungsformen sind Gegenstand der Unteransprüche.preferred embodiments are the subject of the dependent claims.

Das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung für die Handschrifterkennung macht von einer Zwischenbeschreibungssprache für handgeschriebene Wörter Gebrauch, die aus Metastrichen zusammengesetzt ist. Metastriche sind Elemente oder Abschnitte einer Strichform, die benutzt werden, um einen Strich darzustellen. Ein Strich ist als zusammenhängendes Segment definiert, das beginnt, wenn der Stift die Oberfläche des Tableaus des Digitalisierers berührt und das endet, wenn der Stift von der Oberfläche abgehoben wird, wobei der Strich ein oder mehrere geschriebene Buchstaben umfaßt. Ein Kursivwort kann ein oder mehrere Striche umfassen, je nachdem, ob der Stift während des Schreibens des Wortes von der Oberfläche abgehoben wird oder nicht. Nach der Erfindung sind im allgemeinen wenigstens zwanzig Metastriche erforderlich, um das notwendige Vokabular oder einen Satz von zulässigen elementaren Strichformen zu bilden, obwohl nicht weniger als siebzig Metastriche benutzt werden können. Zusätzliche Metastriche verbessern die Erkennungsgenauigkeit der Erfindung auf Kosten einer wachsenden Rechenzeit. Die Techniken zur Interpretation der Eingabe-Metastrichsegmente als Wörter umfaßt das Vergleichen der Eingabe-Metastrichsegmente mit Metastrichsegmenten aus einem Wörterbuch von als Metastriche "geschriebenen" Wörtern und das Zuordnen eines Wahrscheinlichkeitswertes eines Übereinstimmungswertes für jedes so identifizierte Wort. Der zugeordnete Wert für die Wahrscheinlichkeit der Übereinstimmung wird als "Wortmaß" bezeichnet. Diese Technik umfaßt im einzelnen das Vergleichen der Eingabe mit jedem Wort in dem Wörterbuch, Metastrich für Metastrich, das Zuordnen einer Metastrichbewertung zu jeder Position, an der ein Metastrichübereinstimmung gefunden wurde, das Addieren der Bewertungen für die Metastrichübereinstimmungen für jedes so getestete Segment, um das Wortmaß zu erhalten, Anordnen der Wörter nach dem Wortmaß, indem die Wortmaße sowohl mit einem vorbestimmten Grenzwert als auch untereinander im Hinblick auf ihre Übereinstimmung verglichen werden, das Substituieren, Addieren und Löschen von Metastrichen in der Sequenz entweder gleichzeitig oder fortlaufend und dann das Vergleichen des so modifizierten Eingabe-Metastrichsegmentes mit dem Wörterbuch, um weitere Wortmaße zu erhalten, bis ein Wortmaß gefunden wurde, das den Grenzwertkriterien genügt. Wegen der unterschiedlichen Handschriften sind in jedem Wörterbuch normalerweise viele vordefinierte Metastrich-Beschreibungen ("Buchstabierungen") für jedes mögliche Wort abgelegt. Das erfindungsgemäße Verfahren umfaßt die Erkennung ganzer Wörter und nicht einzelner Buchstaben, wie von anderen vorgeschlagen worden ist. Anstelle des Durchsuchens, um ein handgeschriebenes Wort in einzelne Buchstaben zu zerlegen und anstelle des Suchens nach dem besten ersten Buchstaben, dann dem besten zweiten Buchstaben etc., macht die Erfindung von einem Verfahren des Berechnens von Rechenbewertungen der Übereinstimmungen Gebrauch. Für typische Metastrich-Sequenzen ist die Anzahl der möglichen Übereinstimmungen sehr groß und folglich umfaßt das erfindungsgemäße Verfahren das Addieren, Löschen und Substituieren, um sowohl den Umfang der Suche zu verringern als auch die Geschwindigkeit des Vergleichsverfahrens zu erhöhen.The handwriting recognizing method and apparatus of the present invention makes use of an intermediate description language for handwritten words composed of metastrokes. Metastrokes are elements or sections of a stroke that are used to represent a stroke. A stroke is defined as a contiguous segment that begins when the stylus touches the surface of the digitizer's tablet and ends when the stylus is lifted off the surface, the stroke comprising one or more written characters. A cursive word may include one or more dashes depending on whether the pen is lifted off the surface during the writing of the word or not. According to the invention, at least twenty metastrokes are generally required to form the necessary vocabulary or set of allowed elementary stroke shapes, although no less than seventy metastrokes can be used. Additional metastrokes improve the recognition accuracy of the invention at the expense of increasing computation time. The techniques for interpreting the input metastroke segments as words involves comparing the input metastroke segments with metastroke segments from a dictionary of words "written" as metastrokes, and assigning a probability value of a match value for each word thus identified. The assigned value for the likelihood of the match is called a "word measure". Specifically, this technique involves comparing the input with each word in the dictionary, metastroke for metastroke, assigning a metastroke score to each metastroke match position, adding the metastroke match scores for each segment so tested to the dictionary Word order, arranging the words by the word measure by comparing the word measures both with a predetermined threshold and with each other in terms of their match, substituting, adding and deleting metastrokes in the sequence either simultaneously or consecutively and then comparing the words thus modified input metastroke segment with the dictionary to obtain further word measures until a word measure satisfying the threshold criteria has been found. Because of the different manuscripts, each dictionary typically has many predefined metastroke descriptions ("spellings") for each possible word. The method of the invention involves the recognition of whole words and not individual letters as suggested by others. Instead of searching to decompose a handwritten word into individual letters and instead of searching for the best first letter, then the best second letter, etc., the invention makes use of a method of calculating arithmetic ratings of the data moods. For typical metastroke sequences, the number of possible matches is very large, and thus the inventive method involves adding, erasing, and substituting to both reduce the scope of the search and increase the speed of the comparison procedure.

In einer besonderen Ausführungsform der Erfindung umfaßt die Erkennungseinrichtung eine digitalisierende Tastatur zur Eingabe von Signalen mit Werten, die eine Sequenz von Punkten in einem Koordinatensystem mit Indizien von einem Anfangs- und einem Endpunkt darstellen, und eine Verarbeitungseinrichtung zum Durchführen von verschiedenen Funktionen mit den Signalen, die in einer dedizierten Computereinrichtung oder in einer Datenvorverarbeitungseinrichtung eines computerunterstützten Systems eingeschlossen sein kann. Die Vorverarbeitungseinrichtung kann die folgenden Verfahren durchführen: Das Unterteilen der Sequenz der zwischen dem Anfangs- und dem Endpunkt liegenden Punkte in Prüfwörter, Zeichenfolgen oder Segment, das Unterscheiden zwischen dem Anfangspunkt eines Wortsegmentes und dem eines einzelnen Wortes, das Kombinieren der Wortsegmente zur Bildung vollständiger Wörter, das Festsetzen einer unteren Basislinie und einer oberen Basislinie für das Prüfwort, um die Größe und den Maßstab des Prüfwortes festzustellen, das Rekonstruieren des Prüfwortes als ein rekonstruiertes Wort mit einer Ersatzsequenz von Punkten, wobei interpolierte Punkte eingefügt und falsche Punkte gelöscht werden, das Lokalisieren und Tabellieren von kritischen Punkten in dem rekonstruierten Wort in sequentieller Reihenfolge, wobei die Punkte Maxima, Minima, Schnittpunkte, Punkte und Kreuzungspunkte umfassen, das Wiedereinsetzen des rekonstruierten Wortes mit einer Sequenz von Metastrichen, die dem erfindungsgemäßen Metastrich-Vokabular entspricht, wobei jeder Metastrich ein Element eines handgeschriebenen Schriftzeichens darstellt. Dieser Wiedereinsetzungsschritt kann im einzelnen das Vergleichen der kritischen Punkte mit Indizien von bekannten kritischen Punkten umfassen, um eine vorläufige Metastrich-Sequenz für jedes rekonstruierte Wort zu erhalten. Demgemäß basiert die Erfindung auf dem Auswählen von vielen der am besten passenden Übereinstimmungen in einer Wahrscheinlichkeitsreihenfolge aus den Einträgen in einem zusammengestellte Einträge aus bekannten Metastrich-Sequenzvarianten umfassenden Wörterbuch mittels einer Matrix der Übereinstimmungswahrscheinlichkeit der einzelnen Metastriche. Dieser Auswahlschritt kann das Auswählen eines bevorzugten Metastrichs an ausgewählten Positionen in Abhängigkeit von einer Maximalbewertungsberechnung umfassen. Es kann eine Analyse auf i) einer Vorwärtssequenz der Metastriche, ii) einer Rückwärtssequenz der Metastriche und iii) der am besten passenden Wortanfänge und gleichzeitig der am besten passenden Wortenden durchgeführt werden. Die Maximalbewertungsberechnung kann eine Analyse der Gewichtung der Ergebnisse, der Additionen, der Löschungen und der Substitutionen der Metastriche in bezug auf die benachbarten Metastriche umfassen. Die Ergebnisse werden bevorzugt in der Form eines, möglicherweise auch in der Form von mehreren Prüfwörtern auf der Grundlage einer Liste der am besten passenden Übereinstimmungen aus dem Wörterbuch an eine Ausgabeeinrichtung abgegeben. Normalerweise wird eine positive Erkennung eines einzelnen Prüfworts angezeigt, wenn die Wahrscheinlichkeit der Übereinstimmungsfigur der Wertigkeit einen vorbestimmten Grenzwert überschreitet.In a particular embodiment of the invention the recognition device a digitizing keyboard for input of signals with values representing a sequence of points in a coordinate system represent with indicia of a start and an end point, and a processing device for performing various functions with the signals coming in a dedicated computer device or in a data preprocessing device of a computer-aided system can be included. The preprocessing device may be the perform the following procedures: Dividing the sequence between the start and end points lying points in test words, strings or segment, distinguishing between the starting point of a Word segment and that of a single word, combining the Word segments to form more complete words, setting a lower baseline and an upper baseline for the check word, around the size and the scale of the test word determine the reconstructing of the checkword as a reconstructed one Word with a replacement sequence of points, with interpolated points added and false points deleted be, locating and tabulating critical points in the reconstructed word in sequential order, where the points maxima, minima, intersections, points and crossing points include reinstating the reconstructed word with a Sequence of metastrokes corresponding to the metastroke vocabulary according to the invention, wherein each metastroke is an element of a handwritten character represents. This re-insertion step can be described in detail Compare the critical points with indicia of known critical points include a preliminary Metastroke sequence for each to get reconstructed word. Accordingly, the invention is based on selecting of many of the best matching matches in a probability order from the entries in a compiled entries Dictionary of known metastatic sequence variants by means of a matrix of the match probability the individual metastasis. This selection step may include selecting one preferred metastroke at selected positions depending from a maximum score calculation. It can be an analysis on i) a forward sequence the metastroke, ii) a backward sequence the metastrokes and iii) the best fitting word beginnings and at the same time the best matching word ends are performed. The maximum score calculation may be an analysis of the weighting results, additions, deletions and substitutions include the metastrokes with respect to the neighboring metastases. The results are preferably in the form of, possibly also in the form of several test words based on a list of the most appropriate matches from the dictionary delivered to an output device. Normally a positive Detection of a single test word displayed when the probability of the correspondence figure of significance exceeds a predetermined limit.

In einer besonderen Ausführungsform kann das Verfahren das Messen der durchschnittlichen Neigung von Punktsequenzen jedes Prüfwortsegments und das Teilen des Prüfwortsegments entlang horizontaler Grenzen in eine mittlere Zone zwischen einer unteren und einer oberen Basislinie umfassen, wobei angenommen wird, daß sich die Körper der Buchstaben in einem oberen Bereich, in dem die Oberlängen der Buchstaben angenommen werden, und in einem unteren Bereich befinden, in dem die Unterlängen der Buchstaben angenommen werden. Diese Größeninformation unterstützt in Verbindung mit der durch die Identifikation der Metastriche erlangten Konturinformation das Wörterbuch darin, den Wert jedes Metastrichs an einer Position in einer Sequenz von akzeptablen Metastrichen in dem Wörterbuch zu bestimmen. Die Größeninformation ist auch als Teil der Korrelation gewichtet.In a particular embodiment The procedure may be measuring the average slope of Point sequences of each check word segment and dividing the check word segment along horizontal boundaries into a middle zone between one lower and upper baseline, assuming that yourself the body the letter in an upper area where the ascenders of the Letters be adopted and located in a lower area, in which the descenders the letters are accepted. This size information supports in conjunction with the contour information obtained by the identification of the metastrokes the dictionary in it, the value of each metastroke at a position in a sequence of acceptable metastrokes in the dictionary. The size information is also weighted as part of the correlation.

Unter Bezugnahme auf die nachfolgende detaillierte Beschreibung in Verbindung mit den zugehörigen Zeichnungen wird die Erfindung besser verständlich und weitere Details der Aspekte der Erfindung werden deutlich.Under Reference is made to the following detailed description in conjunction with the accompanying drawings The invention will be better understood and further details of aspects of the invention will become apparent.

FIGURENKURZBESCHREIBUNGBRIEF DESCRIPTION

1 zeigt ein Blockdiagramm des allgemeinen erfindungsgemäßen Erkennungssystems. 1 shows a block diagram of the general detection system according to the invention.

2 zeigt ein Blockdiagramm der Funktionselemente der Erfindung. 2 shows a block diagram of the functional elements of the invention.

3 zeigt eine Tabelle, welche die Metastriche entsprechend einer bevorzugten Ausführungsform der Erfindung veranschaulicht. 3 Figure 14 shows a table illustrating the metastrokes according to a preferred embodiment of the invention.

4 zeigt ein erstes Flußdiagramm des erfindungsgemäßen Verfahrens. 4 shows a first flow chart of the method according to the invention.

5 zeigt ein zweites Flußdiagramm des erfindungsgemäßen Verfahrens. 5 shows a second flowchart of the method according to the invention.

6A zeigt eine Darstellung des handgeschriebenen Wortes "may". 6A shows a representation of the handwritten word "may".

6B zeigt eine mögliche Metastrich-Sequenz, die auf dem Wort "may" in 6A beruht. 6B shows a possible metastroke sequence based on the word "may" in 6A based.

7 zeigt eine mögliche Wörterbuch-Schreibweise des Wortes "may". 7 shows a possible dictionary spelling of the word "may".

8 zeigt eine mögliche Korrelationsmatrix für das Wort "may". 8th shows a possible correlation matrix for the word "may".

9 zeigt eine Darstellung einer Metastrichproben-Merkmalkorrelationstabelle von Daten für Substitutionen, um eine Eingabesequenz einer Vokabelsequenz in ihrem Aussehen anzupassen. 9 Figure 12 is a representation of a metastroke feature correlation table of data for substitutions to adapt an input sequence to a vocabulary sequence in appearance.

10A veranschaulicht Probenerschwerungen für die Addition von ausgewählten Metastrichen, um eine Eingabesequenz in ihrem Aussehen an eine Vokabelsequenz anzupassen. 10A illustrates sample additions for the addition of selected metastrokes to match an input sequence in appearance to a vocabulary sequence.

10B veranschaulicht Probenerschwerungen zum Löschen von ausgewählten Metastrichen, um eine Eingabesequenz in ihrem Aussehen an eine Vokabelsequenz anzupassen. 10B illustrates sample scratches for deleting selected metastrokes to match an input sequence in appearance to a vocabulary sequence.

11 ist eine Darstellung einer Größenkorrelationstabelle entsprechend der Tabelle von 9, um in Substitutionen eine Eingabesequenz ihrem Aussehen nach an eine Vokabelsequenz anzupassen. 11 FIG. 12 is an illustration of a size correlation table corresponding to the table of FIG 9 to adapt an input sequence to a vocabulary sequence in substitutions.

12A zeigt Probengrößenerchwerungen entsprechend der Tabelle von 10A, um in Additionen eine Eingabesequenz ihrem Aussehen nach an eine Vokabelsequenz anzupassen. 12A shows sample size gains according to the table of 10A to match in additions an input sequence in appearance to a vocabulary sequence.

12B zeigt Probengrößenerschwerungen entsprechend der Tabelle von 10B, um in Löschungen eine Eingabesequenz ihrem Aussehen nach einer Vokabelsequenz anzupassen. 12B shows sample size reductions according to the table of 10B to customize an input sequence in erasures according to a vocabulary sequence.

13 zeigt eine vollständige Metastrich-Merkmalkorrelationstabelle von Daten für Gewichte für Substitutionen, um eine Eingabesequenz ihrem Aussehen nach einer Vokabelsequenz anzupassen, für Erschwerungen für Additionen (Spalte 1) und für Erschwerungen für Löschungen (Reihe 1), die das Ähnlichkeitsmaß für die Metastriche für eine Ausführungsform der Erfindung definieren. 13 Figure 15 shows a complete metastroke correlation table of weight substitution data to fit an input sequence in appearance to a vocabulary sequence, for addition (column 1) and deletion complications (row 1) aggravation measures, for the metastroke similarity measure for one embodiment to define the invention.

14 zeigt eine vollständige Größenkorrelationstabelle für die Ausführungsform entsprechend der Merkmalkorrelationstabelle von 13, welche die Gewichte und Erschwerungen für Substitutionen, Additionen (Spalte 1) und Löschungen (Reihe 1) veranschaulicht, um eine Eingabesequenz ihrem Aussehen nach einer Vokabelsequenz anzupassen. 14 FIG. 12 shows a complete magnitude correlation table for the embodiment according to the feature correlation table of FIG 13 which illustrates the weights and aggravations for substitutions, additions (column 1) and deletions (row 1) to adapt an input sequence to a vocabulary sequence in appearance.

BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMENDESCRIPTION THE PREFERRED EMBODIMENTS

1 zeigt die erfindungsgemäße Erkennungseinrichtung 10 für kursive Handschrift. Die Einrichtung 10 weist zunächst als Eingabeeinrichtung eine Digitalisierungstastatur 12 oder einen ähnlichen Mechanismus auf, der in Abhängigkeit von der Eingabe mittels eines Stiftes 14 als Ausgang "Eingabesignale" erzeugt, die charakteristische Werte für eine Sequenz von Punkten haben, welche die Handschrift in einem Koordinatensystem symbolisieren, das durch den Digitalisierer zusammen mit einem Symbol oder einer Anzeige des Anfangs- und Endpunktes jeder Sequenz von Punkten definiert ist. Das Signal für den Anfangspunkt und den Endpunkt kann einfach ein negativer Wert sein, der automatisch dann generiert wird, wenn der Stift 14 von dem Digitalisierer 12 abgehoben wird. Die X-Y-Koordinaten-Punktesequenz wird an eine Eingabeschnittstelle gelegt, welche die Werte dieser Koordinatenpunkte wiederum an eine Eingabepuffereinrichtung 18 abgibt. Die Eingabepuffereinrichtung 18 bewirkt eine vorübergehende oder systemunabhängige Speicherung, während die Eingabesequenz verarbeitet wird. Die Einrichtung 10 umfaßt ferner einen Prozessor 20 mit einer zugehörigen Programmspeichereinrichtung 22, z.B. einen Festspeicher (ROM), und eine innerprozessuale Speichereinrichtung 24, z.B. einen Direktzugriffsspeicher (RAM). Zwischen dem Prozessor 20 und der innerprozessualen Speichereinrichtung 24 und der Programmspeichereinrichtung 22 sind Kontroll- und Datenleitungen vorgesehen. Die Programmspeichereinrichtung 22 dient zum permanenten oder semipermanenten Speichern von ausführbaren Computerprogrammen, einer Merkmaltabelle zur Identifikation der Metastriche, wie nachfolgend beschrieben wird, sich auf die Metastriche beziehende Korrelationsmatrizen oder Tabellen und Wörterverzeichnisse von Metastrichen zur Identifikation von Worten etc.. 1 shows the detection device according to the invention 10 for italic handwriting. The device 10 initially has as an input device a digitizing keyboard 12 or a similar mechanism depending on the input by means of a pen 14 generates as output "input signals" having characteristic values for a sequence of dots symbolizing the handwriting in a coordinate system defined by the digitizer together with a symbol or a display of the start and end points of each sequence of dots. The signal for the starting point and the end point can simply be a negative value that is automatically generated when the pen 14 from the digitizer 12 is lifted. The XY coordinate point sequence is applied to an input interface which in turn sends the values of these coordinate points to an input buffer device 18 emits. The input buffer device 18 causes temporary or system independent storage while the input sequence is being processed. The device 10 further includes a processor 20 with an associated program storage device 22 , eg a read only memory (ROM), and an intra-process memory device 24 , eg a random access memory (RAM). Between the processor 20 and the intra-process storage device 24 and the program storage device 22 Control and data lines are provided. The program storage device 22 is used for permanent or semi-permanent storage of executable computer programs, a metastroke identification feature table, as described below, metastatic correlation matrices or tables and dictionaries of metastrokes for identifying words, etc.

Die innerprozessuale Speichereinrichtung 24 dient zur Zwischenspeicherung von Prüfwörtern, die von den Eingabedaten abgeleitet werden, von aus den Wörtern berechneten Basislinien, von rekonstruierten auf Interpretation und Normalisierung beruhenden Wörtern sowie von anderen verwandten Prozessen, von kritischen Punkten der rekonstruierten Wörter für den Vergleich mit den Merkmalen, von den Merkmaltabellen abgeleiteten Metastrichsequenzen, als Ergebnis der Maximalbewertungsberechnungen erzeugten Ersatz-Metastrichsequenzen und Figuren der Wertigkeit von verschiedenen aus den Korrelationstabellen entwickelten Maximalbewertungsberechnungen. Der Prozessor 20 führt die Programme der Programmspeichereinrichtung 22 aus, um schließlich eine Wortidentifikation oder ein Wort zu erzeugen, das an ein Ausgabegerät oder eine Ausgabeschnittstelle 26 geliefert werden soll.The intra-process storage device 24 It is used for caching check words derived from the input data, baselines calculated from the words, reconstructed words based on interpretation and normalization, and other related processes, critical points of the reconstructed words for comparison with the features, feature tables derived metastroke sequences, as a result of the maximum scoring computations generated substitute metastroke sequences and figures of significance of various maximum scoring calculations developed from the correlation tables. The processor 20 executes the programs of the program storage device 22 Finally, to generate a word identification or word that can be sent to an output device or an output interface 26 should be delivered.

2 zeigt in einer detaillierteren Darstellung die funktionalen Elemente der erfindungsgemäßen Einrichtung 10. Über die Eingabeschnittstelle 16 gibt der Digitalisierer 12 die Startmarke, die Stoppmarke und die Positionsdaten an die Puffereinrichtung 18 aus. Die Eingabepuffereinrichtung 18 kann die Grenzen eines Prüfwortes mittels der Start- und Stoppmarken identifizieren, welche eine Unterbrechung in der Dateneingabesequenz anzeigen. Die Eingabepuffereinrichtung 18 kann auch die Grenzen eines Prüfwortsegments durch den Vergleich der Länge von verschiedenen Datensequenzunterbrechungen identifizieren, wobei festgestellt wird, welche Unterbrechungen eine Wortunterbrechung und welche Unterbrechungen eine Unterbrechung innerhalb eines Wortes anzeigen. Die Einrichtung 28 ist vorgesehen, um eine Orientierung festzulegen und insbesondere um die Richtung der Schrift derart zu bestimmen, daß die Schrift parallel zu einer horizontalen Referenz ausgerichtet ist. 2 shows in a more detailed representation of the functional elements of the device according to the invention 10 , Via the input interface 16 gives the digitizer 12 the start mark, the stop mark and the position data to the buffer device 18 out. The input buffer device 18 can identify the boundaries of a checkword by means of the start and stop flags indicating an interrupt in the data entry sequence. The input buffer device 18 can also identify the boundaries of a check word segment by comparing the length of different data sequence breaks, determining which interrupts indicate a word break and which breaks indicate a break within a word. The device 28 is intended to provide orientation and, in particular, to determine the direction of the writing so that the writing is aligned parallel to a horizontal reference.

Die Einrichtung 30 ist entsprechend vorgesehen, um das Prüfwort (als ein "rekonstruiertes Wort") mit einer Ersatzsequenz von Punkten zu rekonstruieren. Die Ersatzsequenz von Punkten kann in dem Prüfwort an interpolierten Stellen eingesetzte Punkte und aus dem Prüfwort gelöschte falsche Punkte umfassen. Falsche Punkte sind derartige Punkte, die keine Beziehung zu irgendeiner Sequenz von Strichen haben, weder als eine Fortsetzung eines Segmentes noch als ein Punkt, z.B. als eine Periode oder ein Betonungsmerkmal.The device 30 is suitably provided to reconstruct the checkword (as a "reconstructed word") with a replacement sequence of points. The replacement sequence of points may include points inserted in the checkword at interpolated locations and false points deleted from the checkword. False points are such points which have no relation to any sequence of strokes, neither as a continuation of a segment nor as a point, eg as a period or an accentuating feature.

Die Einrichtung 32 ist entsprechend vorgesehen, um eine untere Basislinie und eine obere Basislinie für jedes Prüfwort zur Bestimmung der Größe und des Maßstabes festzulegen. Die Basislinien-Feststellungseinrichtung 32 umfaßt eine Einrichtung zum horizontalen Aufteilen des Prüfwortes in einen mittleren Bereich zwischen einer unteren Basislinie und einer oberen Basislinie, die durch das Prüfen z.B. der Dichte der Punkte ober- und unterhalb jeder Basislinie berechnet werden und kennzeichnet den Raum oberhalb der Basislinie als Oberlängen der Buchstaben und kennzeichnet den Bereich unterhalb der Basislinie als Unterlängen der Buchstaben. Das Element 32 umfaßt ferner eine Einrichtung zum Messen der Durchschnittsneigung der ausgewählten Punktsequenzen, wie beispielsweise durch die durchschnittliche Trajektorie jeder der ausgewählten Ober- bzw. Unterlängen in der Ober- bzw. Unterlängenzone bestimmt sind. Die Einrichtung 32 umfaßt auch eine Einrichtung zum Normalisieren der Daten in einen gewünschten Maßstab.The device 32 is similarly provided to establish a lower baseline and an upper baseline for each checkword to determine magnitude and scale. The baseline detection device 32 comprises means for horizontally dividing the checkword into a middle region between a lower baseline and an upper baseline calculated by examining, for example, the density of points above and below each baseline, and characterizing the space above the baseline as ascenders of the letters and indicates the area below the baseline as descenders of the letters. The element 32 further comprises means for measuring the average slope of the selected point sequences as determined, for example, by the average trajectory of each of the selected descenders in the upper and lower length zones, respectively. The device 32 also includes means for normalizing the data to a desired scale.

Die Einrichtung 32 liefert ihre Daten dann an eine Lokalisierungseinrichtung 34 für kritische Punkte. Die Aufgabe der Lokalisierungseinrichtung 34 für kritische Punkte liegt darin, alle relevanten kritischen Punkte in dem rekonstruierten Wortsegment, das durch den Punktinterpolator 32 erzeugt wird, in sequentieller Reihenfolge zu lokalisieren und tabellieren. Kritische Punkte sind beispielsweise Maxima, Minima, Schnittpunkte von Liniensegmenten, Punkte und Kreuzungspunkte. Die so tabellierten kritischen Punkte können dann mit einer Tabelle verglichen werden, die Metastriche identifizierende bekannte kritische Punkte enthält.The device 32 then delivers its data to a localization facility 34 for critical points. The task of the localization facility 34 for critical points lies in getting all relevant critical points in the reconstructed word segment through the point interpolator 32 is generated, in a sequential order to locate and tabulate. Critical points are, for example, maxima, minima, intersection points of line segments, points and crossing points. The critical points thus tabulated can then be compared to a table containing known metastrophic critical points.

Eine Metastrich-Erkennungseinrichtung 36 ist gemäß der Erfindung vorgesehen, welche die als kritische Punkte herausgestellten Merkmale verarbeitet und ein rekonstruiertes Wortsegment durch eine Zeichenfolge von Metastrich-Identifizierungscodierungen ersetzt. Im allgemeinen bilden wenigstens zwanzig Metastriche das erforderliche Vokabular oder den erforderlichen Satz von zulässigen Strichelementformen, obwohl nicht weniger als siebzig Metastriche benutzt werden können. Zusätzliche Metastriche verbessern die Erkennungsgenauigkeit der Erfindung. In einer bevorzugten Ausführungsform gibt es dreiunddreißig unterschiedlich definierte Metastriche oder Kursivschriftmerkmale.A metastroke recognizer 36 is provided according to the invention, which processes the features identified as critical points and replaces a reconstructed word segment with a string of metastroke identification codes. In general, at least twenty metastrokes make up the required vocabulary or set of allowed primitive shapes, although not less than seventy metastrokes can be used. Additional metastrokes improve the recognition accuracy of the invention. In a preferred embodiment, there are thirty-three differently defined metastrokes or italic features.

3 zeigt eine Tabelle von Metastrichen mit ihren Definitionen für die bevorzugte Ausführungsform. Diese Metastriche sind entsprechend der Erfindung festgelegt worden, um englischsprachige Wörter in einem computergespeicherten Wörterbuch identifizieren zu können. 3 shows a table of metastrokes with their definitions for the preferred embodiment. These metastrokes have been established in accordance with the invention to identify English-language words in a computer-stored dictionary.

In der Tabelle von 3 sind die folgenden Metastriche identifiziert:
ein Strich mit einer breiten Unterbrechung,
ein "wild card" Strich, der alles bedeuten kann,
ein allgemeiner horizontaler Strich,
ein Maximalmerkmal,
ein Minimalmerkmal,
ein Winkel ohne Schleife,
ein Strich mit einer schmalen Unterbrechung,
ein Punkt, der beispielsweise eine Periode repräsentiert,
ein Kreuzungspunkt,
ein rückwärts nach oben gerichteter Bogen mit einem freien Ende am Bogenanfang,
ein rückwärts nach oben gerichteter Bogen mit einem freien Ende am Bogenende,
ein rückwärts nach oben gerichteter Bogen ohne freies Ende,
ein mit entgegen dem Uhrzeigersinn gerichteten Strichen gezeichnetes umgekehrtes Gamma,
ein mit entgegen dem Uhrzeigersinn gerichteten Strichen gezeichneter Kreis,
ein mit einem im Uhrzeigersinn gerichteten Strich gezeichnetes Gamma,
ein vorwärts nach unten gerichteter Bogen ohne freies Ende,
ein vorwärts nach unten gerichteter Bogen mit einem freien Ende am Anfang,
ein vorwärts nach unten gerichteter Bogen mit einem freien Ende an seinem Ende,
ein vorwärts nach oben gerichteter Bogen mit einem freien Ende an seinem Ende,
ein vorwärts nach oben gerichteter Bogen mit einem freien Ende an seinem Anfang,
ein vorwärts nach oben gerichteter Bogen ohne ein freies Ende,
ein im Uhrzeigersinn gezeichnetes umgekehrtes Gamma,
ein im Uhrzeigersinn gezeichneter Kreis,
ein im Uhrzeigersinn gezeichnetes Gamma,
ein rückwärts nach unten gerichteter Bogen ohne ein freies Ende,
ein rückwärts nach unten gerichteter Bogen mit einem freien Ende an seinem Anfang,
ein rückwärts nach unten gerichteter Bogen mit seinem freien Ende am Anfang,
irgendein nach links gerichteter oder horizontaler Bogen,
irgendein nach rechts gerichteter oder horizontaler Bogen,
eine allgemeine vertikale Komponente,
ein allgemeiner Bogenabschnitt an dem am weitesten links liegenden Ende von einem Segment, und
ein nach unten gerichteter Bogen irgendeiner Richtung und ein Bogenabschnitt am weitesten rechts liegenden Ende von irgendeinem Wortsegment.
In the table of 3 the following metastases are identified:
a dash with a wide interruption,
a "wild card" stroke that can mean anything
a general horizontal line,
a maximum feature,
a minimal feature,
an angle without a loop,
a dash with a small interruption,
a point that represents a period, for example,
a crossing point,
a backward upward bow with a free end at the beginning of the bow,
a backward upward bow with a free end at the bow end,
a backward upward bow without free end,
an inverted gamma drawn in counterclockwise strokes,
a circle drawn in counterclockwise strokes,
a gamma drawn with a clockwise stroke,
a forward bow, with no free end,
a forward bow with a free end at the beginning,
a forward bow with a free end at its end,
a forward bow with a free end at its end,
a forward bow with a free end at its beginning,
a forward bow without a free end,
a clockwise inverse gamma,
a circle drawn in a clockwise direction,
a clockwise drawn gamma,
a backward down bow without a free end,
a backward bow with a free end at its beginning,
a backward-looking bow with its free end at the beginning,
any left or horizontal arc,
any right-handed or horizontal arc,
a general vertical component,
a general arc portion at the leftmost end of a segment, and
a downward arc of any direction and an arc portion of the rightmost end of any word segment.

Die durch die Metastrich-Erkennungseinrichtung 36 erzeugte Metastrichcode-Zeichenfolge (nachfolgend als Metastrich-Zeichenfolge bezeichnet) wird nach der Erfindung einem Worterkennungsteilsystem 38 zugeführt, um die Worte in einer speziellen Sprache zu erkennen, z.B. Englisch. Die Verarbeitungsweise von einem dieser Elemente wird nachfolgend im einzelnen erläutert. Die Elemente des Worterkennungsteilsystems 38 umfassen eine auf einem "ganzen Wort" basierende Analysatoreinrichtung 44 zur Durchführung einer Maximalbewertungsanalyse in dynamischen Programmierungsprozeduren, wie nachfolgend erklärt wird, um eine optimale Übereinstimmung zwischen einer Zeichenfolge von Eingabe-Metastrichen und einer ein bekanntes ganzes Wort bildende "Vokabular"-Metastrichzeichenfolge zu erhalten. Das Teilsystem 38 kann also wahlweise eine auf "Buchstaben" beruhende Analysatoreinrichtung 42 zum Analysieren von Metastrichen durch Buchstaben (alphanumerische Zeichen) umfassen. Einige von diesen auf Buchstaben beruhenden Analysatoreinrichtungstypen 42 sind in Verbindung mit einer auf Buchstaben oder aufgeteilten Zeichenfolgen basierenden Erkennung bekannt. Eine derartige Analyse darf nicht mit den auf ganzen Worten basierenden Analysiertechniken verwechselt werden, die nachfolgend beschrieben werden.The through the metastroke recognizer 36 generated metastroke code string (hereinafter referred to as metastroke string) is according to the invention a word recognition subsystem 38 supplied to recognize the words in a specific language, eg English. The processing of one of these elements will be explained in detail below. The elements of the word recognition subsystem 38 comprise a "whole word" based analyzer device 44 for performing maximum evaluation analysis in dynamic programming procedures, as explained below, to obtain an optimal match between a string of input metastrokes and a known whole word "vocabulary" metastroke string. The subsystem 38 Thus, optionally, a based on "letter" analyzer 42 for analyzing metastrokes by letters (alphanumeric characters). Some of these letter based analyzer facility types 42 are known in conjunction with a letter or split string based recognition. Such analysis should not be confused with the word-based analysis techniques described below.

Die auf Buchstaben basierende Analysatoreinrichtung 42 kann in Kombination oder Ergänzung mit der auf ganzen Wörtern beruhenden Analysatoreinrichtung 44 arbeiten. Die Worterkennungseinrichtung 38 kann z.B. ein gespeichertes Wörterverzeichnis von ganzen Wörtern umfassen, die Metastriche in direkter und in umgekehrter Reihenfolge aufweisen.The letter based analyzer device 42 may be combined or supplemented with the whole word based analyzer device 44 work. The word recognition device 38 may include, for example, a stored dictionary of whole words that have metastrokes in direct and reverse order.

Die auf Buchstaben beruhende Analysatoreinrichtung 42 kann in Prozeduren, die unabhängig und parallel zu der auf ganzen Wörtern beruhenden Analysatoreinrichtung arbeiten, einige von denselben Wörterbucheinträgen wie die auf ganzen Wörtern beruhende Analysatoreinrichtung 44 heranziehen, um zu versuchen, die Zeichen als eine Zeichenfolge von Buchstaben zu erkennen, die sinnvolle Wörter bilden.The letter based analyzer device 42 For example, in procedures that operate independently and in parallel with the whole word based analyzer, some of the same dictionary entries may be used as the whole word based analyzer 44 to try to recognize the characters as a string of letters that make meaningful words.

Die Ausgabe der Worterkennungseinrichtung 38, die eine Form haben kann, die der besten Auswahl aus verschiedenen Auswertungsprozeduren entspricht, wird an ein Wortausgabegerät 26 geliefert, wie zuvor erwähnt wurde.The output of the word recognition device 38 that can have a shape that's the best choice from different evaluation procedures is sent to a word output device 26 delivered as previously mentioned.

4 zeigt ein Flußdiagramm von erfindungsgemäßen Programmabläufen zwischen der Eingabe und Ausgabe der Metastrich-Erkennungseinrichtung 36. Nach der Erfindung wird die Eingabesequenz als eine Zeichenfolge von X und Y Koordinatenwerten für Punkte zusammen mit einem Start- und Stoppanzeiger (Schritt A) gebildet, dann wird aus der von dem Eingabegerät (Schritt B) erhaltenen Eingabezeichenfolge eine abgegrenzte Zeichenfolge als ein ganzes Prüfwort ausgewählt; danach wird die Richtung der Schrift festgelegt und das Prüfwort wird "rotiert" (orientiert in seinem Referenzrahmen), um die Schrift parallel zu einer horizontalen Referenz auszurichten (Schritt C). Dann wird das Prüfwort als ein rekonstruiertes Wort rekonstruiert, um die falschen Punkte zu entfernen und fehlende Punkte hinzuzufügen (Schritt D). Daraufhin werden eine untere Basislinie und eine obere Basislinie festgelegt (Schritt E), und das Prüfwort wird normalisiert (Schritt F). 4 shows a flowchart of program flows according to the invention between the input and output of the metastroke detection device 36 , According to the invention, the input sequence is formed as a string of X and Y coordinate values for dots together with a start and stop indicator (step A), then a delimited string is selected as a whole check word from the input string obtained from the input device (step B) ; then the direction of the font is set and the check word is "rotated" (oriented in its frame of reference) to align the font parallel to a horizontal reference (step C). Then the check word is reconstructed as a reconstructed word to remove the wrong points and add missing points (step D). Thereafter, a lower base line and an upper base line are set (step E), and the check word is normalized (step F).

Danach werden die kritischen Punkte in der Sequenz von Punkten lokalisiert (Schritt G). Sowohl die kritischen Punkte, z.B. Maxima, Minima und Schnittpunkte, als auch die Reihenfolge der kritischen Punkte sind für die Identifikation der Metastriche und der Reihenfolge der Metastriche nützlich. Die kritischen Punkte werden dann zulässigen Vokabular-Metastrichen gegenübergestellt, um die Zeichenfolge der Eingabe-Metastriche zu identifizieren, die zum "Schreiben" eines Prüfwortes herangezogen werden (Schritt H). Schritt H wird für jeden kritischen Punkt des Eingabewortes so lange wiederholt, bis alle kritischen Punkte den Metastrichen gegenübergestellt wurden (Schritt I). Das Ergebnis ist eine Zeichenfolge von Eingabe-Metastrichen, die zum "Schreiben" des Prüfwortes benutzt wird. Die Metastrich-Zeichenfolge wird dann für die weitere Verarbeitung tabelliert (Schritt J).After that the critical points are located in the sequence of points (Step G). Both the critical points, e.g. Maxima, minima and Intersections, as well as the order of critical points are for identification the metastrokes and the order of the metastases. The critical points then become permissible vocabulary metastrokes faced, to identify the string of input metastrokes that for "writing" a test word are used (step H). Step H will work for everyone critical point of the input word repeated until all critical points were confronted with the metastases (step I). The result is a string of input metastrokes that for "writing" the test word is used. The metastroke string will then be for the further processing is tabulated (step J).

5 zeigt ein Flußdiagramm für einen Teil des erfindungsgemäßen auf ganzen Wörtern beruhenden Analysatorsystems 44. In diesem Verfahren werden Wörter in dem Wörterbuch ausgeschlossen, so daß sie nicht weiter analysiert werden brauchen. Die Tests erfolgen in dem Prozeß zunächst unter Verwendung des direkten Vokabulars (die Vorwärtsrichtung) und dann unter Verwendung des entgegengesetzten Vokabulars (in der Rückwärtsrichtung). 5 FIG. 10 is a flowchart for a portion of the whole word based analyzer system of the present invention. FIG 44 , In this method, words in the dictionary are excluded so that they need not be further analyzed. The tests are done in the process first using the direct vocabulary (the forward direction) and then using the opposite vocabulary (in the backward direction).

Zuerst wird ein "leeres" Wort erzeugt (Schritt K) und in einen Puffer (Schritt L) abgelegt. Ein "leeres" Wort ist ein "Null"-Satz, d.h. ein Wort, das alle Merkmale von Wörtern hat, aber keine Bedeutung hat. Es ist ein Platzhalter, so wie Null ein Platzhalter in einem initialisierten Speicherregister ist.First an empty word is generated (step K) and stored in a buffer (step L). An "empty" word is a "null" sentence, i. a word, all the features of words has, but has no meaning. It's a placeholder, like zero is a wildcard in an initialized memory register.

Der Inhalt des Wortpuffers wird dann getestet, um zu sehen, ob der Wortpuffer leer ist (Schritt M). Falls der Wortpuffer nicht leer ist, wird der nächste Eintrag (die das Prüfwort darstellende Zeichenfolge) aus dem Wortpuffer für die Auswertung gegenüber dem Wörterbuch herausgefunden (Schritt N). Dies findet immer dann statt, wenn eine Eingabezeichenfolge von dem Eingabegerät in dem Wortpuffer abgelegt ist. Unter Verwendung des Wörterverzeichnisses von ganzen Wörtern als Quelle, wird dann eine Liste von allen ("n") möglichen Wörtern kompiliert, die Prüfwörter sind, welche mit dem letzten aus dem Wortpuffer herausgefundenen Eintrag übereinstimmen (Schritt O). Die kompilierte Liste wird dann getestet, um sicher zu sein, daß diese nicht leer ist (Schritt P). (Die Liste kann am Anfang leer sein, wenn der oben erwähnte Test der kritischen Punkte durchgeführt worden ist und keine Übereinstimmungen gefunden wurden. Die Liste kann auch am Ende der auf ganzen Wörtern beruhenden Analyse leer sein, wenn die Liste verbraucht worden ist.) Nach dem Testen zur Bestimmung, daß diese Liste nicht leer ist, wird das "nächste" Vokabularwort in der Liste herausgefunden, um in der Analyse gegenüber dem herausgefundenen Eintrag, d.h. gegenüber dem aus dem Wortpuffer herausgefundenen Eingabeprüfwort, verwendet zu werden (Schritt Q). Das wiederaufgefundene Vokabularwort wird als ganzes Wort mit dem herausgefundenen Eingabeeintrag nach der Erfindung durch die nachfolgend erläuterten dynamischen Programmierungstechniken verglichen, aus denen ein "optimaler Kostenwert" oder eine Maximalbewertung abgeleitet wird, um den Grad der Übereinstimmung zwischen dem Eingabeprüfwort und dem Vokabelwort zu bestimmen (Schritt R). Die Schritte P bis R werden wiederholt, bis die Liste erschöpft ist (Schritt P) oder bis die Maximalbewertung gewissen Akzeptabilitätskriterien genügt (Schritt S). Falls die Liste geleert ist, wird ein Signal "keine Übereinstimmung" ("no match" signal) erzeugt und der Prozeß wird fortgesetzt, indem nach dem nächsten Wort in dem Eingabewortpuffer Ausschau gehalten wird. Falls die Akzeptanzkriterien erfüllt sind, was auch immer für Akzeptanzkriterien dann anwendbar sind, wird das Wort an den Wortausgabepuffer (Schritt T) zur weiteren Verendung, z.B. zur Anzeige oder zur Verarbeitung abgegeben. Der Prozeß geht dann zu der nächsten Eingabe-Metastrichsequenz in dem Eingabepuffer über (Schritte K und L).Of the Content of the word buffer is then tested to see if the word buffer is empty (step M). If the word buffer is not empty, then the next Entry (containing the check word representing string) from the word buffer for evaluation against the dictionary found out (step N). This always happens when one Input string stored by the input device in the word buffer is. Using the dictionary of whole words as a source, then becomes a list of all ("n") compiled possible words, the test words are, which match the last entry found from the word buffer (Step O). The compiled list is then tested to be safe to be that is not empty (step P). (The list may be empty at the beginning, if the above mentioned Test of critical points has been done and no matches were found. The list can also be at the end of the whole words Analysis will be empty if the list has been used up.) After the Testing to determine that this List is not empty, the "next" vocabulary word in the list figured out in the analysis against the found entry, i. opposite to the word buffer found input check word, to be used (step Q). The retrieved vocabulary word is reflected as a whole word with the input entry found out of the invention by the dynamic programming techniques explained below compared, from which an "optimal Cost value "or a maximum rating is derived to match the degree of agreement between the input test word and the vocabulary word (step R). The steps P to R are repeated until the list is exhausted (step P) or until the maximum rating meets certain acceptance criteria (step S). If the list is cleared, a signal "no match" is generated and the process becomes continued by following the next Word in the input word buffer. if the Acceptance criteria met are, whatever for Acceptance criteria are then applicable, the word is sent to the word output buffer (Step T) for further use, e.g. for display or processing issued. The process then goes to the next Input metastroke in the input buffer via (Steps K and L).

Der Schritt der Berechnung der optimalen Anpassung umfaßt zwei Eingaben: Die Eingabesequenz von Metastrichen, die eine Zeichenfolge für ein Wort bilden und das Muster oder die Zeichenfolge von ein bekanntes Wort darstellenden "Vokabular"-Metastrichen aus dem Wörterbuch. Jede Vokabularsequenz von Metastrichen beschreibt einen der zugelassenen Wege zur Wiedergabe eines Wortes. Die Daten zum Analysieren der optimalen Anpassung werden dann aus einer Merkmalkorrelationstabelle und einer Größenkorrelationstabelle extrahiert, wie nachfolgend beschrieben wird.The optimal fit calculation step includes two inputs: the input sequence of metastrokes forming a string for a word and the pattern or string of a known word "vocabulary" metastrokes from the dictionary. Every vocabulary sequence from Me Tastrichen describes one of the permitted ways to render a word. The data for analyzing the optimal fit is then extracted from a feature correlation table and a size correlation table, as described below.

Nur zur Veranschaulichung folgt ein vereinfachtes Beispiel der Erkennungsprozedur für ganze Wörter. Falls das Wort "run" mit der Hand auf ein Digitalisierungstableau geschrieben wird, besteht der erste Schritt darin, eine Eingabe-Metastrichzeichenfolge zu konstruieren oder eine Sequenz von ausgewählten strichähnlichen Ziffern, die auf zugelassenen Strichformen basieren, welche durch die Analyse der kursiven Handschrift erhalten werden. Die Eingabe-Metastrichzeichenfolge ist eher eine Serie von Metastrichen als von Punkten oder Buchstaben. Das Vokabular der Metastriche für diese Zeichenfolge ist auf eine festgelegte Anzahl von Wahlmöglichkeiten begrenzt, z.B. auf 20, 30, 40 oder 50 verschiedene Strichformen. Die obige 3 ist ein Beispiel einer funktionalen Ausführungsform. Die Eingabenzeichenfolge kann in einem Computer zusammenhängend durch eine Zeichenfolge von Symbolen dargestellt werden, z.B. die Zeichenfolge von Zufallssymbolen oder deren ASCII-Äquivalente:

Figure 00180001
Die Sequenz, die die Eingabe-Metastrichzeichenfolge bildet, wird dann in ihrer symbolischen Form in einem Wortpuffer abgelegt und entsprechend der auf ganzen Wörtern basierenden Auswertungsprozedur der Erfindung als ein ganzes Wortsegment mit allen relevanten Einträgen in einem "Wörterverzeichnis" von ganzen Wörtern verglichen, die als Metastriche geschrieben sind, wobei als Vokabular dieselben symbolischen Formen benutzt werden, welche die Eingabe-Metastrichzeichenfolge bilden. Ein Beispielwörterverzeichnis kann beispielsweise die folgenden Einträge umfassen:By way of illustration only, a simplified example of the whole word recognition procedure follows. If the word "run" is written by hand on a digitizing panel, the first step is to construct an input metastroke string or a sequence of selected string-like numerals based on approved stroke shapes obtained by analyzing the italic handwriting , The input metastroke string is more a series of metastrokes than dots or letters. The metastroke vocabulary for this string is limited to a fixed number of choices, such as 20, 30, 40 or 50 different stroke styles. The above 3 is an example of a functional embodiment. The input string can be represented contiguously in a computer by a string of symbols, eg the string of random symbols or their ASCII equivalents:
Figure 00180001
The sequence forming the input metastroke string is then stored in its symbolic form in a word buffer and compared as a whole word segment with all relevant entries in a "dictionary" of whole words corresponding to the whole word based evaluation procedure of the invention Metastasis are written using the same symbolic forms that form the input metastroke string as a vocabulary. For example, a sample dictionary may include the following entries:

Vokabularsegmente

Figure 00180002
vocabulary segments
Figure 00180002

(Dies ist ein sehr einfaches Wörterbuch mit zwei Wörtern und sieben Zeichenfolgen.)(This is a very simple dictionary with two words and seven strings.)

Während der Vergleich dadurch erfolgen kann, daß die Eingabe-Metastrichzeichenfolge und jedes in Metastrichen buchstabierte Wort in dem Wörterverzeichnis auf Übereinstimmung hin geprüft werden, Metastrich für Metastrich, daß mit einer Bewertung oder einem Wert jede Position festgehalten wird, an der eine Übereinstimmung zwischen den Eingabe-Metastrichen und den Vokabular-Metastrichen festgestellt wird und daß die Bewertungen für die Metastrichübereinstimmungen für jedes auf diese Weise getestete Eingabe-Metastrichsegment dann addiert werden, um für jeden Eintrag ein "Wort"-Maß (Metrik) (d.h. eine Übereinstimmungsbewertung) zu erhalten, ist dieser Prozeß nicht das, was entsprechend der bevorzugten Ausführungsform der Erfindung in der Wortanalysatoreinrichtung 44 durchgeführt wird. Dieses Übereinstimmungsschema wird nur zum Zwecke der Veranschaulichung beschrieben, um das Verständnis des nachfolgenden komplexeren Ausführungsbeispiels zu erleichtern.While the comparison can be made by checking the input metastroke string and any metastatic spelled word in the dictionary for correspondence, Metastrich for metastroke records that every item with a score or value that matches the input Metastrokes and the vocabulary metastrokes and that the metastroke scores for each input metastroke segment tested in this way are then added together to obtain a "metric" (ie, a match score) for each entry, this process is not what is according to the preferred embodiment of the invention in the word analyzer 44 is carried out. This matching scheme will be described for the purpose of illustration only to facilitate understanding of the more complex embodiment below.

In der obigen Tabelle ergeben sich aus dem vereinfachten Vergleichsverfahren die folgenden Ergebnisse unter der Annahme, daß die Maximalbewertungsberechnung eine einfache Summation der Gewichtungen erlaubt und eine Maximalbewertung für eine einzelne Metastrich-Übereinstimmung 6 gleich ist:In The above table results from the simplified comparison method the following results assuming that the maximum score calculation a simple summation of the weights allowed and a maximum rating for one single metastroke match 6 is the same:

Figure 00190001
Figure 00190001

Der Bindestrich "-" tritt an der Stelle auf, an der eine Übereinstimmung mit dem Metastrich nicht vorliegt. Die als Metastriche buchstabierten Wörter sind normalerweise durch eine englischsprachige Definition zusammengefaßt, so daß der "Treffer" als ein englischsprachiges Wort mit einer Bewertung dargestellt (gelistet) wird, welche die höchste Bewertung von allen als Metastriche geschriebenen Wörtern in dieser Gruppe ist. Dies wird durch den Asterix "*" am linken Rand, siehe oben, angezeigt.Of the Hyphen "-" occurs at the point on, at which a match not present with the metastroke. The spelled as metastases words are usually summarized by an English-language definition, so that the "hit" as an English-language Word is presented (listed) with a rating which the highest Evaluation of all words written as metastrophic in this group is. This is indicated by the asterix "*" am left margin, see above.

Die englischsprachigen Wörter, die Treffer sind, werden durch ihr höchstes Wortmaß klassifiziert, wobei dieses Maß zuerst normalisiert wird. Es ergibt sich:The English words, the hits are classified by their highest word size, being that measure first is normalized. It follows:

Figure 00190002
Figure 00190002

Die normalisierten Wortmaße können in diesem vereinfachten Beispiel dann sowohl mit einem vorbestimmten Grenzwert verglichen werden, um die Akzeptabilität zu bestimmen, als auch untereinander im Hinblick auf ihre Übereinstimmung verglichen werden, um die "Verwirrung" zu bestimmen. Wenn festgestellt wird, daß das Wort akzeptabel ist, wird das Wort dann an einen Wortausgabepuffer ausgegeben. Wenn das Wortmaß den Grenzwert nicht überschreitet, wird das Eingabe-Metastrichsegment durch Substituieren, Addieren und Löschen der Metastriche aus der Liste der englischsprachigen Prüfwörter verändert.The normalized word measures can in this simplified example then both with a predetermined Limit value to determine acceptability, as well as among themselves in terms of their compliance compared to determine the "confusion". If it is stated that the Word is acceptable, the word is then sent to a word output buffer output. When the word measure the Does not exceed the limit, is the input metastroke segment by substituting, adding and Clear changed the metastroke from the list of English-language test words.

Wenn in dem obigen Beispiel ein normalisiertes Maß von 0,77 den Grenzwert nicht überschritten hat, werden verschiedene Metastriche in der Eingabe-Metastrichzeichenfolge addiert, gelöscht oder substituiert, um zu versuchen, eine bessere Übereinstimmung mit einer bekannten Zeichenfolge in dem Wörterverzeichnis zu erhalten und es wird ein weiterer Vergleich mit dem Wort aus dem Wörterverzeichnis gemacht. Additionen und Löschungen werden durch negative Gewichtungen gekennzeichnet, während Substitutionen durch positive Gewichtungen in Abhängigkeit von der "Richtung" und Position der Substitutionen gekennzeichnet werden. Wenn der letzte Metastrich des Eingabesegmentes gelöscht wird, nimmt das normalisierte Maß der ersten "Definition" von "run" von 0,77 auf 0,83 zu, wobei es möglicherweise einen vorbestimmten Grenzwert trifft.If in the above example, a normalized measure of 0.77 did not exceed the limit has different metastrokes in the input metastroke string added, deleted or substituted to try to get a better match with a known string in the dictionary and it will be another comparison with the word from the dictionary made. Additions and deletions are characterized by negative weightings, while substitutions by positive weightings depending on the "direction" and position of the Substitutions are marked. If the last metastroke of the input segment deleted becomes, the normalized measure of the first "definition" of "run" from 0.77 to 0.83 to, possibly it meets a predetermined limit.

Die 6 bis 12 zeigen ein zweites genaueres Beispiel eines Erkennungsverfahrens für ganze Wörter nach der Erfindung, welches genauer veranschaulicht, wie der erfindungsgemäße dynamische Programmierungsprozeß ausgeführt wird, um ein ganzes Wort erkennen zu können. 6A zeigt das handgeschriebene Wort "may". In einer Ausführungsform der Erfindung kann dieses Wort als eine Zeichenfolge der in 8B gezeigten Metastriche ausgedrückt werden. Die Zahlen in der Nähe von besonderen Merkmalen des Wortes zeigen die entsprechenden Metastriche an (vgl. die horizontale Achse von 6B).The 6 to 12 show a second more specific example of a whole word recognition method according to the invention, which illustrates in more detail how the dynamic programming process according to the invention is executed in order to recognize a whole word. 6A shows the handwritten word "may". In one embodiment of the invention, this word may be used as a string of the type defined in 8B expressed metastrokes. The numbers near special features of the word indicate the corresponding metastrokes (see the horizontal axis of 6B ).

Wie oben angegeben ist, kann das Wörterverzeichnis infolge der Unterschiede in den möglichen Handschriftarten zahlreiche Metastrich-"Schreibweisen" für ein einzelnes Wort haben. In diesem Beispiel wird angenommen, daß es nur eine Schreibweise von "may" in dem Wörterverzeichnis gibt, wie in 7 gezeigt ist. Ein Vergleich der Metastrichsequenz von 6B mit der von 7 zeigt, daß die Übereinstimmung nicht exakt ist. (Beachte den Buchstaben "a".) Dies ist im allgemeinen infolge der verschiedenen Variationen in den Handschriftarten der Fall.As noted above, due to differences in possible handwriting styles, the dictionary may have numerous metastroke "spellings" for a single word. In this example, it is assumed that there is only one notation of "may" in the dictionary, as in 7 is shown. A comparison of the metastatic sequence of 6B with the of 7 shows that the match is not exact. (Note the letter "a.") This is generally the case due to the various variations in the handwriting styles.

Um festzustellen, ob die Wörterbuchschreibweise von "may" als mit der Eingabesequenz übereinstimmend angesehen wird, wird eine Wortkorrelationstabelle geschaffen, die als Ganzes die Eingabe-Metastrichzeichenfolge mit jeder Vokabular-Metastrichzeichenfolge vergleicht, welche für eine Übereinstimmung in Frage kommt. Als eine Folge des erfindungsgemäßen Verfahrens, und ein Wortmaß (d.h. ein durch die Wahrscheinlichkeit einer existierenden Übereinstimmung definierter Wert) und ein optimaler "Pfad" durch die Sequenz der Metastrich-Ergebnisse, aber nur nachdem die Verarbeitung der ganzen Metastrichzeichenfolge beendet ist. Je größer das Wortmaß ist, desto größer ist die Übereinstimmung.To determine if the dictionaries of "may" are the same as the input sequence In the meantime, a word correlation table is created that as a whole compares the input metastroke string with each vocabulary metastroke string that is eligible for matching. As a consequence of the method according to the invention, and a word measure (ie a value defined by the probability of an existing match) and an optimal "path" through the sequence of metastroke results, but only after the processing of the whole metastroke string has ended. The larger the word size, the greater the match.

10 zeigt ein Beispiel einer sich aus dem Wort "may" ergebenden Wortkorrelationstabelle, worin die Eingabe-Metastrichzeichenfolge von 6B der Vokabular-Metastrichzeichenfolge von 7 gegenübergestellt wird. Die Werte in jeder Zelle werden aus der Berechnung eines Additionswertes abgeleitet, der auf den Übergängen zwischen einer vorausgehenden diagonalen Position, einer vorausgehenden Zeilenposition und einer vorausgehenden Spaltenposition beruht, wobei aus diesen drei ausgewählten Werten der Übergang mit dem höchsten Wert ausgewählt wird und dann der Zelle die Summe von dem Gewicht des Übergangs und der Wert der vorausgehenden Zelle zugeordnet wird. Dies ist ein Prozeß von dynamischem Programmieren. Die Quelle der Gewichtungen wird unter Bezugnahme auf eine Merkmalkorrelationstabelle und eine Größenkorrelationstabelle erhalten, deren Werte auf der Größe und der Art des Metastrichvokabulars und einer Analyse der zulässigen und nichtzulässigen Substitutionen, Einfügungen und Löschungen zwischen allen Metastrichen in dem Wörterverzeichnis beruhen. 10 shows an example of a word correlation table resulting from the word "may", wherein the input metastroke string of 6B the vocabulary metastroke string of 7 is faced. The values in each cell are derived from the calculation of an addition value based on the transitions between a previous diagonal position, a previous row position and a preceding column position, from which three selected values the highest value transition is selected and then the cell the sum of the weight of the transition and the value of the previous cell is assigned. This is a process of dynamic programming. The source of weights is obtained by reference to a feature correlation table and a size correlation table whose values are based on the size and nature of the metastrogram vocabulary and an analysis of allowable and invalid substitutions, insertions and deletions between all metastrokes in the dictionary.

9 zeigt beispielsweise eine Merkmalkorrelationstabelle, welche die Wahrscheinlichkeit einer Übereinstimmung anzeigt, die zwischen einzelnen Metastrichen in einem Wörterverzeichnis von nur acht Metastrichen auftritt. Jeder Spalteneintrag stellt einen in der Eingabezeichenfolge gefundenen Metastrich dar. Jeder Zeileneintrag stellt einen Metastrich dar, der in dem Wörterverzeichnis gefunden wurde, das sich aus diesem (begrenzten) Metastrichvokabular zusammensetzt. Der höchste Wert oder das höchste Maß wird einer Substitution eines identischen Eingabe-Metastrichs durch einen Metastrich aus dem Wörterverzeichnis zugeordnet, d.h. entlang der Diagonalen. Niedrige Maße werden Substitutionen von Eingabe-Metastrichen durch Metastriche aus dem Wörterverzeichnis zugeordnet, die sich in der Form nahe kommen. In der Tabelle werden unzulässige Substitutionen durch Leerzeichen dargestellt und ein großer negativer Wert wird diesen Positionen in der Tabelle zugeordnet: (–1000), so daß die auf diesen Substitutionen beruhenden Berechnungen immer zu einem Ergebnis führen, das außerhalb des Betrachtungsbereichs für eine völlige Übereinstimmung liegt. 9 For example, Figure 10 shows a feature correlation table indicating the likelihood of a match occurring between individual metastrokes in a dictionary of only eight metastrokes. Each column entry represents a metastroke found in the input string. Each row entry represents a metastroke found in the dictionary made up of this (limited) metastroke vocabulary. The highest value or measure is assigned to a substitution of an identical input metastroke by a metastroke from the dictionary, ie along the diagonal. Low dimensions are assigned substitutions of input metastrokes by metastatic ones from the dictionary that come close in shape. In the table, invalid substitutions are represented by blanks, and a large negative value is assigned to those positions in the table: (-1000), so that the calculations based on these substitutions always result in a result that is out of the range of view for a complete match ,

Eingabe-Metastrich-Additionen und Löschungen sind gemäß der Erfindung zulässig, obwohl mit jeder eine Erschwerung verbunden ist. 10A zeigt Beispielerschwerungen für die Addition von ausgewählten Metastrichen, während 10B Beispielerschwerungen für das Löschen der ausgewählten Metastriche zeigt. Abgesehen. von der Beobachtung der Korrelation zwischen Metastrichen (positive Werte) und mit addierten und gelöschten Metastrichen verbundenen Erschwerungen (negative Werte oder Erschwerungswerte), wird auch ein Größenvergleich (in bezug auf die Basislinie des Wortes) ausgeführt. 11 zeigt eine Größenkorrelationstabelle, während die 12A–B Größenerschwerungen anzeigen, die den Tabellen von den 10A–B zugeordnet sind und sich auf Additionen bzw. Löschungen beziehen.Input metastroke additions and deletions are allowed in accordance with the invention, although there is some difficulty associated with each. 10A shows sample drawbacks for the addition of selected metastrokes while 10B Sample drawbacks for deleting the selected metastrokes. Apart. from observing the correlation between metastases (positive values) and aggravations (negative values or aggravated values) associated with added and deleted metastrokes, a size comparison (with respect to the base line of the word) is also performed. 11 shows a size correlation table while the 12A -B Show size scores that match the tables of the 10A -B and refer to additions or deletions.

Die Wortkorrelationstabelle von 8 für jedes Wort aus dem Wörterverzeichnis kann von den Daten von Tabellen der 9, 10A, 10B, 11, 12A und 12B abgeleitet werden, was ein vereinfachtes Beispiel ist, oder aus Daten von den 13 oder 14, was dem tatsächlichen Arbeitssystem entspricht. (In den 13 und 14 sind die jeweils den 10A und 12A entsprechenden Additionsvektoren in den Kopfzeilen der Tabelle gezeigt und die jeweils den 10B und 12B entsprechenden Löschvektoren sind in der linken Spalte der Tabellen gezeigt.) Die Wortkorrelationstabelle von 8 wird auf der Grundlage einer dynamischen Programmierungstechnik zum Berechnen von "optimalen Kosten" berechnet, wie dies in der Technik bezeichnet wird, und auf der Grundlage "eines Pfades" für die Transformation einer Sequenz in eine andere. Bei der Erfindung wird die Transformation oder Abbildung auf der Grundlage einer ganzen Eingabesequenz gemacht, um diese in Länge und Form irgendeiner Zeichenfolge einer Anzahl von bekannten Metastrichzeichenfolgen aus dem Wörterverzeichnis zu bringen. Daher ist es notwendig, die Transformation auf der ganzen Sequenz auszuführen, bevor aus den Ergebnissen Schlußfolgerungen gezogen werden können.The word correlation table of 8th for each word of the dictionary can be derived from the data of tables 9 . 10A . 10B . 11 . 12A and 12B derived, which is a simplified example, or from data from the 13 or 14 which corresponds to the actual work system. (In the 13 and 14 are each the 10A and 12A corresponding addition vectors are shown in the headers of the table and the respective 10B and 12B corresponding deletion vectors are shown in the left column of the tables.) The word correlation table of 8th is calculated on the basis of a dynamic programming technique to calculate "optimal cost", as referred to in the art, and on the basis of "a path" for transforming one sequence into another. In the invention, the transformation or mapping is made on the basis of an entire input sequence to bring it out of the dictionary in the length and form of any string of a number of known metastroke strings. Therefore, it is necessary to perform the transformation on the whole sequence before conclusions can be drawn from the results.

13 zeigt eine Datentabelle zur Veranschaulichung der Transformationen von Eingabe-Metastrichen in Vokabular-Metastriche. Am linken Rand sind die Vokabular-Metastriche aufgelistet, d.h. die in dem Wörterverzeichnis gefundenen Metastriche. Der obere Rand kann mit denselben Metastrichen in derselben Reihenfolge gekennzeichnet werden. Die Diagonale von der Tabelle ist ein Wert, der einer direkten Transformation eines Eingabe-Metastrichs in den identischen Metastrich in dem Wörterverzeichnis zugeordnet wird. Nicht auf der Diagonale liegende Werte stellen Werte dar, die für die Substitution von einem Eingabe-Metastrich durch andere Vokabular-Metastriche in einem Prozeß zugeordnet sind, in dem eine Metastrich-Zeichenfolge aufgebaut wird, die mit einer in dem Wörterverzeichnis gefundenen Metastrich-Zeichenfolge übereinstimmt. 14 zeigt eine Größenkorrelationstabelle für neun Größenpegel. Erschwerungen werden für Löschungen bzw. Additionen zugeordnet, wie entlang der Null-Reihe bzw. der Null-Spalte von 13 veranschaulicht wird und in dem Beispiel gemäß 10A (diese entspricht Spalte Null von 13) und 10B (diese entspricht Reihe Null von 13) separat gezeigt wird. In einer Löschung wird ein Metastrich aus der Eingabe-Zeichenfolge gelöscht. Eine Löschung wird durch einen negativen Wert einer ausgewählten Größe (Reihe Null, irgendeine Spalte) angezeigt. Mit der Addition wird entsprechend ein Metastrich an einer Position in der Eingabe-Metastrichzeichenfolge hinzugefügt und die Aktion wird durch einen negativen Wert einer ausgewählten Größe (Spalte Null, irgendeine Zeile) angezeigt. Auf eine "Substitution" (wo ein Eingabe-Metastrich durch einen Vokabular-Metastrich substituiert wird) wird durch einen positiven Wert hingewiesen, wie durch die Position in der Matrix angegeben wird. Der spezielle Fall einer "Substitution" eines Metastrichs durch sich selbst ist die Diagonale und dieser ist deshalb der größte Wert zugeordnet. Es ist absolut nicht erforderlich, daß die Merkmalkorrelationstabelle symmetrisch ist, da die Substitution kein symmetrischer Prozeß ist. 13 Figure 12 shows a data table illustrating the transformations of input metastrokes into vocabulary metastrokes. The left margin lists the vocabulary metastrokes, ie the metastrokes found in the dictionary. The top border can be labeled with the same metastrokes in the same order. The diagonal of the table is a value associated with a direct transformation of an input metastroke to the identical metastroke in the dictionary. Non-diagonal values represent values associated with the substitution of an input metastroke for other vocabulary metastrokes in a process in which a metastroke string is constructed that matches a metastroke string found in the dictionary , 14 shows a size correlation table for nine size levels. Complications are assigned for deletions or additions, such as along the zero row or the zero column of 13 is illustrated and in the example according to 10A (this corresponds to zero column of 13 ) and 10B (this corresponds to row zero of 13 ) is shown separately. In a deletion, a metastroke is deleted from the input string. A deletion is indicated by a negative value of a selected size (row zero, any column). With addition, a metastroke is added to a position in the input metastroke string, and the action is indicated by a negative value of a selected size (zero column, any row). A "substitution" (where an input metastroke is substituted by a vocabulary metastroke) is indicated by a positive value, as indicated by the position in the matrix. The special case of a "substitution" of a metastroke by itself is the diagonal and this is therefore the largest value assigned. It is absolutely not necessary for the feature correlation table to be symmetrical since the substitution is not a symmetric process.

Die Technik zum Interpretieren der Eingabe-Metastrichzeichenfolge als ein Wort ist unkompliziert, aber erfordert eine umfangreiche Programmierung. In dem dynamischen Programmierungsversuch werden Vergleichs-, Gewichtungs- und Modifizierungsverfahren gleichzeitig ausgeführt. Der Prozeß entspricht dem "Schlängeln" eines "Wurms", um zu sehen, ob dieser auf die Gestalt von "Musterwürmern" ausgerichtet werden kann. Die Additionen, Löschungen und Substitutionen führen dazu, daß sich der Wurm schlängelt. Jede Aktion resultiert in einer Gewichtung oder einer Erschwerung.The Technique for interpreting the input metastroke string as A word is straightforward, but requires extensive programming. In the dynamic programming attempt, comparison, weighting and modification procedures performed simultaneously. The process corresponds the "snaking" of a "worm" to see if these are aligned to the shape of "pattern worms" can. The additions, deletions and substitutions to that the worm meanders. Each action results in a weighting or an aggravation.

Die Schritte der dynamischen Programmierungstechnik umfassen einen Prozeß, in dem eine ganze Metastrich-Zeichenfolge mit allen relevanten Metastrich-Zeichenfolgen in einem Wörterbuch von Wörtern verglichen werden, die als Metastriche "geschrieben" werden, um einen Pfad für die Transformation der Eingabezeichenfolge in eine der Wörterbuch-Metastrichzeichenfolgen aufzubauen und in dem ein Maximalwert oder sogenannte "optimale Kosten" ("optimal cost") bestimmt werden, um die ganze Eingabe-Metastrichzeichenfolge gegenüber jeder Vokabular-Metastrichzeichenfolge zu verarbeiten. Theoretisch kann die gesamte Eingabe-Metastrichzeichenfolge gegenüber allen Zeichenfolgen in dem Wörterbuch verarbeitet werden. Es werden aber normalerweise gewisse beschleunigende Schritte ausgeführt, um den Prozeß zu beschleunigen. (Um den Prozeß zu beschleunigen, brauchen nicht alle Wörterbucheinträge geprüft zu werden, obgleich die Techniken, den Prozeß auf diese Weise zu begrenzen, nicht ein Teil dieses Aspekts der Erfindung sind. Diese Optimierungstechniken nutzen die Merkmale des Wörterbuchs aus. Das Wörterbuch kann z.B. durch eine Anzahl von Strichen ausgebildet sein, oder es kann durch Metastriche "alphabetisiert" sein. Die Auswertung kann auf einer vorwärts gerichteten Metastrichsequenz erfolgen, auf einer entgegengesetzt gerichteten Metastrichsequenz, auf den am besten passenden Wortanfängen und den am besten passenden Wortendungen.) Wie zuvor beschrieben worden ist, umfaßt das Wörterbuch eine "Definition", ein englischsprachiges Wort (oder ein Wort in einer anderen Sprache), das in romanischen Schriftzeichen, d.h. den romanischen Schriftzeichen entsprechenden ASCII-Zeichenfolgen geschrieben ist, was das einzige zu erkennende Wort ist. Folglich gibt es verschiedene Wörterbucheinträge mit derselben "Definition", um den Variationen in der Handschrift Rechnung zu tragen.The Steps of the dynamic programming technique include a process in which an entire metastroke string with all relevant metastroke strings in a dictionary of words which are "written" as metastrokes to a path for the transformation the input string into one of the dictionary metastroke strings in which a maximum value or so-called "optimal cost" is determined, around the whole input metastroke string towards everyone To process vocabulary metastroke string. Theoretically you can the entire input metastroke string against all strings in the dictionary are processed. But there are usually certain accelerating Steps executed to the process accelerate. (To the process too speed up, not all dictionary entries need to be checked, although the techniques to limit the process in this way, are not part of this aspect of the invention. These optimization techniques use the features of the dictionary out. The dictionary can e.g. be formed by a number of strokes, or it can be "alphabetized" by metastases. The evaluation can on a forward directed metastroke sequence, on one opposite directed metastrogram sequence, on the best fitting word beginnings and the most appropriate word endings.) As previously described is included the dictionary a "definition", an English-language one Word (or a word in another language) that is in Romance Characters, i. corresponding to the Romanesque characters ASCII strings are written, which is the only one to recognize Word is. Consequently, there are different dictionary entries with the same "definition" to the variations to take into account in the manuscript.

Die Metastrich-Merkmalkorrelationsmatrix (d.h. die Daten für die Transformation von allen Metastrichen in andere) wird als integraler Bestandteil, wie 13 zeigt, des dynamischen Programmierungsprozesses benutzt, nämlich in dem Pfadaufbau und in der optimalen Kostenkalkulation. Die Größenkorrelationsmatrix wird auch in denselben Prozeßschritten verwendet. Die optimale Kostenkalkulation ist eine Kalkulation der folgenden drei Formeln, der eine Auswahl eines Maximums folgt, das auf einem einfachen Vergleich beruht. Das Maximum von den drei Werten wird in die Zelle eingesetzt, die der Transformation von Eingabe-Metastrichen in Vokabular-Metastriche in der Wortkorrelationstabelle (z.B. 8) für jedes so verarbeitete Wort aus dem Wörterverzeichnis entspricht. 8 zeigt ein Beispiel, das sich aus dem dynamischen Programmierungsprozeß ergibt, der die Daten von den 9 bis 12 verwendet.The metastroke feature correlation matrix (ie the data for the transformation of all metastrokes into others) is considered an integral part, such as 13 shows, used in the dynamic programming process, namely in the path building and in the optimal cost calculation. The size correlation matrix is also used in the same process steps. The optimal cost calculation is a calculation of the following three formulas followed by a selection of a maximum based on a simple comparison. The maximum of the three values is inserted into the cell, which is the transformation of input metastrokes into vocabulary metastrokes in the word correlation table (eg 8th ) for each word thus processed from the dictionary. 8th shows an example resulting from the dynamic programming process that extracts the data from the 9 to 12 used.

Zur Veranschaulichung wird auf 8 Bezug genommen. Die Berechnung wird durchgeführt, indem der Maximalwert (α) für die Zelle in Position (a, b) in der Wortkorrelationstabelle aus αWerten ausgewählt wird, die für die Addition, Löschung und Substitution an diesen Zellenpositionen berechnet worden sind. Die Maxima werden in jedem Beispiel von 8 wie folgt bestimmt: Für die Substitutionen: α1ji = αj-1i-1 + p(ai, bj) + q(aj, bj) (1) For illustration is on 8th Referenced. The calculation is performed by selecting the maximum value (α) for the cell in position (a, b) in the word correlation table from α values calculated for addition, deletion and substitution at these cell positions. The maxima are in each example of 8th determined as follows: For the substitutions: α1 j i = α j-1 i-1 + p (a i , b j ) + q (a j , b j ) (1)

Für die Einfügungen oder Additionen: α2ji = αji-1 + p(ai) + q(ai) (2) For the inserts or additions: α2 j i = α j i-1 + p (a i ) + q (a i ) (2)

Für die Löschungen: α3ji = αj-1i + p(bj) + q(bj) (3)worin:
α1j i der "Kostenwert" (der in dem Vokabular des dynamischen Programmierens benutzt wird) oder die kumulative Bewertung in Element (i, j) für das Passieren vom Ursprung über Element (i-1, j-1) ist, indem der Eingabe-Metastrich "b" in der Spaltenposition (j) durch den Vokabular-Metastrich "a" in der Reihenposition (i) ersetzt wird (8);
p(ai, bj) ein (aus 13 oder 9 gewonnener) Ähnlichkeitsgewichtungswert der Substitution eines Eingabe-Metastrichs "aj" durch einen Vokabular-Metastrich "bj" ist;
q(aj, bj) der (aus der Größenkorrelationstabelle gewonnene, 14 oder 12) Größengewichtunswert für die Größensubstitution ist, die in der vorausgehenden Substitution des Eingabe-Metastrichs "ai" durch den Vokabular-Metastrich "bj" erfolgt;
α2 der "Kostenwert" oder die kumulative Bewertung für das Passieren vom Ursprung über Element (i-1, j) nach Element (i, j) ist, indem der Vokabular-Metastrich "a" in der Zeilenposition (i) nach dem Eingabe-Metastrich "b" in Spaltenposition (j) eingefügt wird;
α3 der "Kostenwert" für die kumulative Bewertung zum Passieren vom Ursprung über Element (i, j-1) nach Element (i, j) ist, indem der Eingabe-Metastrich "b" in Spalte (j) entlang einer Sequenz von Metastrichen gelöscht wird;
p(aj) ein Erschwerungswert (aus 13, Spalte 0, Zeile i; oder aus Position i von 10A) zum Einsetzen des Vokabel-Metastrichs "a" in Zeilenposition (i) nach dem Eingabe-Metastrich "b" in Spaltenposition (j) ist;
q(ai) der Erschwerungswert für die der vorhergehenden Einfügung zugeordneten Größe ist (14 oder 12A);
p(bj) ein Erschwerungswert (aus 13, Zeile 0, Spalte j; oder aus Position j von 10B) zum Löschen eines Metastrichs "bj" ist;
q(bj) ein Erschwerungswert für die der vorgehenden Löschung zugeordneten Größe ist (14 oder 12B).
For the deletions: α3 j i = α j-1 i + p (b j ) + q (b j ) (3) wherein:
α1 j i is the "cost value" (used in the vocabulary of dynamic programming) or the cumulative score in element (i, j) for passing from the origin through element (i-1, j-1) by the input Metastroke "b" in the column position (j) is replaced by the vocabulary metastroke "a" in the row position (i) ( 8th );
p (a i , b j ) on (off 13 or 9 obtained) similarity weighting value of the substitution of an input metastroke "a j " with a vocabulary metastroke "b j ";
q (a j , b j ) of (obtained from the magnitude correlation table, 14 or 12 ) Size weighting for the size substitution that occurs in the prior substitution of the input metastroke "a i " by the vocabulary metastroke "b j ";
α2 is the "cost value" or the cumulative score for passing from the origin via element (i-1, j) to element (i, j), by placing the vocabulary metastroke "a" in the line position (i) after the input Metastrich "b" is inserted in column position (j);
α3 is the "cost" for the cumulative score for passing from origin over item (i, j-1) to item (i, j) by deleting the input metastroke "b" in column (j) along a sequence of metastrokes becomes;
p (a j ) an aggravated value (off 13 , Column 0, line i; or from position i of 10A ) for inserting the vocabulary metastroke "a" in row position (i) after the input metastroke "b" in column position (j);
q (a i ) is the complication value for the quantity assigned to the previous insertion ( 14 or 12A );
p (bj) is a penalty value (from 13 , Line 0, column j; or from position j of 10B ) for deleting a metastroke "b j ";
q (b j ) is an aggravated value for the quantity assigned to the previous deletion ( 14 or 12B ).

Die bevorzugte Metastrich-Zeichenfolge in jeder Zelle (i, j) ist der maximale kumulative Bewertungswert Alpha (α) in Zelle (i, j), die aus dem ersten kumulativen Bewertungswert (α1), dem zweiten kumulativen Bewertungswert (α2) und dem dritten kumulativen Bewertungswert (α3) ausgewählt wird. Diese Maximalbewertung in jeder Zelle stellt die "optimalen Kosten" in dieser Zelle entlang irgendeinem Pfad von dem Ursprung in der Wortkorrelationstabelle von 8 dar.The preferred metastroke string in each cell (i, j) is the maximum cumulative score alpha (α) in cell (i, j) that consists of the first cumulative score (α1), the second cumulative score (α2), and the third cumulative score (α3) is selected. This maximum score in each cell represents the "optimal cost" in that cell along any path from the origin in the word correlation table 8th represents.

Ein besonderes Beispiel kann hilfreich sein. Es sei auf das Element in Zeile i = 4, Spalte j = 4 in 8 hingewiesen. Dieses Element enthält den Maximalwert aus den berechneten Alphathermen α1, α2 oder α3 für diese Position.A special example can be helpful. Let's look at the element in line i = 4, column j = 4 in 8th pointed. This element contains the maximum value from the calculated alpha thermals α1, α2 or α3 for this position.

Zum Berechnen von α1, wird Gleichung [1] herangezogen. Aus der Überprüfung der benachbarten diagonalen Zelle (10) ergibt sich für αj-1 i-1 ein Wert von 7. Die in 8 gezeigte Substitution für Zelle (4, 4) ist von dem nach oben gerichteten Bogen (entlang der Kopfzeile) bis zu einem nach unten gerichteten Punkt (entlang der Seitenspalte). Aus 9, die Substitution von dem nach oben gerichteten Bogen zu einem nach unten gerichteten Pfeil, ist der Wert p(ai, bj) gleich –1000, der eine unzulässige Übertragung angibt. Die entsprechende Größensubstitution von der vierten Position von 6B bis zu der vierten Position von 7 ist von Größe 3 bis Größe 5. Eine Übertragung von Größe 3 nach Größe 5 hat einen Wert von –1000 gemäß 11. Die Summe von αj-1 i-1, p und q ist so gleich –1993.To calculate α1, equation [1] is used. From checking the adjacent diagonal cell ( 10 ) results in a value of 7 for α j-1 i-1 8th The substitution shown for cell (4, 4) is from the upward-facing arc (along the header) to a downward-pointing point (along the page column). Out 9 , the substitution from the upward bow to a downward arrow, the value p (a i , b j ) equals -1000, which indicates an illegal transfer. The corresponding size substitution from the fourth position of 6B up to the fourth position of 7 is from size 3 to size 5. A transfer from size 3 to size 5 has a value of -1000 according to 11 , The sum of α j-1 i-1 , p and q is thus equal to -1993.

Zum Berechnen von α2 wird Gleichung [2] zum Einsetzen herangezogen. Aus der benachbarten Zeile oberhalb der Zelle (4, 4) in 8 ergibt sich ein Wert αj i-1 von 11. Für das Einsetzen eines nach unten gerichteten Pfeils ist der Erschwerungswert p(ai) von 10A gleich –2. Der entsprechende Größenerschwerungswert q(ai) für den nach unten gerichteten Pfeil in Höhe 5 (7) ist nach 12A gleich 0. So ist die Summe α2 und ein Prüfwert für Zelle (4, 4) gleich 9.To calculate α2, equation [2] is used for insertion. From the adjacent line above the cell (4, 4) in 8th the result is a value α j i-1 of 11. For the insertion of a downward arrow, the complication value p (a i ) of 10A equals -2. The corresponding magnitude weighting value q (a i ) for the downward arrow at level 5 ( 7 ) is after 12A equals 0. Thus the sum α2 and a test value for cell (4, 4) equals 9.

Zum Berechnen von α3, wird Gleichung [3] zum Einsetzen herangezogen. Aus der benachbarten links von Zelle (4, 4) liegenden Spalte in 8 ergibt sich für αj-1 i ein Wert von 12. Für das Löschen von einem nach oben gerichteten Bogen ist der Erschwerungswert p(bj) von 10B gleich –2. Der entsprechende Größenerschwerungswert q(ai) für einen nach oben gerichteten Bogen in Höhe 3 (7) ist nach 12B gleich 0. So ist die Summe α3 und der Prüfwert für Zelle (4, 4) gleich 10. Aus einem einfachen Vergleich von α1, α2 und α3 ergibt sich ein Maximalwert von 10. Der Wert von 10 wird so in Zelle (4, 4) eingesetzt.To calculate α3, equation [3] is used for insertion. From the adjacent left of cell (4, 4) lying in column 8th the result for α j-1 i is a value of 12. For deleting one after top-directed arc is the complication value p (b j ) of 10B equals -2. The corresponding magnitude weighting value q (a i ) for an upward bow in the amount 3 ( 7 ) is after 12B equals 0. Thus, the sum α3 and the test value for cell (4, 4) equals 10. From a simple comparison of α1, α2 and α3, a maximum value of 10 results. The value of 10 is thus stored in cell (4, 4 ) used.

Dieses Verfahren wird für jede Zelle der Wortkorrelationstabelle durchgeführt. Für jede Zelle wird das Maximum α von der Substitution, Addition und Löschung benutzt. Wenn die Wortkorrelationstabelle berechnet wird, wird der Pfad zu jeder Zelle von der benachbarten Zelle, was die Maximalbewertung ergibt, tabelliert. Am Ende des Verfahrens können die Pfade von jeder Zelle (z.B. von der rechten Grenze oder unteren Grenze) zu dem Ursprung (0, 0) zurückgeführt werden. Jeder von diesen Pfaden stellt den optimalen Pfad zwischen dem Ursprung und der ausgewählten Zelle dar. Nach der Erfindung stellt die Zellenposition ganz rechts und ganz unten vom Ursprung den "optimalen Kostenwert" für den optimalen Pfad durch die Wortkorrelationsmatrix für die spezifische mit ihrer Endmarke getesteten und bestimmten Eingabe-Zeichenfolge dar. Die spezifische Eingabe-Metastrichzeichenfolge wird jeder Vokabular-Metastrichzeichenfolge aus dem (sich aus dem Vokabular der zulässigen Metastrichzeichenfolgen zusammensetzenden) Wörterbuch gegenübergestellt, um zahlreiche Wortkorrelationstabellen zu schaffen. Der optimale Kostenwert für die Eingabe-Metastrichzeichenfolge (deren Wert sich aus der Zelle in der letzten Spalte und letzten Zeile ergibt und die dem Ende der Eingabe-Metastrichzeichenfolge und der Vokabular-Metastrichzeichenfolge entspricht) von jeder Wortkorrelationstabelle wird dann mit allen entsprechenden optimalen Kostenwerten von den anderen Wortkorrelationstabellen verglichen. Das Maximum von diesen verschiedenen optimalen Kostenwerten wird dann herangezogen, um die Vokabular- Metastrichzeichenfolge zu identifizieren, welche die Eingabe-Metastrichzeichenfolge am besten mit einem Wort ("Definition") aus dem Wörterbuch korreliert, wobei angenommen wird, daß den minimalen Erkennungskriterien genügt wird. (In anderen Worten bildet ein Maximum, das unterhalb eines akzeptablen Minimums liegt, eine Grundlage für die Anzeige eines Fehlers, die Eingabe-Zeichenfolge als ein Wort zu erkennen.)This Procedure is for every cell of the word correlation table is performed. For each cell, the maximum α of the Substitution, addition and deletion used. When the word correlation table is calculated, the Path to each cell from the neighboring cell, giving the maximum rating results, tabulated. At the end of the procedure, the paths of each cell can (e.g., from the right border or lower border) to the origin (0, 0) are returned. Each of these paths represents the optimal path between the origin and the selected one Cell. According to the invention, the cell position is rightmost and at the very bottom of the origin the "optimal Cost value "for the optimal Path through the word correlation matrix for the specific with their Endmark tested and specific input string. The specific input metastroke string becomes any vocabulary metastroke string from the (from the vocabulary of permissible metastroke strings composing) dictionary faced, to create numerous word correlation tables. The optimal Cost value for the input metastroke string (whose value is derived from the cell in the last column and last row yields and the end the input metastroke string and the vocabulary metastroke string corresponds) of each word correlation table is then with all corresponding optimal cost values from the other word correlation tables compared. The maximum of these different optimal cost values is then used to identify the vocabulary metastroke string which best fits the input metastroke string in one word ("Definition") from the dictionary correlates, assuming that the minimum recognition criteria enough becomes. (In other words, a maximum that is below one acceptable minimum, a basis for the display of an error, recognize the input string as a word.)

Mit dem erfindungsgemäßen System können Wörter, die kursiv mit der Hand geschrieben werden, mit großer Wahrscheinlich erkannt werden. In dem System ist eine genügende Redundanz vorgesehen, das mit einer angemessenen Wahrscheinlichkeit selbst Wörter erkannt werden können, die in einer schlechten Handschrift mit fehlenden Buchstaben und Schreibfehlern geschrieben sind.With the system according to the invention can words, which are written in italics by hand, most likely be recognized. In the system a sufficient redundancy is provided, that with appropriate probability even words recognized can be in a bad handwriting with missing letters and Spelling errors are written.

Claims (14)

Verfahren zum Erkennen kursiver handgeschriebener Worte mit folgenden Verfahrensschritten: Empfangen digitaler punktedarstellender Informationen, die einen Anfangspunkt und einen Endpunkt beinhalten; Auswählen der durch den Anfangspunkt und den Endpunkt begrenzten Punkte als ein Prüfwort; Darstellen des Prüfwortes durch eine kennzeichnende Vielzahl von Metastrichen; Erstellen einer Liste von möglichen zutreffenden Metastrichwörtern unter Verwendung eines Wörterbuchs von Metastrichwörtern und der kennzeichnenden Vielzahl von Metastrichen; Vergleichen möglicher zutreffender Metastrichwörtern aus der Liste von möglichen zutreffenden Metastrichwörtern mit der kennzeichnenden Vielzahl von Metastrichen; Berechnen eines Wortmaßes basierend auf dem Vergleich; und Ausgeben eines ersten möglichen zutreffenden Wortes wenn das Wortmaß einen Schwellwert übertrifft.Method of recognizing italic handwritten Words with the following procedural steps: Receiving digital point-indicating information that has a starting point and a Include endpoint; Choose the points delimited by the starting point and the end point as a checkword; represent of the test word by a distinctive variety of metastases; Create a list of possible true meta-catchwords using a dictionary of metastroke words and the distinctive multitude of metastases; to compare potential true meta-catchwords from the list of possible true meta-catchwords with the distinctive multitude of metastases; To calculate a word measure based on the comparison; and Issuing a first possible true word if the word size exceeds a threshold. Verfahren nach Anspruch 1, wobei das Berechnen des ersten Wortmaßes ein Substituieren eines zweiten Metastriches durch einen ersten Metastrich umfasst, wobei der zweite Metastrich Teil der kennzeichnenden Vielzahl von Metastrichen ist, und das Berechnen des Wortmaßes eine Substitutionserschwerungsgewichtung berücksichtigt.The method of claim 1, wherein calculating the first word measure substituting a second metastroke with a first one Metastrich includes, with the second metastroke being part of the distinctive variety of metastrokes, and calculating the word measure is one Substitution weighting considered. Verfahren nach Anspruch 2, wobei das Berechnen des Wortmaßes ein Einfügen eines dritten Metastriches in die kennzeichnende Vielzahl von Metastrichen umfasst, und das Berechnen des Wortmaßes eine Additionserschwerungsgewichtung berücksichtigt.The method of claim 2, wherein calculating the word measure an insertion of a third metastroke into the distinctive multitude of metastases and calculating the word measure is an add-emphasis weight considered. Verfahren nach Anspruch 3, wobei das Berechnen des Wortmaßes ein Löschen eines vierten Metastriches aus der kennzeichnenden Vielzahl von Metastrichen umfasst, und das Berechnen des Wortmaßes eine Löschungserschwerungsgewichtung berücksichtigt.The method of claim 3, wherein calculating the word measure a delete a fourth metastroke of the distinctive variety of Metastrokes, and calculating the word measure includes an erasure weighting weighting considered. Verfahren nach Anspruch 1, wobei das Berechnen des ersten Wortmaßes ein Substituieren eines zweiten Metastriches durch einen ersten Metastrich umfasst, wobei der zweite Metastrich Teil der kennzeichnenden Vielzahl von Metastrichen ist, und das Berechnen des Wortmaßes eine Substitutionserschwerungsgewichtung berücksichtigt.The method of claim 1, wherein calculating the first word measure comprises substituting a second metastroke with a first metastroke, the second metastroke being part of the distinctive plurality of metastrokes, and calculating the word measure a substitution penalty weight considered. Verfahren nach Anspruch 1, wobei das Berechnen des ersten Wortmaßes ein Einfügen eines ersten Metastriches für einen zweiten Metastrich umfasst, wobei der zweite Metastrich Teil der kennzeichnende Vielzahl von Metastrichen ist, und das Berechnen des Wortmaßes eine Additionserschwerungsgewichtung berücksichtigt.The method of claim 1, wherein calculating the first word measure an insertion a first metastroke for includes a second metastroke, the second metastroke part is the distinctive variety of metastrophes, and calculating of the word measure considers an addition weighting weighting. Verfahren nach Anspruch 1, wobei das Berechnen des ersten Wortmaßes ein Löschen eines ersten Metastriches für einen zweiten Metastrich umfasst, wobei der zweite Metastrich Teil der kennzeichnende Vielzahl von Metastrichen ist, und das Berechnen des Wortmaßes eine Löschungserschwerungsgewichtung berücksichtigt.The method of claim 1, wherein calculating the first word measure a delete a first metastroke for includes a second metastroke, the second metastroke part is the distinctive variety of metastrophes, and calculating of the word measure an erasure weighting considered. Mindestens ein computerlesbares Medium mit von einem Computer ausführbaren Anweisungen, welche, wenn sie ausgeführt werden, das Verfahren nach Anspruch 1 durchführen.At least one computer-readable medium of one Computer executable Instructions which, when executed, follow the procedure Perform claim 1. System in einer Computerumgebung, das umfasst: Mittel zum Empfangen von Strichdaten, die mit einer handgeschriebenen Eingabe korrespondieren; Metastricherkenner-Mittel zum Erzeugen von Eingabe-Metastrichen aus den Strichdaten; Mittel zum Interpretieren der Eingabe-Metastriche als Worte, umfassend Mittel zum Vergleichen der Eingabe-Metastriche mit Wörterbuch-Metastrichen und zum Zuweisen eines Wertes für die Wahrscheinlichkeit einer Übereinstimmung durch Vergleichen der Eingabe-Metastriche mit zumindest einigen aus den Wörterbuch-Metastrichen und Zuweisen einer Wertung, wenn eine Metastrich-Übereinstimmung gefunden ist und Verwenden der Wertungen zum Berechnen eines Wertes für jedes Wort; und Mittel zum Listen der Worte nach ihren Werten.System in a computer environment comprising: medium for receiving stroke data with a handwritten input correspond; Metastroke recognizer means for generating Input metastrokes from the stroke data; Means of interpretation the input metastrokes as words, comprising means for comparison the input metastrokes with dictionary metastrokes and assign a value for the probability of a match by comparing the input metastrokes with at least some from the dictionary metastases and Assign a score if a metastroke match is found and using the scores to calculate a value for each Word; and Means to list the words according to their values. System nach Anspruch 9, weiter umfassend Mittel zum Ersetzen eines Metastriches durch einen anderen Metastrich und Wiederberechnen des Wertes für ein Wort basierend auf einer Substitutionserschwerung.The system of claim 9, further comprising means to replace a metastroke with another metastroke and Recalculating the value for a word based on substitution aggravation. System nach Anspruch 9, weiter umfassend Mittel zum Einfügen eines Metastriches und Wiederberechnen des Wertes für ein Wort basierend auf einer Einsetzungserschwerung.The system of claim 9, further comprising means to paste of a metastroke and recalculating the value of a word based on an insertion difficulty. System nach Anspruch 9, weiter umfassend Mittel zum Löschen eines Metastriches und Wiederberechnen des Wertes für ein Wort basierend auf einer Löschungserschwerung.The system of claim 9, further comprising means to delete of a metastroke and recalculating the value of a word based on a deletion aggravation. System nach Anspruch 9, weiter umfassend Mittel zum Vergleichen jedes Wertes mit einem Schwellwert.The system of claim 9, further comprising means to compare each value with a threshold. System nach Anspruch 9, weiter umfassend Mittel zum Vergleichen eines Wertes für ein Wort mit einem Wert für ein anderes Wort.The system of claim 9, further comprising means to compare a value for a word with a value for another word.
DE4345583A 1992-09-24 1993-08-26 Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match Expired - Lifetime DE4345583B4 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE4394624A DE4394624B4 (en) 1992-09-24 1993-08-26 Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US07/954,351 US5313527A (en) 1991-06-07 1992-09-24 Method and apparatus for recognizing cursive writing from sequential input information
US954,351 1992-09-24
DE4394624A DE4394624B4 (en) 1992-09-24 1993-08-26 Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match

Publications (1)

Publication Number Publication Date
DE4345583B4 true DE4345583B4 (en) 2007-01-04

Family

ID=37545341

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4345583A Expired - Lifetime DE4345583B4 (en) 1992-09-24 1993-08-26 Cursive handwritten word recognition from sequential input information - using construction word correlation tables to select strings of vocabulary metastrokes corresponding to candidate word and identifies most likely match

Country Status (1)

Country Link
DE (1) DE4345583B4 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2087616A (en) * 1980-01-08 1982-05-26 Nat Res Dev Apparatus and Method for Generating an Alpha Numeric Output from Shorthand
US4718102A (en) * 1983-01-19 1988-01-05 Communication Intelligence Corporation Process and apparatus involving pattern recognition
US5140645A (en) * 1987-10-08 1992-08-18 Whitaker Ranald O Computer compatible character for reliable reading by photoreader

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2087616A (en) * 1980-01-08 1982-05-26 Nat Res Dev Apparatus and Method for Generating an Alpha Numeric Output from Shorthand
US4718102A (en) * 1983-01-19 1988-01-05 Communication Intelligence Corporation Process and apparatus involving pattern recognition
US5140645A (en) * 1987-10-08 1992-08-18 Whitaker Ranald O Computer compatible character for reliable reading by photoreader

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Kamel, K., Imam, I., "A computerized transcription system for cursive shorthand writing". South- eastcon '88., IEEE Conference Proceedings, 11-13, Apr 1988, Pages: 336-339 *

Similar Documents

Publication Publication Date Title
DE69428590T2 (en) COMBINED LEXICON AND LIST OF CHARACTERS OF HANDWRITING
DE69907513T2 (en) HANDWRITTEN OR SPEECH WORD RECOGNITION WITH NEURONAL NETWORKS
DE19547812C2 (en) Character string reader
DE69030310T2 (en) Restriction-controlled online recognition of handwritten characters and symbols
DE69333431T2 (en) Method for recognizing handwritten symbols
DE69424350T2 (en) Context-sensitive method of finding information about a word in an electronic dictionary
DE69428527T2 (en) Kritzlervergleich
DE3926327C2 (en) Method and system for recognizing characters on a medium
DE69230632T2 (en) Optical word recognition through word shape analysis
Munson Experiments in the recognition of hand-printed text, part I: character recognition
DE69829074T2 (en) IDENTIFICATION OF LANGUAGE AND SYMBOLS FROM TEXT-REPRESENTATIVE DATA
EP1665132B1 (en) Method and system for collecting data from a plurality of machine readable documents
DE69525401T2 (en) Method and device for identifying words described in a portable electronic document
DE69231309T2 (en) Method and system for handwriting recognition
DE69730930T2 (en) Method and device for character recognition
DE69610243T2 (en) Method for training an identification system with character patterns
DE60225170T2 (en) METHOD AND DEVICE FOR DECODING HANDWRITCH SIGNS
DE69325204T2 (en) Method and device for developing an initial collection of handwriting prototypes into a user-specific collection
DE69033042T2 (en) Data processing
DE69417105T2 (en) Device and method for recognizing handwritten symbols
DE69425806T2 (en) Detection of unintended results in a computer system that uses a pen user interface
DE69222141T2 (en) Method and device for recognizing touching and degraded text
DE60217299T2 (en) HOLISTIC-ANALYTICAL DETECTION OF HAND-WRITTEN TEXT
DE69610478T2 (en) CHARACTER RECOGNITION SYSTEM DETERMINATION OF SCANNED AND "REAL-TIME" HAND-WRITTEN CHARACTERS
DE69230092T2 (en) Method and device for character recognition

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
Q172 Divided out of (supplement):

Ref document number: 4394624

Country of ref document: DE

Kind code of ref document: P

8110 Request for examination paragraph 44
AC Divided out of

Ref document number: 4394624

Country of ref document: DE

Kind code of ref document: P

AC Divided out of

Ref document number: 4394624

Country of ref document: DE

Kind code of ref document: P

8364 No opposition during term of opposition
R071 Expiry of right
R071 Expiry of right