SK3096A3 - Method of stroke segmentation for handwritten input - Google Patents

Method of stroke segmentation for handwritten input Download PDF

Info

Publication number
SK3096A3
SK3096A3 SK30-96A SK3096A SK3096A3 SK 3096 A3 SK3096 A3 SK 3096A3 SK 3096 A SK3096 A SK 3096A SK 3096 A3 SK3096 A3 SK 3096A3
Authority
SK
Slovakia
Prior art keywords
curvature
stroke
point
value
curvature derivative
Prior art date
Application number
SK30-96A
Other languages
Slovak (sk)
Inventor
Chris A Kortge
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of SK3096A3 publication Critical patent/SK3096A3/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction

Abstract

The method of the present invention includes a step of calculating the derivative (140), or instantaneous rate of change, of the curvature at points in the handwritten input (110). The method then selects as stroke boundary points certain points (or pixels) in the input which lie at a midpoint between a point of high curvature derivative and a succeeding point of low curvature derivative (150). Such boundary points are not influenced by absolute curvature values, but rather only by relative changes in the curvature. The stroke segmentation boundary points are provided to a stroke-based recognizer for interpretation of the handwritten input (170).

Description

SPÔSOB SEGMENTÁCIE ŤAHOV PRE RUKOPISNÝ VSTUPMETHOD OF SEGMENTATION OF STRAPS FOR GRAPHIC ENTRY

Oblasť technikyTechnical field

Tento vynález sa všeobecne týka rozpoznávania rukopisu a predovšetkým spôsobu segmentácie ťahov pre rukopisný vstup.The present invention relates generally to handwriting recognition and, in particular, to a method of stroke segmentation for handwriting input.

Doterajší stav technikyBACKGROUND OF THE INVENTION

Strojové rozpoznávanie ľudského rukopisu je veľmi zložitá záležitosť a so súčasným prudkým rozširovaním výpočtových prostriedkov s možnosťou vstupu pomocou pera sa stalo dôležitou úlohou, ktorej sa treba venovať. Existuje veľké množstvo rôznych prístupov k jeho riešeniu. Jedným užitočným prístupom je rozdelenie rukopisu do postupnosti základných pohybov alebo ťahov a použitie týchto ťahov, ktoré sú určitým spôsobom parametrizované, ako vstupov znakového rozpoznávača.Machine recognition of the human handwriting is a very complex matter and, with the simultaneous rapid expansion of pen-based computing, it has become an important task to be addressed. There are many different approaches to its solution. One useful approach is to divide the manuscript into a sequence of basic movements or strokes, and to use those strokes, which are somewhat parameterized, as character recognition inputs.

Kľúčovou podmienkou u rozpoznávača na základe ťahov je, že mnohé prípady rovnakej znakovej triedy (napr. písmena A písané v rôznych časoch rôznymi pisateľmi) by mali byt zakaždým rozdelené do podobného súboru ťahov. Toto pomáha zabezpečiť, že rozpoznávanie nie je príliš zložité, lebo popis znakových prípadov sa bude javiť znakovému rozpoznávaču podobne. Ideálne by všetky prípady daného znaku vždy obsahovali rovnaký počet ťahov, všetky ťahy by boli v rovnakej relatívnej polohe a popisy vlastností ťahov by boli veľmi podobné vo všetkých prípadoch. Tento ideál nie je v praxi dosiahnuteľný, ale presnosť rozpoznávania môže byt zlepšená do tej miery, do akej sa mu možno priblížiť.A key condition for a stroke-based recognizer is that many instances of the same character class (eg, A letters written at different times by different writers) should each be divided into a similar set of strokes. This helps to ensure that recognition is not too complicated because the character case description will appear similar to the character recognizer. Ideally, all instances of a given feature would always contain the same number of strokes, all strokes would be in the same relative position, and the descriptions of the stroke properties would be very similar in all cases. This ideal is not achievable in practice, but the accuracy of recognition can be improved to the extent that it can be approached.

V jednom z doteraz používaných spôsobov sú hranice ťahov umiestnené v bodoch, kde rýchlosť pera vo vertikálnom (alebo y) smere je nulová, tzn. v bodoch, kde sa písmo začína pohybovať hore či dole. Vznikajúce súbory ťahov môžu byť teda nazvané ťahy hore a ťahy dole. Tento spôsob je diskutovaný v práci Mermelstein & Eden, Experiments on Computer Recognition ofIn one of the methods used hitherto, the stroke boundaries are located at points where the speed of the pen in the vertical (or y) direction is zero, i. at points where the font begins to move up or down. The resulting sets of strokes can thus be called upstrokes and downstrokes. This method is discussed in Mermelstein & Eden, Experiments on Computer Recognition of

Connected Handwritten Words, v Information and Control, zv. 7, str. 255 - 270, 1964. Jednou z nevýhod tohto spôsobu je skutočnosť, že je príliš citlivý na zmeny vo vertikálnom smere a necitlivý na zmeny v horizontálnom smere. Veľa znakov je ale zložených z horizontálnych častí - napr. vodorovná čiarka t a tri nožičky E sú obvykle oveľa viac horizontálne ako vertikálne, dokonca i u nedbalého rukopisu. Segmentovač ťahov založený na rýchlosti v smere y rozdelí niekedy horizontálnu časť do jedného ťahu, ale často ju rozdelí do dvoch, troch či viacerých ťahov, jednoducho kvôli drobnému chveniu pera vo vertikálnom smere. Toto vedie k nízkej rozpoznávacej presnosti, lebo mnohé prípady rovnakého znaku budú často segmentované do rozdielne vyzerajúcich súborov ťahov. Pokusy opraviť nepresnosti tohto spôsobu, zahrňujúce požiadavku minimálnej zmeny vo vertikálnom smere pred vytvorením nového ťahu, mali len obmedzenú úspešnosť a veľa rovnakých základných problémov stále zostáva.Connected Handwritten Words, in Information and Control, Vol. 7, p. 255-270, 1964. One of the disadvantages of this method is that it is too sensitive to changes in the vertical direction and insensitive to changes in the horizontal direction. But many characters are composed of horizontal parts - eg. the horizontal line t and the three legs E are usually much more horizontal than vertical, even in a sloppy manuscript. A y-speed-based stroke segmentator sometimes splits the horizontal portion into one stroke, but often splits it into two, three, or more strokes, simply because of a slight flick of the pen in the vertical direction. This leads to low recognition accuracy because many instances of the same feature will often be segmented into different looking stroke sets. Attempts to correct the inaccuracies of this method, including requiring a minimum change in the vertical direction before a new move was made, had only limited success and many of the same underlying problems still remain.

Iný súčasný spôsob rieši tento problém umiestnením hraníc ťahov do bodov, kde zakrivenie je vo svojom lokálnom maxime a presahuje určitú prahovú hodnotu, ktorá zodpovedá ostrým ohybom v rukopise. Pretože sa ostrý ohyb môže vyskytnúť bez ohladu na smer, ktorým sa pero pohybuje, nie je táto metóda citlivá na orientáciu rôznych častí rukopisného vstupu ako sú slová alebo znaky. Technika založená na zakrivení má ale tiež svoje nedostatky. Predpokladajme napr., že niekto píše L s veľmi pozvolným zakrivením, skôr ako so zakrivením ostrým, takže začne vyzerať viac ako C. V tomto prípade môže spôsob zlyhať pri segmentácii L, pokial nebolo dosiahnuté prahové zakrivenie požadované pre hranice ťahov. Púhe zníženie prahovej hodnoty problém nerieši, lebo to by viedlo len k neprimeranému počtu ťahov. Príliš veľký počet jednotlivých ťahov je rovnako nežiaduci, ako ich príliš malý počet, lebo to opäť znamená, že mnohé prípady rovnakého znaku sú často segmentované do rôznych typov ťahov.Another current method addresses this problem by placing stroke boundaries at points where the curvature is at its local maximum and exceeds a certain threshold that corresponds to sharp bends in the manuscript. Since a sharp bend may occur regardless of the direction in which the pen moves, this method is not sensitive to the orientation of various parts of the handwriting input, such as words or characters. The curvature-based technique also has its drawbacks. For example, suppose someone writes L with a very gradual curvature rather than a sharp curvature, so that it starts to look more than C. In this case, the method may fail to segment L until the threshold curvature required for the stroke boundaries has been reached. Simply lowering the threshold does not solve the problem, as this would only lead to a disproportionate number of moves. Too many single moves are as undesirable as too few, because again, many cases of the same feature are often segmented into different types of moves.

Je teda potrebný spôsob segmentácie, ktorý je presnejší a nemá nedostatky uvedených spôsobov, ako je spôsob rýchlosti v smere y a existujúci spôsob zakrivenia.There is therefore a need for a segmentation method that is more accurate and does not have the drawbacks of said methods, such as the y-speed rate method and the existing curvature method.

Podstata vynálezuSUMMARY OF THE INVENTION

V súlade s predloženým vynálezom je realizovaný spôsob segmentácie rukopisného vstupu do ťahov, ktorých počet je konzistentný pre mnoho prípadov každej jednotlivej znakovej triedy.In accordance with the present invention, a method of segmenting handwriting input into strokes, the number of which is consistent for many cases of each individual character class, is implemented.

Predložený vynález poskytuje spôsob segmentácie rukopisného vstupu do ťahov, ktoré sú si podobné tvarom a umiestnením pre mnoho prípadov každej jednotlivej znakovej triedy na vstupe.The present invention provides a method of segmenting handwritten entry into strokes that are similar in shape and location for many cases of each individual character class at the entry.

Spôsob podlá predloženého vynálezu všeobecne zahrňuje krok výpočtu derivácie alebo okamžité hodnoty zmeny zakrivenia v bodoch rukopisného vstupu. Tento spôsob potom vyberá ako body hranice ťahu určité body (alebo obrazové prvky) vo vstupe, ktoré ležia medzi bodom vysokej derivácie zakrivenia a následným bodom nízkej derivácie zakrivenia. Takéto hraničné body nie sú ovplyvnené absolútnymi hodnotami zakrivenia, ale skôr len relatívnymi zmenami v zakrivení.The method of the present invention generally comprises the step of calculating the derivative or the instantaneous value of the curvature change at the handwriting entry points. The method then selects certain points (or pixels) in the input that lie between the high curvature derivative point and the subsequent low curvature point as the stroke boundary points. Such boundary points are not affected by absolute curvature values, but rather by relative changes in curvature.

Prehlad obrázkov na výkresochOverview of the drawings

Obr. 1 zobrazuje vývojový diagram postupu identifikovania hraníc ťahov v súlade s výhodným uskutočnením predloženého vynálezu.Fig. 1 illustrates a flow chart of a stroke boundary identification process in accordance with a preferred embodiment of the present invention.

Obr. 2 zobrazuje segmentáciu rukopisného vstupu do ťahov vytvorenú predchádzajúcim spôsobom rýchlosti v smere y.Fig. 2 illustrates a handwriting stroke segmentation generated by a prior speed y-direction.

Obr. 3 zobrazuje segmentáciu rukopisného vstupu do ťahov vytvorenú predchádzajúcim spôsobom zakrivenia.Fig. 3 illustrates the handwriting stroke segmentation created by the preceding curvature method.

Obr. 4 zobrazuje segmentáciu rukopisného vstupu do ťahov vytvorenú výhodným uskutočnením predloženého vynálezu.Fig. 4 illustrates a segment of handwritten stroke entry created by a preferred embodiment of the present invention.

Obr. 5 zobrazuje body vytvárajúce písmeno L tak, ako sú prijaté z digitizéra.Fig. 5 shows the points forming the letter L as received from the digitizer.

Obr. 6 zobrazuje body vytvárajúce písmeno L po prevzorkovaní na konštantné vzdialenosti v súlade s výhodným uskutočnením predloženého vynálezu.Fig. 6 shows the points forming the letter L after resampling at constant distances in accordance with a preferred embodiment of the present invention.

Na obr. 7 je rozložený pohľad zobrazujúci výpočet zakrivenia vo výhodnom uskutočnení predloženého vynálezu.In FIG. 7 is an exploded view showing the curvature calculation in a preferred embodiment of the present invention.

Obr. 8 graficky zobrazuje hodnoty zakrivenia vypočítané pre každý bod v obr. 7.Fig. 8 graphically illustrates the curvature values calculated for each point in FIG. 7th

Obr. 9 graficky zobrazuje derivácie hodnôt zakrivenia vypočítané pre každý bod z obr. 7.Fig. 9 graphically depicts the curvature value derivatives calculated for each point of FIG. 7th

Príklady uskutočnenia vynálezuDETAILED DESCRIPTION OF THE INVENTION

Rukopisný znakový vstup je zvyčajne získavaný od užívateľa vo forme oddelených spojitých segmentov. Oddelený spojitý segment sa skladá z jedného či viacero ťahov pera, kde ťah pera je stopa, ktorú pero zanecháva počas doby svojho kontaktu so vstupným zariadením, ako je digitalizačná tabuľka alebo papier.Typically, handwritten character input is obtained from the user in the form of separate continuous segments. A separate continuous segment consists of one or more pen strokes, where the pen stroke is the trace that the pen leaves during its contact with the input device, such as a digitizing table or paper.

V predloženom vynáleze sú rozpoznávané jednotky rukopisného vstupu, tvorené jedným či viacerými oddelenými spojitými segmentmi. Rukopisný vstup je vstup, ktorý je snímaný elektronicky, čo zahrňuje, ale nie je obmedzené na nasledujúce: rukopisný vstup, elektronický vstup, vstup snímaný tlakom ako je tlačový vstup, vstup prijímaný elektronicky, ako napríklad faxom, prijímačom rádiového vyhľadávacieho systému alebo iným zariadením.In the present invention, handwriting input units are formed by one or more separate continuous segments. Handwriting input is an input that is electronically scanned, including but not limited to: handwriting input, electronic input, pressure sensed input such as a print input, input received electronically, such as by fax, a radio search system receiver, or other device.

Ťah je vyjadrený ako postupnosť bodov vzorkovaných v približne pravidelných intervaloch vstupným zariadením. Každý bod je učený minimálne súradnicami x a y. Ťahy môžu byt snímané elektronicky za použitia digitalizačnej tabulky alebo inak môžu byť odvodené od skanovaného alebo faxovaného obrazu procesom riadkovej detekcie v obraze; takéto metódy elektronického snímania sú v odbore známe. Vo výhodnom spôsobe je rukopisný vstup prijímaný zariadením ako je osobný číslicový pomocník (PDA) alebo iné zariadenie. Ďalšie prostriedky, ktoré slúžia na príjem rukopisného vstupu, zahrňujú, ale nie sú obmedzené na nasledujúce: počítače, modemy, prijímače rádiového vyhladávacieho systému, telefóny, číslicové televízie, interakčné televízie, zariadenia majúce digitalizačný tablet, telefaxové zariadenia, skanovacie zariadenia a ďalšie zariadenia schopné snímať rukopisný vstup. Všeobecne, keď sú ťahy snímané elektronicky, je každý bod vyjadrený obrazovým prvkom tak, že ťah je vyjadrený ako rad obrazových prvkov na zariadení.The thrust is expressed as a sequence of points sampled at approximately regular intervals by the input device. Each point is taught at least by x and y coordinates. The strokes may be scanned electronically using a digitizing table, or otherwise may be derived from a scanned or faxed image by a line detection process in the image; such electronic scanning methods are known in the art. In a preferred method, handwriting input is received by a device such as a personal digital assistant (PDA) or other device. Other means of receiving handwriting include, but are not limited to, computers, modems, radio search system receivers, telephones, digital televisions, interactive televisions, digitizing tablet devices, fax machines, scanning devices, and other devices capable of capture handwriting input. Generally, when strokes are sensed electronically, each point is represented by a pixel such that the stroke is expressed as a series of pixels on the device.

V súlade s predloženým vynálezom môže byť rukopisný vstup vo forme alfanumerických znakov, ideografických znakov alebo iných foriem znakov či symbolov písanej komunikácie.In accordance with the present invention, the handwriting input may be in the form of alphanumeric characters, ideographic characters or other forms of characters or symbols of written communication.

Obr. 2 a obr. 3 zobrazujú segmentáciu ťahov alfanumerického rukopisného vstupu s vysokou pravdepodobnosťou nepresností v interpretácii vstupu, keď segmentácia ťahov príde do rozpoznávača na základe ťahov. Obr. 4 zobrazuje segmentáciu ťahov rovnakého alfanumerického vstupu ako na obr. 2 a obr. 3, kde je segmentácia ťahov vykonávaná v súlade s predloženým vynálezom a takáto segmentácia ťahov má vysokú pravdepodobnosť presnej interpretácie pri príchode do rozpoznávača na základe ťahov.Fig. 2 and FIG. 3 illustrates stroke segmentation of alphanumeric handwriting input with a high probability of inaccuracy in input interpretation when stroke segmentation arrives at the stroke recognizer. Fig. 4 shows stroke segmentation of the same alphanumeric input as in FIG. 2 and FIG. 3, where stroke segmentation is performed in accordance with the present invention, and such stroke segmentation has a high likelihood of accurate interpretation upon arrival at the stroke recognizer.

Obr. 1 zobrazuje vývojový diagram výhodného spôsobu v súlade s predloženým vynálezom. Rukopisný vstup z digitizéra či iného zariadenia je prijímaný vo forme súradníc x a y 110 (s pridruženými stavmi zdvihnutého alebo spusteného pera). Typicky sú tieto body prezentované obrazovými prvkami. Predložená metóda všeobecne prevzorkováva rukopisný vstup za účelom získania bodov, ktoré sú rovnomerne rozmiestnené v celej dĺžke rukopisného vstupu 120. Obr. 5 zobrazuje príklad písmena L 500 ako rad bodov alebo obrazových prvkov pred prevzorkovaním. Obr. 6 zobrazuje to isté písmeno L 600 ako rad bodov alebo obrazových prvkov po prevzorkovaní. Prevzorkovanie sa deje použitím medzibodovej vzdialenosti d 610, ktorá je konštantná v celom rukopisnom vstupe. Najlepšie je hodnota d vybraná tak, že stredná hodnota vstupnej výšky rukopisného vstupu je približne v rozmedzí 15krát až 30krát d. Napríklad na obr. 6 je hodnota d vybraná tak, že stredná hodnota výšky písmena v slove je približne v rozmedzí 15krát až 30krát d.Fig. 1 shows a flow chart of a preferred method in accordance with the present invention. The handwriting input from the digitizer or other device is received in the form of x and y coordinates 110 (with associated pen raised or lowered states). Typically, these dots are represented by pixels. The present method generally resample handwriting input to obtain points that are equally spaced over the length of handwriting input 120. FIG. 5 shows an example of an L 500 as a series of dots or pixels prior to resampling. Fig. 6 shows the same letter L 600 as a series of dots or pixels after resampling. Sampling is done using a point-to-point distance d 610 that is constant throughout the handwriting input. Preferably, d is selected such that the mean value of the handwriting input height is approximately 15 to 30 times d. For example, in FIG. 6, the value of d is selected such that the mean value of the letter height in the word is approximately between 15 and 30 times d.

Výhodné uskutočnenie na obr. 1 vypočítava zakrivenie v každom prevzorkovanom bode 130. Obr. 7 ilustruje graficky popis dát pre výpočet zakrivenia v bode R 710. Zakrivenie v prevzorkovanom bode R 710. je definované ako vzdialenosť k bodu nasledujúcemu po R (bod R + 1 730) od bodu P 720, získanému lineárnou projekciou od bodu predchádzajúcemu R (R - 1, 750) cez vlastné R. Táto vzdialenosť je znázornená na obr. 7 ako prvok 740. Zakrivenie v koncových bodoch rukopisného vstupu je definované ako rovnaké v zodpovedajúcich najbližších susedných bodoch. Zakrivenie vo vnútorných bodoch rukopisného vstupu môže byť tiež vypočítané projekciou dvoch bodov vzdialených od R, skôr ako jedného bodu (a použitím bodu, ktorý je dva body pred R, skôr ako bodu R - 1), aby bol získaný odhad odolnejší voči chybám. Obr. 8 zobrazuje graficky hodnoty zakrivenia získané pre body znázornené na obr. 7.The preferred embodiment of FIG. 1 calculates the curvature at each resampling point 130. FIG. 7 illustrates graphically a description of the data for calculating the curvature at point R 710. The curvature at the resampled point R 710. is defined as the distance to the point following R (point R + 1 730) from point P 720 obtained by linear projection from the point preceding R (R). This distance is shown in FIG. 7 as the element 740. The curvature at the endpoints of the handwriting entry is defined as the same at the corresponding nearest adjacent points. The curvature at the internal points of the handwriting entry can also be calculated by projecting two points distant from R rather than one point (and using a point that is two points ahead of R rather than a point R-1) to obtain a more error-tolerant estimate. Fig. 8 shows graphically the curvature values obtained for the points shown in FIG. 7th

Napríklad vyššie zmienený príklad písmena L s pozvoľným zahnutím môže byť segmentovaný do vertikálneho a horizontálneho ťahu, pokiaľ dve rovné časti L sú podstatne rovnejšie ako ohyb medzi nimi. Zakrivenie by sa teda zvyšovalo smerom k ohybu (t.j. derivácia zakrivenia by bola vysoká) a znižovalo smerom od ohybu (derivácia zakrivenia by bola nízka), čo dovoluje mať hranicu ťahu v ohybe, alebo blízko neho, ak je to žiadané.For example, the aforementioned example of a gradual curve L may be segmented into a vertical and a horizontal stroke if the two straight portions of L are substantially equal to the bend between them. Thus, the curvature would increase towards the bend (i.e., the derivative of the curvature would be high) and decrease from the bend (the derivative of the curvature would be low), allowing the bending tensile limit to be near or close to it if desired.

Ak bolo vo výhodnom uskutočnení predloženého vynálezu už raz získané zakrivenie pre každý prevzorkovaný bod, skupina zakrivenia pre prevzorkované body môže byt vyhladená, aby boli minimalizované akékoľvek známe artefakty zavedené digitalizačným procesom. Typ vyhladenia, ktoré má byt vykonané, by mal byt štandardný spôsob, ktorý je vybraný na základe konkrétnych digitalizačných znakov. Toto môže zahrňovat spriemerovanie hodnoty bodu s jeho susednými bodmi (váženie bodu samého a najbližších vyšších bodov) a náhrady hodnoty zakrivenia v zmienenom bode vypočítaným priemerom. Ideálne by velkost tu použitého vyhladzovacieho okna mala byt širšia v oblastiach nízkeho zakrivenia písma a užšia v oblastiach velkého zakrivenia, aby boli minimalizované straty dôležitých informácií pri vyhladzovacom procese. Pretože je predmetom vyhladzovania zakrivenie samé, jedným výhodným spôsobom vyhladzovania je výpočet počiatočných zakrivení, kde vyhladenie je založené na týchto zakriveniach, a jootom znovuvyhladenie založené na novo vypočítaných zakriveniach.If, in a preferred embodiment of the present invention, the curvature has already been obtained for each resampling point, the curvature group for the resampling points may be smoothed to minimize any known artifacts introduced by the digitization process. The type of anti-aliasing to be performed should be a standard method that is selected based on specific digitizing characters. This may include averaging the point value with its adjacent points (weighting the point itself and the nearest higher points) and replacing the curvature value at said point with a calculated average. Ideally, the size of the smoothing window used herein should be wider in areas of low font curvature and narrower in areas of large curvature to minimize the loss of important information in the smoothing process. Since the object of smoothing is the curvature itself, one preferred smoothing method is to calculate the initial curves, where smoothing is based on these curves, and again smoothing based on the newly calculated curves.

Vo výhodnom uskutočnení predloženého vynálezu je pre každý prevzorkovaný bod vypočítaná absolútna hodnota zakrivenia vynásobením každej zápornej hodnoty zakrivenia hodnotou -1. Absolútne hodnoty zakrivenia sú pre výpočet derivácií zakrivenia používané skôr ako skutočné hodnoty zakrivenia, pretože celkove výhodné uskutočnenia predloženého vynálezu sa zaoberajú iba ostrostou ohybov v písme a nie ktorým smerom sa daný ohyb zakrivuje.In a preferred embodiment of the present invention, the absolute curvature value is calculated for each resampling point by multiplying each negative curvature value by -1. Absolute curvature values are used to calculate curvature derivatives rather than actual curvature values, since the generally preferred embodiments of the present invention deal only with the sharpness of the font bends and not in which direction the curve is curved.

Ako je zobrazené na obr. 1, proces ďalej pokračuje výpočtom derivácie zakrivenia v každom prevzorkovanom bode 140. Podlá obr. 7 je derivácia zakrivenia v bode R definovaná ako absolútna hodnota zakrivenia v bode R +1 mínus absolútna hodnota zakrivenia v bode R - 1 delené dvoma (t.j. sklon krivky zakreslených hodnôt zakrivenia). Obr. 9 graficky zobrazuje deriváciu zakrivenia získanú v každom bode uvedenom na obr. 7. Podobne ako pri použití viac ako dvoch bodov na získanie presnejšej hodnoty zakrivenia, ako je popísané vyššie, derivácia zakrivenia by mohla byť vypočítaná pomocou širšieho okna (päť bodov oproti trom), kde existujú relevantné body a užšieho okna (dva body oproti trom), tam, kde je to nutné. Pretože derivácia zakrivenia nemôže byt vypočítaná v koncových bodoch napísaného segmentu, derivácia zakrivenia v koncových bodoch je jednoducho definovaná ako rovnaká v zodpovedajúcich susedných bodoch.As shown in FIG. 1, the process continues by calculating the curvature derivative at each resampling point 140. Referring to FIG. 7, the curvature derivative at R-point is defined as the absolute value of curvature at R-point +1 minus the absolute value of curvature at R-1 divided by two (i.e. the slope of the curve of plotted curvature values). Fig. 9 graphically illustrates the curvature derivative obtained at each point shown in FIG. 7. As with using more than two points to obtain a more accurate curvature value as described above, the curvature derivative could be calculated using a wider window (five points vs. three) where there are relevant points and a narrower window (two points vs. three) , where necessary. Since the curvature derivative cannot be calculated at the endpoints of the written segment, the curvature derivative at the endpoints is simply defined as the same at the corresponding adjacent points.

Podľa obr. 1 a 9 výhodné uskutočnenie spôsobu ďalej skúma novo vypočítané pole hodnôt derivácií zakrivenia za účelom určenia bodov, kde je derivácia vo svojom lokálnom maxime 910 (definovanom tak, že zahrňuje body na konci obratu krivky a začínajúce klesať) alebo kde je derivácia vo svojom lokálnom minime 920 (definovanom tak, že zahrňuje body na konci obratu krivky a začínajúca stúpať). Pre každú oblasť vstupu (v čase) po lokálnom maxime a pred lokálnym sekcie (vyjadrený v dĺžke oblúka minimom je určený stredový bod sekcie) 930. Tento stredový bod je definovaný ako M 930. .Pokiaľ rozdiel medzi hodnotami lokálneho maxima a lokálneho minima sekcie prekročí prahovú hodnotu T' 940 a absolútna hodnota zakrivenia v bode M prekročí určitú prahovú hodnotu T (820), bod M je vybraný ako hranica ťahu 150.According to FIG. 1 and 9, a preferred embodiment of the method further examines a recalculated array of curvature derivative values to determine points where the derivative is at its local maximum of 910 (defined to include points at the end of the curve turnover and starting to decrease) or where the derivative is at its local minimum 920 (defined to include points at the end of curve turnover and beginning to rise). For each input area (in time) after the local maximum and before the local section (expressed by the minimum arc length, the center point of the section is specified) 930. This center point is defined as M 930.When the difference between the local maximum and local minimum values exceeds the threshold value T '940 and the absolute value of the curvature at the point M exceed a certain threshold value T (820), the point M being selected as the tension limit 150.

Parametre T' a T musia byť odhadnuté a závisia od jednotiek, v ktorých sú merané zakrivenie a derivácia zakrivenia. Presné hodnoty tu nie sú kritické, ak je používaný znakový rozpoznávač tolerujúci chyby. Pri vykonávaní akéhokoľvek experimentálneho vyladenia týchto alebo akýchkoľvek iných parametrov na vytvorenie špecifického uskutočnenia vynálezu je požadovaným cieľom dosiahnutie čo najrovnorodejšej segmentácie pre mnoho prípadov jednotlivých znakových tried. Toto by malo byť vykonané empiricky, skúmaním ako procedúra segmentuje rôzne skutočné vzorky písma, ktoré má byt rozpoznávané.The parameters T 'and T must be estimated and depend on the units in which the curvature and the curvature derivative are measured. The exact values here are not critical if an error tolerant character recognizer is used. When performing any experimental tuning of these or any other parameters to create a specific embodiment of the invention, the desired goal is to achieve as uniform segmentation as possible for many cases of individual character classes. This should be done empirically, by examining how the procedure segments the different actual font samples to be recognized.

Okrem už popísaných zvolených hraničných bodov ťahov sú ako hraničné body ťahov zvolené body, kde sa pero zdvíha či spúšťa. Vo výhodnom uskutočnení predloženého vynálezu môžu byť hraničné body založené na derivácii zakrivenia posunuté až o dva body, čo spôsobí, že padnú do bodov, kde absolútne hodnoty zakrivenia sú maximálne 160. Posunutím hraničných bodov založených na derivácii zakrivenia môže byť zlepšené určenie hraničných bodov ťahov tým, že ako miera zakrivenia, tak derivácia zakrivenia poskytnú rovnaké hranice ťahu. Táto výhodná aplikácia predloženého vynálezu je ale vykonávaná pre daný bod iba vtedy, ak nebude vytvorený žiaden ťah zvolený z menej ako troch bodov.In addition to the already described selected stroke boundary points, the stroke points are where the pen is raised or lowered. In a preferred embodiment of the present invention, the curvature-based boundary points may be shifted by up to two points, causing them to fall to points where the absolute curvature values are a maximum of 160. that both the curvature rate and the curvature derivative will provide the same tension limits. However, this preferred application of the present invention is performed for a given point only if no thrust selected from less than three points is created.

Súbor hraničných bodov ťahu definuje v súlade s predloženým vynálezom súbor zodpovedajúcich ťahov. Tieto ťahy môžu byť potom postúpené znakovému rozpoznávaču na základe ťahov za účelom rozpoznávania rukopisného vstupu.The set of stroke boundary points defines a set of corresponding strokes in accordance with the present invention. These strokes can then be passed to the character recognizer based on the strokes to recognize handwriting input.

Predložený vynález a jeho výhodné uskutočnenia sa týkajú nových presnejších metód segmentácie ťahov. V súlade s predloženým vynálezom je vo vela prípadoch rukopisného vstupu vstup zakaždým opakovane rozdelený do podobných súborov ťahov. Napríklad, ak je rukopisným vstupom písmeno L, napísané v rôznych časoch rôznymi pisateľmi, predložený vynález a jeho výhodné uskutočnenie by zakaždým presnejšie rozdelili vstup písmena L do podobných hraničných bodov segmentácie ťahov bez ohladu na rozdiely rôznych pisateľov. Takáto segmentácia ťahov by pomohla v zaistení presnejšej interpretácie rozpoznávačom na základe ťahov.The present invention and its preferred embodiments relate to new more precise methods of stroke segmentation. In accordance with the present invention, in many handwritten input cases, the input is repeatedly divided into similar sets of strokes each time. For example, if the handwritten entry is an L written at different times by different writers, the present invention and its preferred embodiment would each time more precisely divide the L entry into similar stroke segmentation points, regardless of the differences of the different writers. Such stroke segmentation would help to provide a more accurate interpretation of stroke-based recognizer.

Odborníci v danom odbore zistia, že je možné použiť množstvo uskutočnení predkladaného vynálezu. Jedno zrejmé rozšírenie je z prípadu tu popísaného tlačeného rukopisu pre prípad spojovaného písma. Predkladaný spôsob segmentácie ťahov je nezávislý na spôsobe oddeľovania znakov, a teda techniky dovolujúce spracovanie spojovaného písma môžu ľahko využiť tu popísaný spôsob segmentácie ťahov. Iným uskutočnením by mohla byť segmentácia skanovaného alebo nespriahnutého písma do ťahov. Priamy spôsob aplikácie predloženého vynálezu na takýto problém by spočíval v stenčení písma, aby bola dosiahnutá konštantná šírka napísanej krivky. Hranice ťahov by potom mohli byt stanovené ako v bodoch založených na derivácii zakrivenia, tak v priesečníkových bodoch, pretože chýbajúca časová informácia spôsobuje, že priesečníky a dotýkajúce sa ohyby vyzerajú podobne.Those skilled in the art will recognize that a number of embodiments of the present invention can be used. One obvious extension is from the case of the printed manuscript described herein for the case of the combined script. The present stroke segmentation method is independent of the character separation method, and hence, techniques allowing the processing of the combined font can easily utilize the stroke segmentation method described herein. Another embodiment could be segmentation of the scanned or unlinked font into strokes. A straightforward method of applying the present invention to such a problem would be to reduce the font to achieve a constant width of the written curve. The stroke boundaries could then be determined at both the curvature derivative points and the intersection points, because the lack of time information makes the intersections and touching bends look similar.

Claims (8)

1. Spôsob rozpoznávania rukopisného znaku zloženého z množiny sfarbených obrazových bodov, zahrňujúci kroky:A method for recognizing a handwriting feature composed of a plurality of colored pixels, comprising the steps of: - výpočet hodnoty derivácie zakrivenia pre každý z množiny sfarbených obrazových bodov, kde každá hodnota derivácie zakrivenia predstavuje rýchlosť zmeny absolútneho zakrivenia v zodpovedajúcom obrazovom bode,- calculating the value of the curvature derivative for each of the plurality of colored pixels, wherein each value of the curvature derivative represents the rate of change of the absolute curvature at the corresponding pixel, - výber súboru hraníc ťahov tak, že každá hranica ťahu leží medzi sfarbeným obrazovým ‘bodom s vysokou hodnotou derivácie zakrivenia a následným sfarbeným obrazovým bodom s nízkou hodnotou derivácie zakrivenia,- selecting a set of stroke boundaries such that each stroke boundary lies between a colored pixel with a high value of curvature derivative and a subsequent colored pixel with a low value of curvature derivative, - určenie súboru ťahov tak, že každá hranica ťahov je umiestnená na konci ťahu,- determining the set of strokes so that each stroke boundary is located at the end of the stroke, - výpočet aspoň jednej hodnoty vlastnosti ťahu pre každý ťah, za účelom vytvorenia sady vlastností znaku,- calculating at least one stroke property value for each stroke to create a feature set - použitie sady vlastností znaku na určenie identity zmieneného rukopisného znaku.- using a feature set to determine the identity of said handwriting. 2. Spôsob podlá nároku 1, kde sfarbený obrazový bod s vysokou hodnotou derivácie zakrivenia má lokálne maximálnu hodnotu derivácie zakrivenia a následný sfarbený obrazový bod s nízkou hodnotou derivácie zakrivenia má lokálne minimálnu hodnotu derivácie zakrivenia.The method of claim 1, wherein the colored high curvature derivative pixel has a locally maximum curvature derivative value and the subsequent low curvature derivative colored pixel has a locally minimal curvature derivative value. 3. Spôsob podlá nároku 2, kde každá hranica ťahu leží v bode polovičnej vzdialenosti medzi sfarbeným obrazovým bodom s lokálne maximálnou hodnotou derivácie zakrivenia a sfarbeným obrazovým bodom s lokálne minimálnou hodnotou derivácie zakrivenia.The method of claim 2, wherein each stroke boundary lies at a point half the distance between the colored pixel with a locally maximum curvature derivative value and the colored pixel with a locally minimal curvature derivative value. 4. Spôsob podlá nároku 1, kde každá hranica ťahu leží v bode lokálne maximálnej absolútnej hodnoty zakrivenia.The method of claim 1, wherein each tension limit lies at a point of a locally maximum absolute curvature value. 5. Spôsob rozpoznávania rukopisného znaku zloženého z postupnosti bodov, kde každý bod pozostáva z hodnôt troch priestorových súradníc, zahrňujúci kroky:5. A method of recognizing a handwriting feature composed of a sequence of points, wherein each point consists of three spatial coordinate values, comprising the steps of: - výpočet hodnoty derivácie zakrivenia pre každý z množiny bodov, kde každá hodnota derivácie zakrivenia predstavuje rychlost zmeny absolútneho zakrivenia v zodpovedajúcom bode,- calculating the value of the curvature derivative for each of the set of points, where each value of the curvature derivative represents the rate of change of the absolute curvature at the corresponding point, - výber súboru hraníc tahov tak, že každá hranica tahu leží medzi bodom s vysokou hodnotou derivácie zakrivenia a následným bodom s nízkou hodnotou derivácie zakrivenia,- selecting a set of stroke boundaries such that each stroke boundary lies between a point with a high curvature derivative value and a subsequent point with a low curvature derivative value, - určenie súboru tahov tak, že každá hranica tahov je umiestnená na konci tahu,- specifying a set of strokes such that each stroke boundary is located at the end of the stroke, - výpočet aspoň jednej hodnoty vlastnosti tahu pre každý tah, za účelom vytvorenia sady vlastností znaku,- calculating at least one stroke property value for each stroke to create a set of character properties, - použitie sady vlastností znaku na určenie identity zmieneného rukopisného znaku.- using a feature set to determine the identity of said handwriting. 6. Spôsob podlá nároku 5, kde bod s vysokou hodnotou derivácie zakrivenia má lokálne maximálnu hodnotu derivácie zakrivenia a následný bod s nízkou hodnotou derivácie zakrivenia má lokálne minimálnu hodnotu derivácie zakrivenia.The method of claim 5, wherein the high curvature derivative point has a locally maximum curvature derivative value and the subsequent low curvature derivative point has a locally minimal curvature derivative value. 7. Spôsob podlá nároku 6, kde každá hranica tahu leží v bode polovičnej vzdialenosti medzi bodom s lokálne maximálnou hodnotou derivácie zakrivenia a bodom s lokálne minimálnou hodnotou derivácie zakrivenia.The method of claim 6, wherein each stroke boundary lies at a point half the distance between the locally maximum curvature derivative point and the locally minimal curvature derivative point. 8. Spôsob podlá nároku 5, kde každá hranica tahu leží v bode lokálne maximálnej absolútnej hodnoty zakrivenia.The method of claim 5, wherein each stroke boundary lies at a point of the locally maximum absolute curvature value. Popis k obrázku č. 1Description of picture no. 1 110110 120120 130130 140140 150150 160160 170 príjem vstupu ako postupnosti (x, y) bodov prevzorkovanie tak, že body sú rozmiestnené v rovnakých vzdialenostiach výpočet veľkosti zakrivenia v každom bode výpočet derivácie zakrivenia v každom bode identifikácia hraníc ťahov ako bodov v prostriedku medzi lokálnym maximom a minimom derivácie zakrivenia dostavenie hraníc ťahov za účelom korekcie malých chýb merania odovzdanie detekovaných hraníc ťahov na ďalšie použitie v rozpoznávacom procese170 input input as a sequence (x, y) of resampling points such that the points are spaced at equal distances calculating the curvature size at each point calculating the curvature derivative at each point identifying the stroke boundaries as points between the local maximum and the curvature derivative handover of detected stroke boundaries for further use in the recognition process to correct small measurement errors
SK30-96A 1994-05-10 1995-05-03 Method of stroke segmentation for handwritten input SK3096A3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US24040794A 1994-05-10 1994-05-10
PCT/US1995/005409 WO1995032485A1 (en) 1994-05-10 1995-05-03 Method of stroke segmentation for handwritten input

Publications (1)

Publication Number Publication Date
SK3096A3 true SK3096A3 (en) 1996-10-02

Family

ID=22906392

Family Applications (1)

Application Number Title Priority Date Filing Date
SK30-96A SK3096A3 (en) 1994-05-10 1995-05-03 Method of stroke segmentation for handwritten input

Country Status (14)

Country Link
EP (1) EP0710384A4 (en)
JP (1) JP2002515144A (en)
CN (1) CN1128074A (en)
AU (1) AU2431695A (en)
BR (1) BR9506197A (en)
CA (1) CA2162489A1 (en)
CZ (1) CZ6196A3 (en)
FI (1) FI960110A (en)
HU (1) HUT75820A (en)
IL (1) IL113659A0 (en)
NO (1) NO955064L (en)
PL (1) PL312469A1 (en)
SK (1) SK3096A3 (en)
WO (1) WO1995032485A1 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9701793D0 (en) 1997-01-29 1997-03-19 Gay Geoffrey N W Means for inputting characters or commands into a computer
US7603684B1 (en) 1998-05-19 2009-10-13 United Video Properties, Inc. Program guide system with video-on-demand browsing
US6563515B1 (en) 1998-05-19 2003-05-13 United Video Properties, Inc. Program guide system with video window browsing
CN1317664C (en) * 2004-01-17 2007-05-23 中国科学院计算技术研究所 Confused stroke order library establishing method and on-line hand-writing Chinese character identifying and evaluating system
EP1562130A1 (en) * 2004-02-06 2005-08-10 Dassault Systèmes A process for modifying a curve in a computer-aided design system
EP1562138B1 (en) * 2004-02-06 2009-08-19 Dassault Systèmes A process for drafting a curve in a computer-aided design system
CN100405389C (en) * 2004-08-06 2008-07-23 摩托罗拉公司 Identifying character from stroke mark
JP2006162692A (en) * 2004-12-02 2006-06-22 Hosei Univ Automatic lecture content creating system
CN100338621C (en) * 2005-04-07 2007-09-19 上海交通大学 Eigenvalue error compensation on limited sample collection and parameter distribution correcting method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658137B2 (en) * 1988-03-11 1997-09-30 沖電気工業株式会社 Character recognition method
JP3017740B2 (en) * 1988-08-23 2000-03-13 ソニー株式会社 Online character recognition device and online character recognition method
US5590220A (en) * 1992-08-12 1996-12-31 International Business Machines Corporation Bending point extraction method for optical character recognition system

Also Published As

Publication number Publication date
IL113659A0 (en) 1995-08-31
WO1995032485A1 (en) 1995-11-30
PL312469A1 (en) 1996-04-29
JP2002515144A (en) 2002-05-21
NO955064D0 (en) 1995-12-14
MX9600189A (en) 1998-11-29
EP0710384A1 (en) 1996-05-08
AU2431695A (en) 1995-12-18
CA2162489A1 (en) 1998-06-01
EP0710384A4 (en) 1997-05-02
FI960110A0 (en) 1996-01-10
BR9506197A (en) 1996-04-24
CZ6196A3 (en) 1996-06-12
NO955064L (en) 1995-12-14
FI960110A (en) 1996-01-10
HU9503882D0 (en) 1996-02-28
HUT75820A (en) 1997-05-28
CN1128074A (en) 1996-07-31

Similar Documents

Publication Publication Date Title
US5740273A (en) Method and microprocessor for preprocessing handwriting having characters composed of a preponderance of straight line segments
EP0739521B1 (en) Method of splitting handwritten input
US7349576B2 (en) Method, device and computer program for recognition of a handwritten character
US6603881B2 (en) Spatial sorting and formatting for handwriting recognition
EP1507192B1 (en) Detection of a dwell gesture by examining parameters associated with pen motion
US5923793A (en) Handwritten character recognition apparatus with an improved feature of correction to stroke segmentation and method for correction to stroke segmentation for recognition of handwritten character
US5781660A (en) Image processing method and apparatus
US5737443A (en) Method of joining handwritten input
US20080240569A1 (en) Character input apparatus and method and computer readable storage medium
US7970812B2 (en) Redistribution of space between text segments
SK3196A3 (en) Method for recognizing handwritten input
SK3096A3 (en) Method of stroke segmentation for handwritten input
US6973214B1 (en) Ink display for multi-stroke hand entered characters
US20070014475A1 (en) Presenting recognised handwritten symbols
MXPA96000189A (en) Method of segmentation of traces for the entry of characters manuscri
JP2000251013A (en) Method and device for character recognition and storage medium
JP2004213088A (en) Drawing input system, card-issuing system, drawing input method, and card-issuing method
KR19990056025A (en) How to Recognize Korean Handwritten Characters Online
JP2004133951A (en) Character recognition method, character recognition device, and storage medium
JPH07141468A (en) Handwritten character recognition processing method in handwriting input character device
JPH0821064B2 (en) Character writing input device
JP2000259768A (en) Method and device for recognizing character and storing medium
JPH05189616A (en) On-line character recognizing device