HUT75820A - Method of stroke segmentation for handwritten input - Google Patents

Method of stroke segmentation for handwritten input Download PDF

Info

Publication number
HUT75820A
HUT75820A HU9503882A HU9503882A HUT75820A HU T75820 A HUT75820 A HU T75820A HU 9503882 A HU9503882 A HU 9503882A HU 9503882 A HU9503882 A HU 9503882A HU T75820 A HUT75820 A HU T75820A
Authority
HU
Hungary
Prior art keywords
curvature
line
derivative
point
value
Prior art date
Application number
HU9503882A
Other languages
English (en)
Other versions
HU9503882D0 (en
Inventor
Chris Kortage
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of HU9503882D0 publication Critical patent/HU9503882D0/hu
Publication of HUT75820A publication Critical patent/HUT75820A/hu

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

Eljárás kézírás vonal szegmensekre való felosztására
A találmány tárgya kézírás felismerésére szolgáló eljárás, elsősorban pedig olyan eljárás, amely a kézírás bemenőjelet vonal szegmensekre osztja.
Az emberi kézírás gépi felismerése rendkívül nehéz probléma, és különösen komoly problémává vált az utóbbi időben elterjedt tollal működő számítógépes eszközök alkalmazása következtében. Számos megközelítése létezik a fenti problémának, az egyik viszonylag jól felhasználható megközelítés szerint úgy járnak el, hogy az írást alap elmozdulások sorozatává alakítják át, úgynevezett vonások sorozatává, és ezeket a vonásokat, amelyek valamilyen formában paraméterekkel lehet ellátni, viszik be a karakterfelismerőbe bemenetként.
A vonások felismerésén alapuló írásfelismerőnél a kulcskövetelmény az, hogy a többféle módon leírt ugyanazon karakterosztály vagy karakter abban az esetben is felismerhető legyen és ugyanolyan vagy hasonló vonalak sorozatára legyen felosztva akkor is, hogyha kissé másképpen írják. Abban az esetben tehát, ha azonos betűk azonos vonalsorozatra vannak felosztva, ez elősegíti azt, hogy a gépi úton történő felismerés ne legyen túl nehéz, mivel az egyes karakterek végül is hasonló módon és hasonló vonalakból lesznek felépítve, és ezt a karakterfelismerő fel tudja ismerni. Ideális esetben egy adott karakternek minden egyes formája és megjelenítése azonos számú vonalakból áll, ezek a vonalak minden esetben egymáshoz képest azonos módon helyezkednek el, és az egyes vonalaknak a jellegzetes írása is nagyon hasonló lesz. Ez az ideális követelmény azonban a gyakorlatban nem valósítható meg, de megközelíthető és ily módon ezzel az eljárással a felismerés pontossága kijavítható.
Szintén ismert megoldás az írásfelismerésre az, amikor az egyes vonalaknak a határait azoknál a pontoknál állítják be, ahol a tolinak a sebessége a függőleges, azaz az Y tengely irányában nulla, illetőleg azoknál a pontoknál, ahol az írás elkezd lefelé mozdulni. Az ily módon kapott vonásokból való sorozatot ezután felfelé irányuló vonások sorozatának illetőleg lefelé irányuló vonások sorozatának nevezik. Ilyen eljárás van Mermelstein & Edén “Kézírásos szavakhoz kapcsolódó számítógépes felismerő elrendezéssel kapcsolatos kísérletek” című művében, amely az Information & Control 7. kötetében jelent meg a 255-270. oldalakon 1964-ben. Ezzel az eljárással kapcsolatosan az a probléma merül fel, hogy álta• · · ·
-2lánosságban rendkívül érzékeny a függőleges irányú változásokra, viszont nem eléggé érzékeny illetőleg szinte egyáltalában nem érzékeny a vízszintes irányú változásokra. Számos olyan karakter van, amely vízszintes elemekből áll, illetőleg vízszintes elemeket tartalmaz, ilyen például a t betű vagy az E betű, például az E betűnek sokkal több a vízszintes irányú eleme mint a függőleges irányú eleme, még akkor is hogy ha nem pontosan írja valaki a betűt. A függőleges irányú sebesség figyelembe vételén alapuló vonásokra történő felosztást tehát vízszintes vonalak törik meg, adott esetben több vízszintes vonal is, ami adott esetben amiatt is bekövetkezhet, hogy a toll függőleges irányban egy kissé megremeg. Ez végül is azt eredményezi, hogy a felismerés pontossága nem megfelelő, mivel az ugyanazon karakterek egymás után gyakran különböző vonalak sorozatából álló elemként kerülnek felismerésre, azaz különböző külső megjelenésű vonalsorozatra osztja a felismerő rendszer. Ezen pontatlanságot korrigálandó a rendszer úgy működik, hogy mielőtt egy új vonalat hozna létre függőleges irányban, minimális függőleges irányú elmozdulást végez. Ez a kísérlet azonban végül is nem hozta meg a kívánt sikert, mert az alap probléma megmaradt.
További ismert megoldás úgy működik, hogy az egyes vonalaknak a határait azon pontoknál állapítják meg, ahol a vonal íveltségének helyi maximuma van, és ez a helyi maximum túllép egy adott küszöbértéket, amely az írásban egy éles hajlatnak felel meg. Mivel ilyen éles hajlat attól függetlenül, hogy a toll milyen irányban mozog, ez azt jelenti, hogy ez az eljárás a különböző részeknek az irányára nem ad kellő útmutatást, szavak vagy karakterek esetében. Az íveltség megfigyelésén alapuló eljárásnak is vannak azonban problémái. Tegyük fel, hogy valaki egy L betűt ír, és ezt az L betűt nem a szokásos 90°-os szögben, hanem egy kicsit fokozatosan alakítja ki az L betű szárát, akkor a felismerő rendszer adott esetben ezt inkább C betűnek fogja nézni és nem L-nek. Ez az eljárás tehát az L-nek a szegmensekre való osztásánál például nem működik megfelelően abban az esetben, ha az íveltségnek a küszöbértékét nem megfelelően állítjuk be. Ha a küszöbértéket csökkentjük, ez sem oldja meg a problémát, mivel ebben az esetben túl nagyszámú vonalból fog állni egy-egy betű. Ha túl sok egyéb adott esetben nem figyelembe veendő vonal van, az sem jó, mert itt megint csak felmerül annak a problémája, hogy ha különbözőképpen írnak betűket, akkor a vonal sorozatokból álló megjelenítése nagyon eltérő lesz.
-3Fennáll tehát az igény egy olyan vonalsorozatokra történő felosztás iránt, amelynél mind az Y irányú sebesség figyelembe vételén alapuló megoldás, mind pedig az íveltség figyelembe vételén alapuló megoldás hiányosságait ki tudjuk küszöbölni.
A találmány szerinti megoldásnál a kézírásos bemenőjelet oly módon osztjuk fel vonalak sorozatára, hogy minden esetben biztosítható, hogy egy adott karakter esetében, ha azt többféleképpen is írják le, azonos jellegű vonalsorozatot kapunk.
A találmány tehát eljárás kézírásos karakterek felismerésére, amely kézírásos karakterek tintával írt képpontok sokaságából állnak. Az eljárás lényege:
- tintával írt képpontok sokaságának mindegyikénél kiszámítunk egy a görbületi érték derivált értékére jellemző értéket, amely görbületi derivált érték az adott képpontnál az abszolút görbület változási sebességet mutatja,
- kiválasztunk készlet vonal határértéket úgy, hogy minden egyes vonal határérték egy nagy görbületi derivált értékkel rendelkező tintával írt képpont és egy alacsony görbületi derivált értékkel rendelkező képpont között helyezkedik el, ez utóbbi az előző után helyezkedik el,
- a vonalsorozatot úgy helyezzük el, hogy minden egyes vonalhatár a vonal végénél helyezkedjen el,
- legalább egy olyan vonal jellemzőt számítunk ki minden egyes vonalhoz, amelyből egy-egy jellemző készletet hozzunk létre,
- ezt a jellemző készletet használjuk fel a kézírás azonosítására.
Előnyös a találmány értelmében, ha mindegyik nagy görbületi derivált értékkel rendelkező tintával írt képpontnak van egy helyi maximális görbület derivált értéke, és a következő alacsony görbületi derivált értékkel rendelkező képpontnak pedig egy minimális görbület derivált értéke.van.
Ugyancsak előnyös a találmány értelmében, ha az egyes vonalaknak a határa a helyi maximális görbületi derivált érték és a helyi minimális görbületi derivált érték közepénél helyezkedik el.
-4A találmány szerinti eljárás egy további előnyös foganatosítási módja értelmében az egyes vonalhatár értékek az abszolút helyi maximális görbületi érték pontjánál helyezkednek el.
A találmány tárgya továbbá eljárás kézírásos karakterek felismerésére, amely karakterek pontsorozatból állnak, és mindegyik pont három térbeli koordináta értékkel rendelkezik. Ezen eljárás lényege:
- mindegyik pontra egy görbület derivált értéket számolunk, amely görbület derivált érték az adott pontnál lévő abszolút görbületi érték változásának a sebességére jellemző,
- kiválasztunk egy vonal határérték készletet úgy, hogy mindegyik vonalhatár egy nagy görbületi derivált értékkel rendelkező pont és egy ezt követő alacsony görbületi derivált értékkel rendelkező pont között helyezkedik el,
- a vonal készletet úgy helyezzük el, hogy minden egyes vonalhatár a vonal végénél helyezkedjen el,
- minden vonalra legalább egy jellemző értéket számítunk ki minden egyes vonal esetén, ily módon létrehozva a karakterisztikus jellemzőket,
- a karakterisztikus jellemző készletből azonosítjuk a kézírás karaktert.
Előnyös a találmány értelmében, ha a nagy görbületi derivált értékkel rendelkező pontnak van egy helyi maximális görbületi derivált értéke, az ezt követő alacsony görbületi derivált értékkel rendelkező pontnak pedig van egy helyi minimális értéke.
Ugyancsak előnyös a találmány értelmében, ha az egyes vonások határa a helyi maximális görbületi derivált érték és azt ezt követő helyi minimális görbületi derivált érték középvonalánál, közepénél helyezkedik el.
Fentieken túlmenően, előnyös végül a találmány értelmében, ha az egyes vonalaknak a határértéke a helyi maximális abszolút görbületi értéknél van.
A találmányt a továbbiakban a példakénti kiviteli alakjai segítségével a mellékelt ábrákon ismertetjük részletesebben. Az •» · · · · • ··· ·· ··· t · · · ·
-5-
l. ábrán látható a találmány szerinti eljárás működésének folyamatábrája, amelynek segítségével az egyes vonalaknak a határpontjait tudjuk meghatározni, a
2. ábrán az ismert, Y irányú sebesség figyelembe vételével történő szegmentálásra látunk egy példát kézírás esetében, a
3. ábrán szintén az ismert, de az íveltség figyelembe vételével történő szegmentálásra látunk egy példát, a
4. ábrán ugyanennek a szónak, amelyet a 2. és 3. ábrán mutattunk be a találmány szerinti eljárással történő szegmentálására mutatunk be példát, az
5. ábrán egy L betűnek az egyes pontjait láthatjuk, amelyet a digitalizáló rendszer kibocsát, a
6. ábrán pedig az L betűt látjuk azután, hogy a találmány szerinti megoldással a mintavételi jeleket összehasonlítottuk, a
7. ábrán felnagyítva látható a találmány szerinti megoldással megvalósított íveltség számítása, a
8. ábrán a 7. ábrán bemutatott ponthoz tartozó számított értékek láthatók, a
9. ábrán pedig a 7. ábra minden egyes pontjaihoz tartozó derivált értékek láthatók.
Tipikusan egy kézzel írott karakterbemenet a felhasználótól diszkrét folyamatos szegmensek sorozatából állóan kerül vételre. Egy-egy diszkrét folyamatos szegmens egy vagy több tollvonásból áll, ahol a tollvonás a toll által azon periódus alatt a papíron vagy digitalizáló táblán hagyott nyomot jelenti, amikor a bemeneti eszközzel érintkezésbe van.
A találmány szerinti megoldásnál egy vagy több diszkrét folyamatos szegmens az, amelyet a találmány szerinti eljárással mint kézírásos bemenetet fel tudtunk ismerni. A kézírásos bemenet egy olyan bemenetet jelent, ahol az érzékelés elektronikus úton történik, és amely lehet kézírásos bemenet, elektronikus bemenet, nyomás hatására létrehozott bemenőjel,
-6például pecsét, olyan bemenőjel, mely elektronikus úton, például telefax berendezésen, pageren vagy egyéb hasonló berendezésen érkezett. A vonásokat pontsorozatok képezik, amelyeket a jelfeldolgozó berendezés megközelítőleg szabályos időközönként vesz. Minden egyes pont minimum a hozzátartozó X és Y koordinátával írható le. A vonásokat elektronikus úton lehet érzékelni, például digitalizáló tábla használatával vagy adott esetben érzékelhető letapogatott vagy telefax kép, amely jelfeldolgozás után van képpé alakítva. A villamos úton történő kép vagy vonás érzékelés önmagában ismert. A példakénti kiviteli alaknál a bemenetet egy személyi számítóberendezés (PDA) vagy valamilyen más hasonló berendezés szolgáltatta. Azok a berendezések, amelyek a kézírásos bemenetet venni tudják a következők lehetnek például: számítógépek, modemek, pagerek, telefonok, digitális televíziók, interaktív televíziók, olyan szerkezetek, amelyeknek digitalizáló táblája van, vagy lehetnek telefax berendezések, kijelző berendezések és minden egyéb berendezés, amely képes kézírásos bemenet vételére. Általánosságban, amikor az egyes vonalak illetőleg vonások villamos úton történnek letapogatásra, mindegyik pont egy-egy képpontot képez, ily módon tehát a vonás az a szerkezeten illetőleg berendezésben mint képpontok sorozata jelenik meg.
A találmány szerinti eljárás során a kézírásos bemenet lehet alfanumerikus karakter, lehet videografikus karakter, vagy minden egyéb olyan karakter vagy szimbólum, amelyet írásbeli kommunikáció során alkalmaznak.
Visszatérve az ábrákra a 2. és a 3. ábra alfanumerikus kézírásos bemenet vonal szegmentálását mutatja be viszonylag nagy pontatlansággal, amikor is a vonal szegmensek áthaladnak a vonal alapú írásfelismerőn. A 4. ábrán a 2. és a 3. ábrán bemutatott alfanumerikus bemenet vonal szegmentálása látható akkor, amikor a vonalaknak a vonalra történő felosztást illetőleg szegmentálást a találmány szerinti eljárással végeztük, és a vonalak illetőleg pontok áthaladtak a vonal alapú írásfelismerőn, látható az adott betűnek az interpretációja, viszonylag nagy pontossággal valósítható meg.
Az 1. ábrán látható a találmány szerinti eljárás folyamatábrája. A kézírásos bemenet egy digitalizáló vagy egyéb berendezésről először X-Y koordináták formájában vételre kerül megfelelő toll felemelt és toll leengedett állapotok figyelembe vételével a 110 lépésben. Ezeket a pontokat általában képpontokként jelenítik meg. A találmány szerinti eljárás során a kézírásos bemenet újra mintavételezésre kerül annak érdekében, hogy olyan pontokat
- 7 is kapjunk, amelyek a kézírásos bemenőjel hossza mentén azonos távolságokra helyezkednek el. Ez történik a 120 lépésben. Ha most megfigyeljük az 5. ábrát, itt látható egy 500 kép, amelyik L betű. Ez a pontsorozat az újra mintavételezés előtti állapot képpontjait mutatja. A 6. ábrán a 600 kép az előző 5. ábrán bemutatott L betű képpontjait mutatja az újra mintavételezés után. Az újra mintavételezés egy adott d, a 6. ábrán 310 számmal jelölt távolságot alkalmaz az újra mintavételezés során, amelyet konstans értékkel végzi a kézírásos bemenet újra letapogatást. A d értéket általában úgy választjuk meg, hogy a kézírásos bemenőjel átlag magassága 15-30-szorosa legyen a d-nek. A 6. ábrán a d értékét például úgy állapítottuk meg, hogy az egyes szavakban a közepes magasság az kb. a 15-30-szorosa volt a d értékének.
Az 1. ábra szerinti folyamatábra következő lépése a 130 lépés, amikor is minden egyes pontnál görbületet számítunk. A görbületnek a számítása az újra mintavett pontoknál részletesebben a 7. ábrán látható, amely a 6. ábrán bemutatott 600 képnek egy kinagyított részét mutatja. A 7. ábrán a görbület számításait az R pontra, azaz a 710 pontra mutatjuk be. A R pontnak, tehát a 710 pontnál a görbületet úgy határozzuk meg, hogy az R pontot és az utána következő (R+l) pontot, ez a 730 pont összekötjük, majd meghosszabbítjuk, és hasonló módon az R ponton és az R pontot megelőző (R-l pontot) amely 750 pont keresztül szintén egy egyenest húzunk, amelyet szintén meghosszabbítunk, és eljutunk a 720 pontba, amit p-vel jelöltünk és ezt a 7. ábrán szaggatott vonal jelzi. A görbültség a két vonal közötti legkisebb távolságból számítható, amely itt a 740 távolság. A kézírásos bemenőjeleknek a belső görbültségét szintén úgy lehet kiszámítani, hogy az R ponttól távolabb levő két pontot veszünk figyelembe, tehát nem egyet, és ebben az esetben két az R pontot megelőző pontot használunk a durva kalkuláció érdekében. A 8. ábrán grafikusan mutatjuk be a 7. ábrán bemutatott pontoknak a kiértékelése során nyert értéket. A 8. ábrán a függőleges tengelyen a görbület látható, a vízszintes tengelyen pedig az egyes pontoknak a helyzete.
Ha az előbbiekben már vázolt L betűt vizsgáljuk, amely kissé fokozatosan hajlik, akkor ezt függőleges és vízszintes vonalak sorozatára lehet osztani mindaddig, amíg az L betű két szára a megfelelő lényegében merőleges szögben helyezkedik el, tehát nincs annyira meghajolva mint az ábrán látható. Ebben az esetben a göbület a hajlatban növekedni fog, tehát az íveltségnek a differenciál hányadosa nagy lesz, és ahogy a hajlatból kifelé megyünk az íveltség csökkenni fog, az íveltség mértékének megfelelően a differenciál hányados rend• · · ·
-8kívül kicsi lesz, ily módon tehát végül is azokat a pontokat kapjuk meg az L betű két szárának találkozásánál, ami az íveltségnek megfelel.
A találmány szerinti eljárásnál abban az esetben, ha minden egyes újra mintavételezett pontnál a görbületet meghatároztuk a görbület értékekre kapott sort kissé ki lehet simítani annak érdekében, hogy annyi minimális adatot vigyünk be a digitális eljárás során a rendszerbe, amennyire csak lehetséges. A görbe kisimítására bármilyen önmagában ismert, és a megfelelő paraméterek digitalizálására alkalmas eljárás alkalmazható. Alkalmazhatunk például átlagolást, amikor egy pontnak az értékét a két szomszédos pont átlagából határozzuk meg, vagy pedig súlyozást, ahol a pont értékét is figyelembe vesszük a súlyozásnál, vagy pedig az adott görbület értéket egy számítógépes átlagértékkel helyettesítjük. Azt hogy a görbe kisimításánál az, hogy az az ablak, amit egy-egy érték számításához felhasználunk mekkora legyen, célszerűen a görbület függvényében választandó meg. Abban az esetben, hogyha a görbültség mértéke kicsi, úgy szélesebb tartományt lehet egyszerre figyelembe venni átlagszámításnál, ott ahol azonban a görbület nagy, úgy szűkebb tartományonként célszerű az átlagot számítani annak érdekében, hogy ezen simítási eljárás során lényeges információveszteség ne történjen. Mivel a görbület maga valamilyen formában simítva van, a simításnak egy olyan módja is lehetséges, hogy először feldolgozzuk a kezdeti görbületeket, azután ezen görbületek alapján készítünk egy simított görbületsort, majd ezt újra lesimítva további görbületeket számítunk és további feldolgozást végzünk.
A találmány szerinti eljárás során minden egyes újra mintavételezett pont a görbület abszolút értékének a feldolgozás során egy negatív értékkel, -1-gyel van megszorozva. Előnyösen az abszolút értékek vannak a görbületek differenciál hányadosainak a kiszámítása során felhasználva, kedvezőbb, mint hogyha az aktuális görbület értékeket vesszük figyelembe, mivel a találmány szerinti eljárás minden egyes kiviteli alakjánál az írásban bekövetkező görbületek élességére vonatkozóan illetőleg görbületére vonatkozóan vizsgáljuk a pontokat és nem arra, hogy a görbület milyen irányú.
Visszatérve az 1. ábrán a következő 140 lépésben minden egyes mintavételezett ponthoz kiszámítjuk a görbületeknek a differenciál hányadosait. Visszatérve ismét a 7. ábrára az R pontnál a görbületnek a differenciál hányadosa úgy van definiálva, mint a görbületnek az abszolút értéke az (R+l) pontnál mínusz a görbületnek az abszolút értéke az (R-l) pontnál, és ez a különbség 2-vel van osztva, lényegében tehát a képpontokból kipontozott görbének
-9a meredekségét határozzuk meg. A 9. ábrán látható a 7. ábrán feltüntetett az előbbiekben bemutatott pontokra görbületnek a differenciál hányadosa. Hasonló módon lehet ezt kettőnél több pont esetében is alkalmazni, ekkor ugyanis a görbületre adott esetben még pontosabb értéket fogunk kapni. A görbület differenciál hányadosa szélesebb tartományban például öt pont, vagy három pont helyett öt pont esetén is alkalmazható, de adott esetben keskenyebb tartományokra is elvégezhető, tehát három pont helyett két pontra differenciál hányados számítása. Mivel a görbületeknek a differenciál hányadosa a tintával írt szegmensnek a végpontjainál nem számítható ki, a végpontnál a görbület a differenciál hányadosát egyszerűen úgy definiáljuk, hogy az egyenlő a következő szomszédos pont differenciál hányadosával.
Visszatérve ismét az 1. és a 9. ábrára a következő lépésben azt vizsgáljuk meg, hogy az újonnan számított görbületnek a differenciál hányadosra kapott értékek hogyan helyezkednek el, és hol van a helyi maximuma, ez a 9. ábrán a 910 pontnak felel meg, ez tulajdonképpen egy olyan pont, amely egy inflekciós pont, tehát a mellette lévő két pont között a legmagasabb pont, és megkeressük azt is, hogy hol van a helyi minimum, ez a 920 pontnál van, az a pont, amelyet követően azután a jel ismét növekedni fog. Minden egyes bemeneti szakasz esetén a helyi maximum után és a helyi minimum előtt található egy olyan középpont, amelyet a 930 ponttal jelöltünk, és M az értéke. Ha a helyi maximum és a helyi minimum közötti különbség egy adott szakaszra, egy adott küszöbértéket ez a 9. ábrán a 940 érték és T’ jelöljük túllép, és az abszolút görbület érték az M pontnál egy előre megadott T” küszöbértéket, amelyik a 820 pontnak felel meg túllép, akkor az M pontot úgy tekintjük, mint egy adott vonalnak a határát. Ez a lépés lényegében a számítógépes feldolgozás 150 lépése, amikor is az egyes vonalaknak, illetőleg vonásoknak a határértékeit úgy adjuk meg, mint a görbület deriváltja helyi maximuma és helyi minimuma közötti középértéket (M).
A Τ’, és a T” értéket várható értéke függ attól, hogy egy adott egységben milyen görbületek illetőleg görbület differenciál hányadosok mérhetők. A T’ és a T” értékeinek a megválasztása nem olyan kritikus abban az esetben, ha megfelelő hibahatárral működő karakterfelismerőt használunk.
A példakénti kiviteli alaknál a megfelelő kiviteli alakhoz a hangolási paramétereket célszerű kísérleti úton megválasztani, és a kívánt cél mindenképpen az, hogy olyan szegmentá• · · ·
- 10ciót valósítsunk meg, amelynek segítségével a különféle módon megjelenített karakterek megfelelően felismerhetők. Empirikus úton is megvizsgálható, hogy az egyes szegmensek egy aktuális minta esetében hogyan állítandók be.
Az eljárás következő lépése a 160 lépés, ahol is az egyes vonásoknak a határértékeit úgy állítjuk be, hogy a hibahatárok mérése megfelelő legyen.
A 170 lépésben a hibahatárokat az írásfelismerő eljárás további felhasználásához a jelfeldolgozó egységbe továbbítjuk. Ezen túlmenően pedig a kiválasztott vonalhatár pontokhoz még azt is figyelembe veszi a rendszer, hogy melyek azok a pontok, ahol a toll felemelkedett vagy a tollat letették, mert ez a vonalhatár egyik fontos jellemzője.
Azon túlmenően, hogy az egyes vonal határértékeit találmány szerinti eljárással kiválasztottuk, azokat a pontokat, ahol a tollat felemelik vagy leteszik, szintén figyelembe vesszük, mint a vonal határpontjait. A példakénti kiviteli alaknál a görbület differenciál hányadosának mérésén alapuló határérték pontok ily módon eltolódhatnak akár két ponttal is annak érdekében, hogy oda essenek, ahol az abszolút görbületi érték maximuma van. Ez a korrekció történik tehát a 160 lépésben. Azáltal, hogy a görbület deriváltja alapján kiszámított határérték pontok eltolódhatnak, az egyes vonalak határvonal pontjai sokkal jobban határozhatók meg akkor, ha egyrészt méljük a görbületet, valamint a görbület deriváltját is és ezek figyelembe alapján határozzuk meg a határpontokat. A találmány ezen kiviteli alakja csak adott pontok esetében alkalmazandó, akkor, hogyha egy vonalnál háromnál kevesebb pontot kapunk.
A találmány szerinti megoldásnál az egyes vonal határpontokra kapott sorozat lényegében egy sor ennek megfelelő vonalat is definiál. Ezeket a vonalakat egy vonalfelismerőbe továbbítjuk, ahol az adott kézírásos bemenőjelhez tartozó karakterfelismerő tartozik.
A találmány szerinti eljárás a vonalak felosztására illetőleg szegmentálására mutat egy újszerű megoldást különösen akkor, ha kézírásos bemenőjelről van szó, amelyet ismételten felosztunk több vonalsorozatra. Ha például a kézírásos bemenőjel egy E betű, amelyet különböző időpontokban, különböző személyek írnak, úgy a találmány szerinti megoldással minden esetben sokkal pontosabban lehet az E betűt hasonló vonalsorozatra felosztani
- 11 függetlenül attól, hogy ki írta az adott betűt. Ez a szegmentálás elősegíti a vonalfelismerésen alapuló rendszerek pontosságának a növekedését.
Szakemberek a találmány szerinti megoldást rendkívül hasznosnak találták. A találmány szerinti eljárás a nyomtatott kézírástól egészen a kurzív írásig alkalmazható. A vonalak aktuális szegmentálása független a karakterek szegmentálásától, ily módon a kurzív betűkhöz is használható. Egy további kiviteli alak a szkennelt vagy on-line írás szegmentálására illetőleg felosztására alkalmazható megfelelő vonalakra. A találmány szerinti eljárás ilyen feladatra történő közvetlen felhasználása esetén az írást megfelelően le kell vékonyítani, hogy azonos vastagságú tintával írt vonalként jelenjen meg. Ezt követően az egyes vonásoknak a határvonalait kell beállítani a görbület differenciál hányados alapú pontok szerint, valamint a metszéspontok szerint mivel az időbeli információ hiánya a megszakításokat és az érintőleges görbületeket hasonlónak tüntetné fel.

Claims (8)

  1. Szabadalmi igénypontok
    1. Eljárás kézírásos karakterek felismerésére, amely kézírásos karakterek tintával írt képpontok sokaságából állnak, azzal jellemezve, hogy
    - tintával írt képpontok sokaságának mindegyikénél kiszámítunk egy a görbületi érték derivált értékére jellemző értéket, amely görbületi derivált érték az adott képpontnál az abszolút görbület változási sebességet mutatja,
    - kiválasztunk készlet vonal határértéket úgy, hogy minden egyes vonal határérték egy nagy görbületi derivált értékkel rendelkező tintával írt képpont és egy alacsony görbületi derivált értékkel rendelkező képpont között helyezkedik el, ez utóbbi az előző után helyezkedik el,
    - a vonalsorozatot úgy helyezzük el, hogy minden egyes vonalhatár a vonal végénél helyezkedjen el,
    - legalább egy olyan vonal jellemzőt számítunk ki minden egyes vonalhoz, amelyből egy-egy jellemző készletet hozzunk létre,
    - ezt a jellemző készletet használjuk fel a kézírás azonosítására.
  2. 2. Az 1. igénypont szerinti eljárás azzal jellemezve, hogy mindegyik nagy görbületi derivált értékkel rendelkező tintával írt képpontnak van egy helyi maximális görbület derivált értéke, és a következő alacsony görbületi derivált értékkel rendelkező képpontnak pedig egy minimális görbület derivált értéke.van.
  3. 3. A 2. igénypont szerinti eljárás azzal jellemezve, hogy az egyes vonalaknak a határa a helyi maximális görbületi derivált érték és a helyi minimális görbületi derivált érték közepénél helyezkedik el.
  4. 4. Az 1. igénypont szerinti eljárás azzal jellemezve, hogy az egyes vonalhatár értékek az abszolút helyi maximális görbületi érték pontjánál helyezkednek el.
  5. 5. Eljárás kézírásos karakterek felismerésére, amely karakterek pontsorozatból állnak, és mindegyik pont három térbeli koordináta értékkel rendelkezik, azzal jellemezve, hogy az eljárás során
    - mindegyik pontra egy görbület derivált értéket számolunk, amely görbület derivált érték az adott pontnál lévő abszolút görbületi érték változásának a sebességére jellemző,
    - kiválasztunk egy vonal határérték készletet úgy, hogy mindegyik vonalhatár egy nagy görbületi derivált értékkel rendelkező pont és egy ezt követő alacsony görbületi derivált értékkel rendelkező pont között helyezkedik el,
    - a vonal készletet úgy helyezzük el, hogy minden egyes vonalhatár a vonal végénél helyezkedjen el,
    - minden vonalra legalább egy jellemző értéket számítunk ki minden egyes vonal esetén, ily módon létrehozva a karakterisztikus jellemzőket,
    - a karakterisztikus jellemző készletből azonosuljuk a kézírás karaktert.
  6. 6. Az 5. igénypont szerinti eljárás azzal jellemezve, hogy a nagy görbületi derivált értékkel rendelkező pontnak van egy helyi maximális görbületi derivált értéke, az ezt követő alacsony görbületi derivált értékkel rendelkező pontnak pedig van egy helyi minimális értéke.
  7. 7. A 6. igénypont szerinti eljárás azzal jellemezve, hogy az egyes vonások határa a helyi maximális görbületi derivált érték és azt ezt követő helyi minimális görbületi derivált érték középvonalánál, közepénél helyezkedik el.
  8. 8. Az 5. igénypont szerinti eljárás, azzal jellemezve, hogy ha az egyes vonalaknak a határértéke a helyi maximális abszolút görbületi értéknél van.
HU9503882A 1994-05-10 1995-05-03 Method of stroke segmentation for handwritten input HUT75820A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US24040794A 1994-05-10 1994-05-10

Publications (2)

Publication Number Publication Date
HU9503882D0 HU9503882D0 (en) 1996-02-28
HUT75820A true HUT75820A (en) 1997-05-28

Family

ID=22906392

Family Applications (1)

Application Number Title Priority Date Filing Date
HU9503882A HUT75820A (en) 1994-05-10 1995-05-03 Method of stroke segmentation for handwritten input

Country Status (14)

Country Link
EP (1) EP0710384A4 (hu)
JP (1) JP2002515144A (hu)
CN (1) CN1128074A (hu)
AU (1) AU2431695A (hu)
BR (1) BR9506197A (hu)
CA (1) CA2162489A1 (hu)
CZ (1) CZ6196A3 (hu)
FI (1) FI960110A (hu)
HU (1) HUT75820A (hu)
IL (1) IL113659A0 (hu)
NO (1) NO955064D0 (hu)
PL (1) PL312469A1 (hu)
SK (1) SK3096A3 (hu)
WO (1) WO1995032485A1 (hu)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9701793D0 (en) 1997-01-29 1997-03-19 Gay Geoffrey N W Means for inputting characters or commands into a computer
US7603684B1 (en) 1998-05-19 2009-10-13 United Video Properties, Inc. Program guide system with video-on-demand browsing
US6563515B1 (en) 1998-05-19 2003-05-13 United Video Properties, Inc. Program guide system with video window browsing
CN1317664C (zh) * 2004-01-17 2007-05-23 中国科学院计算技术研究所 乱笔顺库建立方法及联机手写汉字识别评测系统
DE602004022629D1 (de) * 2004-02-06 2009-10-01 Dassault Systemes Methode für das Zeichnen einer Kurve in einem CAD-System
EP1562130A1 (en) * 2004-02-06 2005-08-10 Dassault Systèmes A process for modifying a curve in a computer-aided design system
CN100405389C (zh) * 2004-08-06 2008-07-23 摩托罗拉公司 从划线标记识别字符的方法和装置
JP2006162692A (ja) * 2004-12-02 2006-06-22 Hosei Univ 講義コンテンツ自動作成システム
CN100338621C (zh) * 2005-04-07 2007-09-19 上海交通大学 有限字符样本集上特征值误差补偿及参数分布修正方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658137B2 (ja) * 1988-03-11 1997-09-30 沖電気工業株式会社 文字認識方式
JP3017740B2 (ja) * 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
US5590220A (en) * 1992-08-12 1996-12-31 International Business Machines Corporation Bending point extraction method for optical character recognition system

Also Published As

Publication number Publication date
CZ6196A3 (en) 1996-06-12
JP2002515144A (ja) 2002-05-21
CN1128074A (zh) 1996-07-31
CA2162489A1 (en) 1998-06-01
NO955064L (no) 1995-12-14
WO1995032485A1 (en) 1995-11-30
BR9506197A (pt) 1996-04-24
SK3096A3 (en) 1996-10-02
PL312469A1 (en) 1996-04-29
EP0710384A4 (en) 1997-05-02
EP0710384A1 (en) 1996-05-08
FI960110A0 (fi) 1996-01-10
HU9503882D0 (en) 1996-02-28
AU2431695A (en) 1995-12-18
MX9600189A (es) 1998-11-29
NO955064D0 (no) 1995-12-14
FI960110A (fi) 1996-01-10
IL113659A0 (en) 1995-08-31

Similar Documents

Publication Publication Date Title
KR100297481B1 (ko) 주로직선세그먼트로이루어진문자의필적의선행처리방법및장치
US5287417A (en) Method and system for recognizing a graphic object's shape, line style, and fill pattern in a pen environment
KR100615124B1 (ko) 문자 인식 방법
JP2641388B2 (ja) 手書き文字認識システムにおけるライン・スペース及びベース・ラインの調整方法
US7349576B2 (en) Method, device and computer program for recognition of a handwritten character
US5434959A (en) System and method of generating variable width lines within a graphics system
EP0476806B1 (en) Improved segmentation process for machine reading of handwritten information
US6044165A (en) Apparatus and method for tracking handwriting from visual input
EP0391044A2 (en) Pattern generation method for registering handwriting
US7313277B2 (en) Method and device for recognition of a handwritten pattern
US20060269134A1 (en) Preprocessing for information pattern analysis
EP0689153B1 (en) Character recognition
HU219991B (hu) Eljárás kézzel írt karakter bemenőjeleket képező szegmensek azonosítására
JP2002222425A (ja) 情報処理装置及び方法
US7567711B2 (en) Cleaning up of handwriting intra-stroke and inter-stroke overtracing
HUT75820A (en) Method of stroke segmentation for handwritten input
US6430308B1 (en) Handwriting verification device
US7146046B2 (en) Method and apparatus for scale independent cusp detection
JPH0729002A (ja) 手書き図形認識装置
JPH07117986B2 (ja) 文字認識装置
MXPA96000189A (en) Method of segmentation of traces for the entry of characters manuscri
EP4086744A1 (en) Gesture stroke recognition in touch-based user interface input
JP2689380B2 (ja) 線図形折線化装置
JPH096909A (ja) 文字読取装置
JP4142911B2 (ja) 文字認識装置、および文字認識方法

Legal Events

Date Code Title Description
DFD9 Temporary protection cancelled due to non-payment of fee