HU219991B - Eljárás kézzel írt karakter bemenőjeleket képező szegmensek azonosítására - Google Patents
Eljárás kézzel írt karakter bemenőjeleket képező szegmensek azonosítására Download PDFInfo
- Publication number
- HU219991B HU219991B HU9503881A HU9503881A HU219991B HU 219991 B HU219991 B HU 219991B HU 9503881 A HU9503881 A HU 9503881A HU 9503881 A HU9503881 A HU 9503881A HU 219991 B HU219991 B HU 219991B
- Authority
- HU
- Hungary
- Prior art keywords
- distance
- segments
- discrete
- continuous
- writing
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
- Inspection Of Paper Currency And Valuable Securities (AREA)
- Character Input (AREA)
- Electrotherapy Devices (AREA)
- Electrophonic Musical Instruments (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
A találmány tárgya többféle eljárás kézzel írt karakter-bemenőjelekszegmenseinek, például szavainak azonosítására. Az eljárás elsőlépése, hogy a legalább egy első és egy második diszkrét, önmagábanfolytonos szegmensből (S1, S2), például szóból álló, kézzel írtkarakter-bemenőjelet veszik, majd ezt követően az alábbi lépéseketvégzik el: a) az első és második diszkrét, folytonos szegmensek (S1,S2) között legalább egy, az írás tengelyével párhuzamos elsőtávolságot (d’) számítanak ki úgy, hogy b) az első és másodikdiszkrét, folytonos szegmensek (S1, S2) között több távolságot mérnekmeg, és c) meghatározzák, hogy a több távolság közül melyik alegkisebb, és mért távolságok alapján határozzák meg, hogy az első ésa második diszkrét, folytonos szegmensek (S1, S2) különböző kézzel írtkarakter-bemenőjelekhez tartoznak-e. A mért távolság alapjánmeghatározhatók az egyes szegmenseknek (S1, S2) az írás tengelyéremerőleges határvonalai (b1, b2), vagy adott esetben a szegmensek (S1,S2) még az írás tengelyére merőlegesen, ezen tengellyel párhuzamossávokra is oszthatók, ezeknek alapján határozhatók meg a szegmensek(S1, S2) határvonalai (b1, b2). ŕ
Description
A találmány tárgya több különféle, de azonos felismerésen alapuló eljárás kézzel írt karakter-bemenójelek egyes szegmenseinek azonosítására, elsősorban pedig annak megállapítására, hogy az egyes szegmensek azonos kifejezésből, például szóból származnak. Még pontosabban a találmány szerinti eljárás lehetővé teszi, hogy egy írásos jelben az egyes szavakat fel lehessen ismerni.
Az emberi kézírás egyes részeinek valamilyen berendezés segítségével történő felismerése nagyon nehéz probléma, különösen a tollal írt szöveggel is működő számítógépek elterjedése óta, ettől kezdve vált ugyanis különösen nagy problémává a jelek megfelelő megcímzése. Az emberi kézírás gépi úton történő felismerésére mindez ideig számos megoldást próbáltak kidolgozni.
Az US 4 206 442 számú szabadalmi leírás egy olyan megoldást ismertet, ahol szintén karaktereket kell megkülönböztetni, de ahol az egyes karakterek el vannak ugyan választva, de átfedik egymást. Ennél a megoldásnál két adatkészletet tárolnak, az első adatkészlet kétszintű, azaz bináris jelekből áll, a második adatkészlet pedig többszintű. Ezen eljárás során, amikor két szegmenst analizálnak, először az első készlettel hasonlítják össze, hogy van-e egyezés. Ha nincs, az eljárás során mindkét szegmens teljes szélességét vizsgálják és megfelezik, majd a felezett értékeket hasonlítják össze a bináris jelsorozattal. Ha így sincs egyezés, a felezett szegmenseket összehasonlítják a többszintű jelsorozattal. Ez az eljárás amellett, hogy bonyolult, nem is ad pontos eredményt.
A jelenleg alkalmazott emberi kézírás gépi felismerését megvalósító berendezések személyes digitális jelfeldolgozást igényelnek, ilyenek például a EO vagy a Newton termékek. Ezek a termékek általában érintésre érzékeny képernyők, amelyre a kézírás felvihető. Ezek a berendezések a kézzel írt, például alfanumerikus bemenőjelet digitalizálják, és az ezt követő jelfeldolgozás folyamán próbálják meg felismerni a kézírás információtartalmát.
Az ismert kézírás, illetőleg a kézírás összetartozó részeit felismerő eljárások közül az egyik leginkább elterjedt megoldás az, amikor az egy sorban lévő minden egyes alfanumerikus karaktert azonosítanak, ily módon eredőként egy sor olyan karaktert kapnak, amely a felismerés eredményét tartalmazza. A jelfeldolgozás ezen megközelítésének azonban számos hátránya van. Egyik hátrány, hogy rendkívül nehéz azonosítani az egyes bemenőadatok, például az alfanumerikus karakterek határvonalait. Abban az esetben pedig, ha az egyes karakterek, illetőleg szavak elhatárolása nem megfelelő, nagyon nehéz felismerni pontosan egy adott karaktert, mivel vagy hiányzik belőle valamilyen elem, vagy pedig olyan további, nem oda tartozó külső információt is tartalmaz, amely egyébként egy szomszédos karakterhez tartozik.
Az emberi kézírás gépi úton történő felismerésének egyik legfontosabb problémája az, hogy hogyan lehet az egyes bemenőjelek szegmenseinek, például szavak végét, illetőleg a következőnek a kezdetét felismerni és azonosítani. Abban az esetben, ha a kézzel írt szegmensek, például szavak vagy kínai jelek közötti szünetek felismerése nem megfelelő, úgy az eredmény sem lesz megfelelő, és a kézzel írt bemenőinformáció visszaadása pontatlan lesz vagy nem a tartalmának megfelelő.
Fennáll tehát az igény olyan, a kézírás részeit, szegmenseit megfelelően felismerő eljárás iránt, amely meg tudja különböztetni és jelezni is tudja egy első kézzel írt bemenőszegmens végét és egy második kézzel írt bemenőszegmens kezdetét, és ily módon kézírással bevitt bemenőjelek esetében a kézírás információtartalmának sokkal pontosabb visszaadása válik lehetővé.
A találmány tehát eljárás kézzel írt karakter-bemenőjelek, azaz szegmensek azonosítására, amely eljárás során a legalább egy első és egy második diszkrét, önmagában folytonos szegmensből álló kézzel írt karakter-bemenőjelet vesszük, majd
- az első és második diszkrét, folytonos szegmensek között legalább egy, az írás tengelyével párhuzamos távolságot számítunk ki úgy, hogy
- az első és második diszkrét, folytonos szegmensek között több távolságot mérünk, és
- meghatározzuk, hogy a több távolság közül melyik a legkisebb;
- és a mért távolságok, célszerűen, a legkisebb mért távolság alapján határozzuk meg, hogy az első és a második diszkrét, folytonos szegmensek különböző kézzel írt karakter-bemenőjelekhez tartoznak-e.
A találmány tárgya továbbá olyan eljárás is kézzel írt karakter-bemenőjel szegmenseinek azonosítására, amelynek során egy legalább első és egy második diszkrét, önmagában folytonos szegmensből álló, kézzel írt karakter-bemenőjelet veszünk, és
- az első és második diszkrét, folytonos szegmensek közötti legalább egy, az első és második diszkrét folytonos szegmensek írásának tengelyeivel párhuzamos távolságot számítunk ki úgy, hogy
- mind az első, mind pedig a második folytonos diszkrét szegmensnél egy, az írástengelyre merőleges határvonalat mérünk,
- az első és második szegmensek határvonalai között a távolságot kiszámítjuk,
- az első és második diszkrét, folytonos szegmensekhez tartozó határvonalak közötti távolság alapján határozzuk meg, hogy az első és a második diszkrét, folytonos szegmensek különböző kézzel írt karakterbemenetekhez tartoznak-e.
A találmány tárgya még egy olyan eljárás is kézzel írt karakter-bemenőjeleket képező szegmensek azonosítására, amelynek során egy első és egy második diszkrét, önmagában folytonos szegmensből álló, olyan kézzel írt karakter-bemenőjelet veszünk, és az írás irányában eső tengelyt tekintjük egy első tengelynek,
- az első és második folytonos szegmensekhez tartozó határvonalakat úgy határozzuk meg az első tengelyre merőleges második tengely mentén, hogy mind az első, mind a második folytonos szegmensnél megmérjük a másiknak a határvonalához legközelebb eső pontját,
- kiszámítunk a határvonalak között az első tengellyel párhuzamosan egy első távolságot; és
- ezen első távolság alapján határozzuk meg, hogy az első és második folytonos szegmensek különböző kézzel írt karakter-bemenőjelekhez tartoznak-e úgy, hogy
HU 219 991 Β
- ezt az első távolságot egy első küszöbértékkel összehasonlítjuk, és
- ha az első távolság az első küszöbértéknél nagyobb, az első és második folytonos szegmenseket külön kézzel írtnak tekintjük,
- ha az első távolság az első küszöbérték alatti értéken van, az első és második folytonos szegmenseket külön-külön sávokra osztjuk,
- a sávokat analizáljuk és megmérjük, hogy mely sávok tartoznak az első és a második folytonos szegmenshez,
- megvizsgáljuk azokat a sávokat, amelyeket az első és a második folytonos szegmensek tartalmaznak, és megmérjük az első és második folytonos szegmensek legközelebbi sávjai közötti távolságot, mint második távolságot,
- az első távolság és a második távolság alapján határozzuk meg, hogy az első és második folytonos szegmensek különböző kézzel írt karakter-bemenőjelekhez tartoznak-e.
Célszerű ennél az eljárásnál, amikor a második távolságot határozzuk meg, hogy legalább az első és második folytonos szegmensek különböző kézzel írt karakterbemenetekhez tartoznak-e, a következő lépéseket hajtjuk végre:
- az első és a második távolságnak súlyozott átlagát számítjuk ki,
- a súlyozott átlagot összehasonlítjuk egy második küszöbértékkel;
- ha a súlyozott átlag nagyobb, mint a második küszöbérték, az első és második folytonos szegmensek különböző kézzel írt karakter-bemenőjelekhez tartoznak,
- ha a súlyozott átlag kisebb, mint a második küszöbérték, az első és második folytonos szegmensek azonos kézzel írt karakter-bemenőjelhez tartoznak.
Előnyös, ha a sávokat az írás tengelyére merőleges irányban osztjuk el, és az írás tengelyére merőleges irányban azonos szélességűnek választjuk meg.
A találmány tárgya továbbá egy olyan eljárás is kézzel írt karakter-bemenőjelek egyes szegmenseinek azonosítására, az írás tengelye mentén vett első és második diszkrét, folytonos szegmensekből álló kézzel írt karakter-bemenőjel feldolgozásával, hogy megmérjük az első diszkrét, folytonos szegmenshez tartozó első határvonalat, és a második diszkrét, folytonos szegmenshez tartozó második határvonalat, amely első határvonal az első diszkrét, folytonos szegmensnek egy adott hivatkozási ponttól való legnagyobb távolsága, a második határvonal a második diszkrét, folytonos szegmensnek a hivatkozási ponttól való legkisebb távolsága,
- az első és második határvonalak között egy, az írás tengelyével párhuzamos első távolságot számítunk ki,
- ezt az első távolságot egy első küszöbértékkel összehasonlítjuk, és ha az első távolság az első küszöbértéknél nagyobb, az első és második diszkrét, folytonos szegmenseket különböző kézzel írt karakter-bemenőjelekhez tartozónak tekintjük,
- ahol az első távolság kisebb az első küszöbértéknél, a szegmenseket sávokra osztjuk, és minden sávra meghatározzuk a szegmensek közötti távolságot, és kiválasztjuk a legkisebbet, mint második távolságot, és
- akkor tekintjük az első és második diszkrét, folytonos szegmenseket különböző kézzel írt karakter-bemenőjelekhez tartozónak, ha a második távolság nagyobb egy második küszöbértéknél.
A találmány tárgya továbbá egy olyan eljárás is kézzel írt karakter-bemenőjelek egyes szegmenseinek azonosítására, amelynek során legalább egy első és egy második diszkrét, folytonos szegmensekből álló kézzel írt olyan karakter-bemenőjelet veszünk, amelyek az írás tengelye mentén egymás után helyezkednek el, és
- megmérjük az első és második szegmens, az írás tengelyére merőleges első és egy második határvonalát;
- az első határvonalat úgy számítjuk ki, hogy megkeressük az első diszkrét, folytonos szegmensben azt a pontot, amely az írás tengelye mentén egy hivatkozási ponttól legtávolabb van;
- a második határvonalat úgy számítjuk ki, hogy megkeressük azt a pontot a második diszkrét, folytonos szegmensben, amely az írás tengelye mentén a hivatkozási ponthoz legközelebb van;
- meghatározzuk, hogy az első diszkrét, folytonos szegmensben lévő legtávolabbi pont nagyobb-e, mint a második diszkrét, folytonos szegmensben a legközelebbi pont;
- ha igen, kiszámítjuk a második diszkrét, folytonos szegmens legközelebbi pontjának és az első diszkrét, folytonos szegmens legtávolabbi pontjának a különbségét képező értéket, és
- ezen érték alapján meghatározzuk, hogy az első és második diszkrét, folytonos szegmensek különböző kézzel írt karakterbemenetekhez tartoznak-e.
A találmányt a továbbiakban példák alapján, a mellékelt ábrákon ismertetjük részletesebben. Az
1. ábrán a találmány szerinti eljárások működésének folyamatábrája látható, a
2. ábrán a találmány szerinti egyik olyan eljárásra mutatunk be példát, ahol az írás tengelye vízszintes, a
3. ábrán egy olyan példát mutatunk be, ahol az írás tengelye függőleges, a
4. ábrán a találmány szerinti eljárás egy további foganatosítási módját képező lépéséhez mutatunk be példát, szintén kézzel írt bemenőjelhez, az
5. ábrán a találmány tárgyát képező további eljárásra mutatunk be példát.
A felhasználó részéről érkező, kézzel írt karakterbemenőjel általában diszkrét, de önmagában folytonos szegmensekből áll. A diszkrét, folytonos szegmensek mindegyike általában egy vagy több írásvonalból vagy tollvonásból áll, ahol maga az írás során az íróeszköz, például toll egy digitalizálólappal vagy papírral van folyamatosan kontaktusban. A leírt vonalat pontoknak a sorozata jelképezi, amelyeket az írást feldolgozó jelfeldolgozó rendszer szabályos intervallumokban tapogat le, és minden egyes pontot legalább egy X koordináta és legalább egy Y koordinátával jellemez. A vonalakat tehát egy digitalizálótábla, digitalizáló adatbeviteli esz3
HU 219 991 Β köz vagy egyéb, erre a célra önmagában ismert módon használt elem érzékeli. A továbbított jel lehet például telefaxon továbbított kép is, amely vonalak sorozatából áll. A soronkénti letapogatás villamos úton történő megvalósítása önmagában ismert.
A találmány szerinti eljárás elsődlegesen arra szolgál, hogy több, önmagában folytonos, diszkrét szegmensből álló, kézzel írt karakter-bemenőjel esetében meg lehessen állapítani, hogy a két folytonos, diszkrét szegmens azonos kézzel írt bemenőjel része-e, azaz például azonos szóból származik. A találmány szerinti megoldásnál a diszkrét, folytonos szegmensek azok, amelyeket egy-egy egységként ismer fel a rendszer. A kézzel írt bemenőjel lehet, de nem csupán az alábbiakból álló bemenőjel: kézírás, villamos jel, nyomás által létrehozott bemenőjel, például egy pecsét által létrehozott bemenőjel, továbbá minden olyan bemenőjel, amely elektronikus úton, tehát telefaxkészüléken, pagerkészüléken vagy egyéb készüléken keresztül került továbbításra.
A találmány szerinti többféle, azonos felismerésen alapuló eljárás lehetővé teszi, hogy megállapítsuk azt, hogy két diszkrét, folytonos szegmens ugyanannak a szónak vagy kifejezésnek, azaz bemenőjelnek a részét képezi-e. A találmány szerinti eljárásnál úgy járunk el, hogy egy vagy több írás tengelyével lényegében párhuzamos távolságot mérünk meg és számítunk ki, és ezeket a kiszámított értékeket egy vagy több, előre megadott küszöbértékkel hasonlítjuk össze. A küszöbértékek olyan minimális értékeket jelentenek, amelynél mindenképpen nagyobbnak kell lenniük az egyes diszkrét folytonos szegmensekben a párhuzamos távolságoknak ahhoz, hogy meg lehessen állapítani, hogy külön kézzel írt bemenőjelekről, azaz például különálló szavakról van-e szó.
Az írás tengelye egy olyan vonal, amely mentén a kézzel írt szegmensek beadása történik. Az írás iránya pedig az az irány, amely mentén az egymás után következő, kézzel írt bemenőjeleket képező szegmensek, például szavak, bevitelre kerülnek. Az angol nyelvben az írás tengelye vízszintes, és maga az írás balról jobbra történik. Természetesen az írás más tengelyei, illetőleg irányai is felismerhetők a találmány szerinti eljárás alkalmazásával.
A találmány szerinti eljárás alkalmazható úgy, hogy az írás tengelye vízszintes, és a kézzel írt bemenőjeleket képező szegmensek szavak sorozatából állnak. Ebben az esetben a lényegében párhuzamos távolságokat vízszintes irányban méljük meg, és a kimeneti jel azt adja meg, hogy az adott diszkrét, folytonos szegmensek külön szavakhoz tartoznak-e. Egy másik eljárási mód, amely a találmány szerint szintén jól alkalmazható az, amikor az írás tengelye vízszintes, a kézzel írt bemenőjeleket különféle karakterek sorozata képezi, amelyek lehetnek alfanumerikus karakterek, lehet videografikus karakter, amelyet például a kínai nyelv használ, vagy egyéb karakteres szimbólumok írott formái. Ebben az esetben a kimenetijei azt adja meg, hogy az adott diszkrét, folytonos szegmensek külön karakterhez tartoznake. Alkalmazható az eljárás akkor is, ha az írás tengelye függőleges, a kézzel írt bemenőjelek különböző karakterek sorozatából állnak, amelyek lehetnek alfanumerikus karakterek, videografikus karakterek vagy egyéb, kézzel írt szövegek. Itt az írás tengelye függőleges, ily módon a lényegében párhuzamos távolságok függőlegesen helyezkednek el. A kimeneti jel azt adja meg, hogy a diszkrét, folytonos szegmensek külön karakterekhez tartoznak-e. Még egy alkalmazási lehetőség, ha az írás tengelye függőleges, a bemenőjelek külön szavak sorozatából, alfanumerikus bemenőjel-sorozatból vagy egyéb, kézzel írt bemenőjelek sorozatából állnak úgy, hogy a szavak vagy jelek függőleges sort képeznek. Ebben az esetben tehát az írás tengelye függőleges, és a lényegében párhuzamos távolságokat szintén függőlegesen mérjük. A kimenetijei azt adja meg, hogy a különálló, kézzel írt, diszkrét, folytonos szegmensek, például szavak valóban külön bemenőjeleket képeznek-e.
A továbbiakban részletesen kitérünk arra, hogy a találmány szerinti felismerés hányféle eljárásként alkalmazható, továbbá arra, hogy az írás tengelye gyakorlatilag bármilyen szögben elhelyezkedhet, és a kézzel írt bemenőjeleket különböző olyan karakterek vagy szavak, de nem csupán ezek képezhetik, amelyek egy-egy diszkrét, folytonos szegmensből állnak. A találmány szerinti eljárás során a különféle foganatosítási módok csak a koordináta-rendszer megválasztásában jelentenek eltérést, alapvetően azonban az eljárási lépések sorozata mindegyik esetben megegyezik.
Az 1. ábrán látható a találmány szerinti eljárás folyamatábrája. A találmány szerinti eljárás alkalmas diszkrét, folytonos szegmensekből álló, egy vagy több kézzel írt bemenőjel feldolgozására. A példákon két diszkrét, folytonos Sl és S2 szegmens feldolgozását mutatjuk be. A kézzel írt bemenőjeleket képező diszkrét, folytonos Sl és S2 szegmensek vétele az első 110 lépésben történik. A vétel egy önmagában ismert PDA vagy egyéb berendezés alkalmazásával történik. Természetesen más eszközöket is használhatunk a kézzel írt bemenőjel vételére, például számítógépeket, modemeket, pagert, telefont, digitális vagy interaktív vagy egyéb televíziós berendezéseket, minden olyan berendezést, amely tartalmaz egy digitalizálótáblát. Lehet a kézzel írt bemenőjel forrása telefaxberendezés, letapogatóberendezés, és minden olyan berendezés, amely képes arra, hogy kézzel írt bemenőjelet feldolgozzon. A kézzel írt bemenőjel vétele után a következő lépés az írás tengelyére lényegében merőleges, a két diszkrét, folytonos Sl és S2 szegmens bl és b2 határvonalának a meghatározása. Ez történik a 120 lépésben. A bl és b2 határvonalak tehát lényegében merőlegesek az írás tengelyére, és meghatározásuk úgy történik, hogy a Sl szegmens vonalában meg kell mérni a kezdetétől számított legtávolabbi pont távolságát, ahol tehát legnagyobb az eltolódás az írás irányában, és a S2 szegmensben pedig meg kell mérni a legelső pont távolságát. A bl és b2 határvonalak a 2. és a 3. ábrán a későbbiekben bemutatásra kerülnek. A függőleges b2 határvonal a S2 szegmensnél a pontok eltolódásának az a helye, ahol a kézírás irányában a legkisebb a távolság a kézzel írt bemenőjelek kezdetéhez viszonyítva. A következő lépésben az Sl szegmensben az írás irányában minden egyes pontnak a helyzetét kiszámítjuk, majd összehasonlítjuk egy tárolt értékkel, és a bl határvonal az írás irányában a
HU 219 991 Β legnagyobb távolságnak felel meg. Ha a számított távolság nagyobb, mint a tárolt érték, úgy a tárolt értéket a számított értékkel helyettesítjük. Hasonlóan lehet megmérni az S2 szegmensben azt a legkisebb távolságot, amely írásirányban az S2 szegmens egyes pontjaira vonatkozik. Az S2 szegmensnél megállapított legkisebb távolságot, ami a b2 határvonalnak felel meg, összehasonlítjuk egy tárolt értékkel. Ha a számított távolság kisebb, mint a tárolt érték, úgy a tárolt értéket a számított értékkel helyettesítjük. A 130 lépésben a két Sl és S2 szegmens közötti első d’ távolságot számítjuk ki, ahol d’=b2-bl.
Az így kiszámított első d’ távolságot ezt követően a következő 140 lépésben összehasonlítjuk egy előre megadott t’ küszöbértékkel. Ha az első d’ távolság nagyobb vagy egyenlő, mint a t’ küszöbérték, úgy az eljárás során a következő 145 lépésben azt a következtetést vonjuk le, hogy az első folytonos, diszkrét Sl szegmens és a második folytonos, diszkrét S2 szegmens különböző kézzel írt szavak, karakterek vagy egyéb kézzel írt bemenőjelek. A t’ küszöbértéknek, mint előre megadott értéknek a megválasztása mindig a különböző, egyéb külső feltételek figyelembevételével történik, és erre a későbbiek során még visszatérünk.
Ha az első d’ távolság kisebb, mint a t’ küszöbérték, úgy további jelfeldolgozó lépésre van szükség. Azt meghatározandó, hogy a diszkrét, folytonos Sl és S2 szegmensek valóban különálló diszkrét, folytonos bemenőjeleket képeznek, egy szintén lényegében párhuzamos második d” távolságot számítunk ki. Ehhez az Sl és S2 szegmenseket az írás tengelyére merőlegesen, az írás tengelyével párhuzamos sávokra osztjuk fel. Ez a második d” távolság párhuzamos sávok távolságának a mérésével és azok feldolgozásával, nevezetesen a legközelebb eső sávok közötti távolság meghatározásával történik. Ehhez a következő 150 lépésben meghatározzuk az Sl és S2 szegmenseknek az írás tengelyére merőleges, maximális értékét, majd a 160 lépésben az írás tengelyére merőlegesen, egymással és az írás tengelyével párhuzamos, egyenlő magasságú sávokra osztjuk. A 170 lépésben az Sl szegmens sávjai közül meghatározzuk azt, amelynek a kiindulási ponttól a legnagyobb a távolsága, az S2 szegmensek párhuzamos sávjai közül pedig azt, amelynek ugyanettől a ponttól legkisebb a távolsága. Ezt követően a 180 lépésben ezen két sáv közötti távolságot határozzuk meg, mint az Sl és S2 szegmensek közötti legkisebb második d” távolságot. A második d” távolságnak és az első d’ távolságnak a figyelembevételével és ezek kombinációjából határozzuk meg azt, hogy az Sl szegmens és az S2 szegmens ugyanazon kézzel írt bemenőjelek részét képezik-e. A 190 lépésben a d’ és a d” távolságnak a súlyozott átlagát képezzük. A súlyozott átlagot a példánál az alábbiak szerint képezzük: dw=q’d’+q”d”/(q’+q”). Tapasztalati mérések alapján, amelyeket az aktuális kézírás adatai alapján állapítunk meg, a d’ és a d” távolság segítségével képezett, súlyozott, átlag dw távolság sokkal pontosabb értéket ad, mint bármelyik külön-külön. A példakénti kiviteli alaknál a q’=q”, azonban további optimalizálási lépéseket is végezhetünk azáltal, hogy a q’ és a q” nem azonos. Ezen túlmenően a q’ és a q” közül bármelyik lehet nulla, de nem egyidejűleg.
Az ily módon, súlyozással kapott dw távolságértéket azután a 195 lépésben összehasonlítjuk egy második t” küszöbértékkel. Ha a dw távolság kisebb, mint a d” távolság, úgy az eljárás azt a következtetést vonja le, hogy az Sl szegmens és az S2 szegmens ugyanazon kézzel írt bemenőjel részét képezik. Ha a 195 lépésben az összehasonlításkor azt tapasztaljuk, hogy a dw távolság nagyobb vagy egyenlő, mint t” küszöbérték, úgy a következtetés az, hogy az Sl és S2 szegmensek különböző folytonos, diszkrét, kézzel írt bemenőjelek részét képezik, ez az eredmény a 199 lépésben jelenik meg.
A t’ és a t” küszöbértékek többféleképpen választhatók meg. A f küszöbérték beállítható úgy, hogy megmérjük egy viszonylag nagy adatsorban a d’ távolságértékeket, és kiválasztjuk azt az értéket, amely legjobban megközelíti a valós értéket. Az eljárás során eljárhatunk úgy is, hogy a t’ küszöbértéket konstans értékre állítjuk be, amely a bemeneti berendezés mérési időállandója törtrésze. Az eljárás szerint eljárhatunk úgy is, hogy a t’ küszöbérték értékét dinamikusan változtatjuk, mégpedig az Sl és S2 szegmenseknek az írás irányára merőlegesen mért értékei függvényében, annak szintén adott törtrészeként. Az eljárás során eljárhatunk úgy is, hogy a t’ küszöbértéket a felhasználó állítja be explicit módon, mielőtt az eljárást elvégezné. Angol alfanumerikus szövegek esetében igen jó eredményt értünk el, ha a t’ küszöbértéket az Sl és S2 szegmenseknek az írás irányára vett merőleges mérete egyharmadára állítottuk be. A t’ küszöbérték értékét természetesen a különféle célokra optimálisan más és más értékre is be lehet állítani. Hasonló módon a t” küszöbérték is a különböző vizsgálandó és leolvasandó bemenőjeleknél többféle módon állapítható meg.
A 2. ábrán egy példát mutatunk be a találmány szerinti eljárásra. A diszkrét, folytonos Sl szegmensnek a 210 szegmens, az S2 szegmensnek a 220 szegmens felel meg, amelyek itt angol szavak. Az írás 230 tengelye vízszintes, az írás 270 iránya pedig balról jobbra halad. Az írás 270 irányában az egyes pontoknak a helyzetét és eltolódását az egyes pontok X koordinátáival adjuk meg, és az írás 230 tengelyére merőleges bl és b2 határvonalakat, ahol a bl határvonal a 240 határvonal, b2 határvonal pedig a 250 határvonal, szintén az X tengely mentén vett helyzetével határozzuk meg. A 240 határvonal 210 szegmensnek a legjobboldalibb pontjához tartozó X koordináta helyén van, a 250 határvonal pedig a 220 szegmens legbaloldalibb pontjának a helyzete. Az első d’ távolságnak a 250 és 240 határvonalak közötti 260 távolság felel meg.
A 3. ábrán látható példánál a diszkrét, folytonos Sl szegmensnek a 310 szegmens, az S2 szegmensnek pedig a 320 szegmens felel meg, amelyek a kínai nyelvben használt karakterek, ahol is az írás 330 tengelye vízszintes, az írás 370 iránya függőlegesen, felülről lefelé haladó. Az írás 370 irányában az egyes pontok koordinátáit az Y koordináták jellemzik -1-gyel szorozva, feltételezve a hagyományos koordináta-rendszert, így Y fentről lefelé növekszik. A lényegében merőleges irányú bl és b2 határvonalakat itt a 340 határvonal és a
HU 219 991 Β
350 határvonal képezi, ahol a 340 határvonal a 310 szegmens legalsó pontja Y koordinátájának a-1-szerese, a 350 határvonal pedig a 320 szegmens legfelső pontja Y koordinátájának a- 1-szerese. Az első d’ távolságnak a 340 és 350 határvonalak közötti 360 távolság felel meg. Olyan eljárások is megvalósíthatók, ahol a bl és b2 határvonalakat az írás tengelyének egyszerű geometriai forgatásával számítjuk ki úgy, hogy az írás tengelyét forgatással a koordináta-rendszer egyik fő tengelyével hozzuk egy vonalba, és akkor a már említett számítási módszer szerint járhatunk el. Ilyen jellegű műveletet szakember minden további nélkül el tud végezni. További foganatosítási módok megvalósíthatók úgy is, hogy az írás irányában az egyes pontok helyzetének a számítását úgy végezzük, hogy ha az írás iránya nem esik egybe a koordináta-rendszer egyik főtengelyével sem, a diszkrét, folytonos SÍ és S2 szegmenseket geometriai úton kivetítjük a megfelelő tengelyekre és ehhez a trigonometriából ismert számítási módszereket alkalmazzuk. Ez lényegében csak egy matematikai eljárás, ahol az írás tengelyét megfelelő, ismert koordinátarendszer fő tengelyeire vetítve használjuk.
Ahogyan erre már a korábbiakban is utaltunk, amennyiben az első d’ távolság kisebb, mint a t’ küszöbérték, amelynek megállapítása a 130 lépés után történik, akkor az eljárás folytatódik. Sok esetben az SÍ és S2 szegmensek a valóságban különböző szavakhoz vagy karakterekhez tartoznak, és mégis úgy helyezkednek el, hogy az elsőként mért első d’ távolság kicsi vagy éppen akár negatív értékű is lehet, azonban a találmány szerint még ebben az esetben is egyértelműen meg lehet határozni azt, hogy az SÍ és S2 szegmensek különböző szavakhoz vagy karakterekhez tartoznak. Erre a 4. ábrán mutatunk be egy példát.
A 4. ábrán leírt szövegnél az SÍ szegmensnek a 410 szegmens felel meg, az S2 szegmensnek a 420 szegmens, és mindkettő angol szó. Ennél a példánál jól látható, hogy az első d’ távolság értéke, amely itt a 460 távolságnak felel meg, negatív, ugyanis a bl határvonalnak megfelelő 450 határvonal távolsága az írás kezdetétől vagy egy tetszőleges, korábbi vonatkoztatási ponttól nagyobb, mint a b2 határvonalnak megfelelő 440 határvonal távolsága ugyanettől a ponttól. Ennél a példánál az írás 430 tengelye vízszintes, az írás 470 iránya pedig balról jobbra halad.
Abban az esetben, ha az írás tengelye vízszintes, az SÍ és S2 szegmenseknek az írás tengelyére merőleges maximális értékét úgy mérhetjük meg, hogy megkeressük a minimális és maximális Y koordinátaértékeket. A minimális Y koordinátaérték meghatározásához egy viszonylag nagy, pozitív, tárolt értékből indulunk ki, és az SÍ és S2 szegmensek minden egyes pontját megvizsgáljuk, és megnézzük azt, hogy annak az Y koordinátái kisebbek-e mint az a tárolt érték, amely mint Y koordináta van megadva. Hasonló módon határozható meg a maximális Y koordinátaérték is. A maximális Y koordinátából kivonva a minimális Y koordinátát kiszámíthatjuk az írás tengelyére merőleges értéket. Az SÍ és S2 szegmenseknek minden egyes pontja ezen belül fog elhelyezkedni.
Ez a számítási módszer sokkal jobb hatásfokkal végezhető el akkor, ha az SÍ és S2 szegmenseknek csak azokat az értékeit vesszük figyelembe, amelyek a szóban forgó határértékek közelében helyezkednek el, mivel ezek azok, amelyek a mérés szempontjából rendkívül fontosak.
Ha az írás tengelye függőleges, az egyes SÍ és S2 szegmenseknek az írás tengelyére merőleges, maximális értékét úgy számítjuk ki, hogy megnézzük az SÍ és S2 szegmensekhez tartozó minimális és maximális X koordinátaértékeket. A minimális X koordinátaérték megtalálásához egy nagy, pozitív értékű, tárolt értékből indulunk ki, és ezt követően az SÍ és S2 szegmenseknek minden pontját ehhez képest megvizsgáljuk, és ha az X koordinátaértékek kisebbek, mint a tárolt értékek, úgy a tárolt értéket jelöljük ki, mint X koordinátát. Hasonló módon lehet a maximális X koordináta értéket megtalálni.
Ha az írás tengelye sem nem vízszintes, sem nem függőleges, a képnek a síkját el lehet úgy forgatni, hogy az írás tengelye a koordináta-rendszer akár X akár Y tengelyével essen egybe, ahogyan erre már utaltunk is, és ebben az esetben jól meg lehet határozni a lényegében párhuzamos d’ távolságot még akkor is, ha az írás tengelye sem nem vízszintes, sem nem függőleges.
Abban az esetben, ha az adott SÍ és S2 szegmenseknek az írás tengelyére merőleges értékét meghatároztuk, a következő lépésben az SÍ és S2 szegmenseket az írás tengelyére merőlegesen egymással és az írás tengelyével párhuzamos sávokra osztjuk fel, ahogy ez az
5. ábrán látható. Az 5. ábrán látható SÍ szegmens 520 sávokból áll, az S2 szegmens pedig 530 sávokból áll. Az írás tengelyére merőleges 510 magasság szintén látható. Minden egyes 520 és 530 sávot megvizsgálunk, és meghatározzuk az írás irányába az SÍ szegmensnek a legtávolabbi pontját, és az S2 szegmensnek a kiindulási ponthoz legközelebb eső pontját. Ez úgy végezhető el jó hatásfokkal az SÍ szegmens vonatkozásában, hogy minden egyes sávra egy igen nagy, negatív számból indulunk. Az SÍ szegmens minden egyes pontját így lemérjük. Először az írás tengelyére merőleges tengely mentén lévő 520 és 530 sávokat vizsgáljuk úgy, hogy megnézzük azt, hogy melyik 520 és 530 sáv esik bele ebbe az értékbe. Mivel az 520 és 530 sávok az SÍ, illetőleg S2 szegmenseket teljesen átfogják, biztosítva van, hogy az SÍ és S2 szegmens minden pontjára található egy 520 és 530 sáv. Ha az írás tengelyére merőleges 510 magasság számításánál csak néhány pontot veszünk figyelembe az SÍ és S2 szegmensben, akkor nem biztos, hogy a függőleges irányú méret magában foglalja az SÍ és S2 szegmensek minden pontját, ily módon tehát minden egyes pontot ellenőriznünk kell, hogy biztosak legyünk abban, hogy az egy 520, illetőleg 530 sávon belül helyezkedik el. Ha egy 520, illetőleg 530 sávot azonosítottunk, akkor az írás irányába vett pont helyzetét összehasonlítjuk az erre az adott 520, illetőleg 530 sávra tárolt értékkel, és ha az érzékelt helyzet a nagyobb, úgy ezt jelöljük meg, mint tárolt értéket. Abban az esetben, ha az SÍ szegmens minden egyes pontját ellenőriztük, akkor az egyes 520, illetőleg 530 sávok6
HU 219 991 Β ra vonatkozó, tárolt értékek fogják megadni az adott pont legnagyobb eltolódását az SÍ szegmensben. Ha az SÍ szegmensben nem voltak olyan pontok, amelyek egy adott 520 sávhoz tartoznak, úgy a tárolt érték a kezdeti, igen nagy, negatív számnak megfelelő érték lesz. Hasonló módon járunk el egy másik tárolt érték felhasználásával minden egyes 530 sávban úgy, hogy egy nagy, pozitív értékről indulunk, és az S2 szegmens vonatkozásában megvizsgáljuk az írás irányában az S2 minden egyes 530 sávjára a minimális eltolódást pontot. Ha egy adott 530 sávon ilyen pont nincsen, úgy az adott 530 sávra a második tárolt érték lesz a legnagyobb inicializált érték.
Ezzel az eljárással minden egyes 520, illetőleg 530 sávra két tárolt értéket kapunk, az egyik az írás irányát tekintve az SÍ szegmens legnagyobb eltolódás! pontjának felel meg, azaz a bl határvonalnak, a másik pedig az S2 szegmens legkisebb eltolódást pontjának, azaz a b2 határvonalnak felel meg. Ha egyik tárolt értéknél sincs változás, a nagyon nagy, negatív vagy a nagyon nagy, pozitív kezdeti értékhez képest, akkor az adott 520, illetőleg 530 sávra ezt az információs jelet a további számítások során nem vesszük figyelembe. Ha igen, az egyes 520, illetőleg 530 sávokra a távolságot úgy határozzuk meg, hogy az SÍ szegmensben lévő pont tárolt eltolódásának értékét kivonjuk az S2 szegmensben lévő pont tárolt eltolódási értékéből. Minden egyes 520, illetőleg 530 sávra megvizsgáljuk ezt a távolságot, és a legkisebb távolság, amit így találunk, kerül tárolásra, mint legkisebb érték. Ez a legkisebb távolság lesz lényegében a második d” távolság (540 távolság). Ha a második d” távolság kisebb mint nulla, ez azt jelenti, hogy az SÍ szegmens és az S2 szegmens vagy érinti egymást vagy átfedi egymást, ebben az esetben a nulla értéket jelöljük ki.
Az 5. ábrán látható példánál az írás tengelye vízszintes, az írás iránya pedig balról jobbra halad. Az 5. ábrán látható, hogy az írás irányára merőleges méret meghatározásához az írás irányával párhuzamosan tíz sávot alkalmaztunk. Az SÍ szegmens legjobboldalibb pontja és az S2 szegmens legbaloldalibb pontja jól felismerhető az SÍ szegmens 520 sávjai, és az S2 szegmens 530 sávjai közül. A számítást úgy végezzük, hogy az SÍ szegmens vonatkozásában minden egyes 520 sávra egy nagyon nagy, negatív számból indulunk ki, és az SÍ szegmens minden egyes pontját ellenőrizzük. Először az Y koordinátákat ellenőrizzük, megvizsgálandó, hogy melyik sávról van szó. Mivel a sávok az SÍ és S2 szegmens teljes 510 magasságát átfogják, biztosítva van az is, hogy az SÍ szegmensnek és az S2 szegmensnek minden pontja megtalálható valamelyik 520, illetőleg 530 sávban. Ha egy 520, illetőleg 530 sávot azonosítottunk, akkor az X koordinátát összehasonlítjuk egy erre az 520, illetőleg 530 sávra tárolt X koordinátaértékkel, és ha ez az X koordináta nagyobb, úgy ezt tekintjük a továbbiakban, mint az erre a sávra kijelölt értéket. Abban az esetben, ha az SÍ szegmens minden egyes pontját ily módon ellenőrizzük, a tárolt értékek minden egyes 520 sávra megvannak, és így megkapjuk az SÍ szegmenshez tartozó azon 520 sáv értékét is, ahol az
SÍ szegmens legjobboldalibb pontja helyezkedik el. Ha az SÍ szegmensnek nincsen olyan pontja, amely egy adott 520 sávon belül helyezkedik el, úgy a tárolt érték a kezdeti, kiindulási, nagy negatív érték lesz. Hasonló módon járunk el az S2 szegmens vonatkozásában is, ahol is egy második tárolt értéket használunk, amely egy nagy pozitív számra kapcsolódik, és ennek segítségével határozzuk meg az S2 szegmens minden egyes 520 sávjában az X koordinátákat és így a legbaloldalibb koordinátáját is.
Ahogyan már a korábbiakban utaltunk rá, a d” távolság értéke az egyes 520, illetőleg 530 sávokra tárolt koordináták értékeiből határozható meg. Az SÍ szegmens és az S2 szegmens közötti legrövidebb, lényegében párhuzamos távolság a sávokra felvett mérésekből határozható meg, mint második d” távolság. A második d” távolság értékét azután az első d’ távolság értékével súlyozottan kombináljuk, majd összehasonlítjuk a t” küszöbértékkel. Az összehasonlítás eredményeként meg tudjuk állapítani, hogy a diszkrét és folytonos SÍ és S2 szegmensek ugyanazon kézzel írt bemenőjelhez tartoznak-e, vagy pedig külön bemenőjeleket képeznek.
A fenti példák alapján is jól látható, hogy a találmány szerinti eljárás során egyértelműen lehet a kézzel írt bemenőjelek szegmenseinek, például az egyes szavaknak a határait megállapítani, és így a szöveg érthetősége is megbízható lesz.
Claims (9)
1. Eljárás kézzel írt karakter-bemenőjelek szegmenseinek azonosítására, amelynek során a legalább egy első és egy második, diszkrét, önmagában folytonos szegmensből (SÍ, S2) álló bemenőjelet vesszük, azzal jellemezve, hogy az eljárás az alábbi további lépésekből áll:
a) az első és második diszkrét, folytonos szegmensek (SÍ, S2) között legalább egy, az írás tengelyével párhuzamos távolságot mérünk meg úgy, hogy
- az első és második diszkrét, folytonos szegmensek (SÍ, S2) között több távolságot mérünk meg,
- meghatározzuk, hogy a több távolság közül melyik a legkisebb;
b) és a mért távolságértékek alapján határozzuk meg, hogy az első és a második diszkrét, folytonos szegmensek (SÍ, S2) azonos vagy különböző kézzel írt karakterbemenőjelekhez tartoznak.
2. Az 1. igénypont szerinti eljárás, azzal jellemezve, hogy a legkisebb mért távolság alapján határozzuk meg, hogy az első és második diszkrét, folytonos szegmensek (SÍ, S2) különböző kézzel írt karakter-bemenőjelekhez tartoznak-e.
3. Eljárás kézzel írt karakter-bemenőjelek szegmenseinek azonosítására, amelynek során a legalább egy első és egy második diszkrét, önmagában folytonos szegmensből (SÍ, S2) álló, kézzel írt karakter-bemenőjelet vesszük, azzal jellemezve, hogy az alábbi további lépésekből áll:
HU 219 991 Β
a) az első és második diszkrét, folytonos szegmensek (Sl, S2) között legalább egy, az írás tengelyével párhuzamos távolságot számítunk ki úgy, hogy
b) mind az első, mind pedig a második folytonos, diszkrét szegmensnél (Sl, S2) megmétjük az írás tengelyére merőleges határvonalat (bl, b2),
c) kiszámítjuk ezen határvonalak (bl, b2) közötti távolságot (d’); és
d) a határvonalak (bl, b2) közötti távolság (d’) alapján határozzuk meg, hogy az első és a második, diszkrét, folytonos szegmensek (Sl, S2) különböző kézzel írt karakterbemenetekhez tartoznak-e.
4. Eljárás kézzel írt karakter-bemenőjelek szegmenseinek azonosítására, amelyek során legalább egy első és egy második diszkrét, önmagában folytonos szegmensből (Sl, S2) álló, kézzel írt karakter-bemenőjelet veszünk, azzal jellemezve, hogy
a) az írás irányába eső tengelyt első tengelynek tekintjük, és
b) az első és második folytonos szegmensekhez (Sl, S2) tartozó határvonalakat (bl, b2) úgy határozzuk meg az első tengelyre merőlegesen, hogy mind az első mind a második folytonos szegmensnél (Sl, S2) megmérjük a másiknak a határvonalához (b2, bl) legközelebb eső pontját,
c) kiszámítunk egy, a határvonalak (bl, b2) között az első tengellyel párhuzamos, első távolságot (d’), és
d) ezt az első távolságot (d’) egy előre megadott első küszöbértékkel (t’) összehasonlítjuk, és
e) ha az első távolság (d’) az első küszöbértéknél (V) nagyobb, az első és második folytonos szegmenseket (Sl, S2) külön kézzel írtnak tekintjük,
f) ha az első távolság (d’) az előre meghatározott első küszöbérték (t’) alatti értéken van, az első és második folytonos szegmenseket (Sl, S2) külön-külön az első tengellyel párhuzamos sávokra (520, illetőleg 530) osztjuk,
g) a sávokat analizáljuk és meghatározzuk, hogy mely sávok (520, illetőleg 530) tartoznak az első és a második folytonos szegmenshez (Sl, S2);
h) meghatározzuk, hogy az első és második folytonos szegmensek (Sl, S2) sávjai (520, illetőleg 530) között melyekben vannak a szegmensek (Sl, S2) egymáshoz legközelebb, és az ezek közötti távolságot, mint egy második távolságot (d”) határozzuk meg; és
i) az első távolság (d’) és a második távolság (d”) alapján határozzuk meg, hogy az első és második folytonos szegmensek (Sl, S2) különböző kézzel írt karakter-bemenőjelekhez tartoznak-e.
5. A 4. igénypont szerinti eljárás, azzal jellemezve, hogy az első távolságból (d’) és a második távolságból (d”) úgy határozzuk meg, hogy legalább az első és második folytonos szegmensek (Sl, S2) különböző kézzel írt karakterbemenetekhez tartoznak-e, hogy a következő lépéseket hajtjuk végre:
hl) Az első távolságnak (d’) és a második távolságnak (d”) súlyozott átlagát (dw) számítjuk ki, h2) a súlyozott átlagot (dw) összehasonlítjuk egy második küszöbértékkel (t”), h3) ha a súlyozott átlag (dw) nagyobb, mint a második küszöbérték (t”), az első és második folytonos szegmensek (Sl, S2) különböző kézzel írt karakter-bemenőj elekhez tartoznak, h4) ha a súlyozott átlag (dw) kisebb, mint a második küszöbérték (t”), az első és második folytonos szegmensek (Sl, S2) azonos kézzel írt karakter-bemenójelhez tartoznak.
6. A 4. igénypont szerinti eljárás, azzal jellemezve, hogy a sávokat (520, illetőleg 530) az írás tengelyére merőleges irányban osztjuk el.
7. A 6. igénypont szerinti eljárás, azzal jellemezve, hogy a sávokat (520, illetőleg 530) az írás tengelyére merőleges irányban, azonos szélességűre választjuk meg.
8. Eljárás kézzel írt karakter-bemenőjelek szegmenseinek azonosítására, amelynek során az írás tengelye mentén vett első és második diszkrét, folytonos szegmensből (Sl, S2) álló, kézzel írt karakter-bemenőjelet dolgozzuk fel, azzal jellemezve, hogy
a) meghatározzuk az első diszkrét, folytonos szegmenshez (Sl) tartozó első határvonalat (bl), és a második diszkrét, folytonos szegmenshez (S2) tartozó második határvonalat (b2), amely első határvonal (bl) az első diszkrét, folytonos szegmensnek (Sl) egy adott hivatkozási ponttól mért legnagyobb távolsága, a második határvonal (b2) a második diszkrét, folytonos szegmensnek (S2) a hivatkozási ponttól mért legkisebb távolsága,
b) az első és második határvonalak (bl, b2) között egy, az írás tengelyével párhuzamos első távolságot (d’) számítunk ki,
c) ezt az első távolságot (d’) egy első küszöbértékkel (t’) összehasonlítjuk, és ha az első távolság (d’) az első küszöbértéknél (t’) nagyobb, az első és második, diszkrét, folytonos szegmensek (Sl, S2) különböző kézzel írt karakter-bemenőjelekhez tartozónak tekintjük,
d) ha az első távolság (d’) kisebb az első küszöbértéknél (f), a szegmenseket (Sl, S2) sávokra (520, 530) osztjuk, és minden sávra (520, 530) meghatározzuk a szegmensek (Sl, S2) közötti távolságot, és kiválasztjuk a legkisebbet, mint egy második távolságot (d”), és
e) akkor tekintjük az első és második, diszkrét, folytonos szegmenseket (Sl, S2) különböző kézzel írt karakter-bemenőjelekhez tartozónak, ha a második távolság (d”) nagyobb egy második küszöbértéknél (t”).
9. Eljárás kézzel írt karakter-bemenőjelek szegmenseinek azonosítására, amelynek során az írás tengelye mentén egymás után elhelyezkedő, legalább egy első és egy második, diszkrét, folytonos szegmensből (Sl, S2) álló, kézzel írt karakter-bemenőjelet veszünk, azzal jellemezve, hogy
a) meghatározzuk az első és második szegmensnek (Sl, S2), az írás tengelyére merőleges első és egy második határvonalát (bl, b2);
b) az első határvonal (bl) az első diszkrét, folytonos szegmensben (Sl) az írás tengelye mentén egy hivatkozási ponttól mért legnagyobb távolság,
HU 219 991 Β
c) a második határvonal (b2) a második diszkrét, folytonos szegmensben (S2) az írás tengelye mentén a hivatkozási ponttól mért legkisebb távolság,
d) meghatározzuk, hogy az első diszkrét, folytonos szegmensben (SÍ) lévő legnagyobb távolság nagyobb-e, 5 mint a második diszkrét, folytonos szegmensben (S2) mért legkisebb távolság,
e) ha igen, kiszámítjuk a második diszkrét, folytonos szegmens (S2) legközelebbi pontjának és az első diszkrét, folytonos szegmens (SÍ) legtávolabbi pontjának a különbségét képező értéket, és
f) ezen érték alapján meghatározzuk, hogy az első és második, diszkrét, folytonos szegmensek (SÍ, S2) különböző kézzel írt karakterbemenetekhez tartoznak-e.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/240,405 US5600735A (en) | 1994-05-10 | 1994-05-10 | Method of recognizing handwritten input |
PCT/US1995/005640 WO1995030965A1 (en) | 1994-05-10 | 1995-05-08 | Method for recognizing handwritten input |
Publications (3)
Publication Number | Publication Date |
---|---|
HU9503881D0 HU9503881D0 (en) | 1996-02-28 |
HUT73908A HUT73908A (en) | 1996-10-28 |
HU219991B true HU219991B (hu) | 2001-10-28 |
Family
ID=22906381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
HU9503881A HU219991B (hu) | 1994-05-10 | 1995-05-08 | Eljárás kézzel írt karakter bemenőjeleket képező szegmensek azonosítására |
Country Status (18)
Country | Link |
---|---|
US (1) | US5600735A (hu) |
EP (1) | EP0708944B1 (hu) |
JP (1) | JPH09500473A (hu) |
CN (1) | CN1128073A (hu) |
AT (1) | ATE221225T1 (hu) |
AU (1) | AU672558B2 (hu) |
BR (1) | BR9506217A (hu) |
CA (1) | CA2162609C (hu) |
CZ (1) | CZ285285B6 (hu) |
DE (1) | DE69527487T2 (hu) |
ES (1) | ES2181776T3 (hu) |
FI (1) | FI112403B (hu) |
HU (1) | HU219991B (hu) |
IL (1) | IL113658A (hu) |
NO (1) | NO309247B1 (hu) |
PL (1) | PL312986A1 (hu) |
SK (1) | SK3196A3 (hu) |
WO (1) | WO1995030965A1 (hu) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0739521B1 (en) * | 1994-11-14 | 2001-10-31 | Motorola, Inc. | Method of splitting handwritten input |
US5801941A (en) * | 1996-08-12 | 1998-09-01 | International Business Machines Corporation | Mobile client computer programmed to establish soft keyboard targeting sensitivity |
US6108444A (en) * | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
EP1717679B1 (en) * | 1998-01-26 | 2016-09-21 | Apple Inc. | Method for integrating manual input |
US7091959B1 (en) * | 1999-03-31 | 2006-08-15 | Advanced Digital Systems, Inc. | System, computer program product, computing device, and associated methods for form identification and information manipulation |
US6826551B1 (en) * | 2000-05-10 | 2004-11-30 | Advanced Digital Systems, Inc. | System, computer software program product, and method for producing a contextual electronic message from an input to a pen-enabled computing system |
US6798907B1 (en) * | 2001-01-24 | 2004-09-28 | Advanced Digital Systems, Inc. | System, computer software product and method for transmitting and processing handwritten data |
US20020107885A1 (en) * | 2001-02-01 | 2002-08-08 | Advanced Digital Systems, Inc. | System, computer program product, and method for capturing and processing form data |
US7639876B2 (en) * | 2005-01-14 | 2009-12-29 | Advanced Digital Systems, Inc. | System and method for associating handwritten information with one or more objects |
US7295206B2 (en) * | 2005-01-31 | 2007-11-13 | Microsoft Corporation | Ink input region adjustments |
US7697001B2 (en) * | 2005-01-31 | 2010-04-13 | Microsoft Corporation | Personalized ink font |
US7613341B1 (en) * | 2005-04-19 | 2009-11-03 | Adobe Systems Incorporated | Gap detection in a drawing |
US7720286B2 (en) * | 2005-05-25 | 2010-05-18 | Advanced Digital Systems, Inc. | System and method for associating handwritten information with one or more objects via discontinuous regions of a printed pattern |
CN100430958C (zh) * | 2005-08-18 | 2008-11-05 | 富士通株式会社 | 调整候选字符的初始识别距离的方法和装置 |
CN101192124B (zh) * | 2006-11-17 | 2010-04-21 | 中兴通讯股份有限公司 | 对触摸屏输入信息进行自动区分处理的系统及方法 |
US7855718B2 (en) | 2007-01-03 | 2010-12-21 | Apple Inc. | Multi-touch input discrimination |
US8130203B2 (en) | 2007-01-03 | 2012-03-06 | Apple Inc. | Multi-touch input discrimination |
US8269727B2 (en) | 2007-01-03 | 2012-09-18 | Apple Inc. | Irregular input identification |
JP5343617B2 (ja) * | 2009-02-25 | 2013-11-13 | 富士通株式会社 | 文字認識プログラム、文字認識方法および文字認識装置 |
CN102663388B (zh) * | 2012-03-27 | 2014-01-08 | 复旦大学 | 从背景图片中对手写体字符进行分割的方法 |
CN104346631A (zh) * | 2013-07-30 | 2015-02-11 | 夏普株式会社 | 图像判别方法、图像处理装置以及图像输出装置 |
JP6492894B2 (ja) | 2015-04-01 | 2019-04-03 | 富士通株式会社 | 認識プログラム、認識方法及び認識装置 |
US11762989B2 (en) | 2015-06-05 | 2023-09-19 | Bottomline Technologies Inc. | Securing electronic data by automatically destroying misdirected transmissions |
US20170163664A1 (en) | 2015-12-04 | 2017-06-08 | Bottomline Technologies (De) Inc. | Method to secure protected content on a mobile device |
US10235356B2 (en) | 2016-06-03 | 2019-03-19 | Bottomline Technologies (De), Inc. | Dual authentication method for identifying non-exactly matching text |
US11163955B2 (en) | 2016-06-03 | 2021-11-02 | Bottomline Technologies, Inc. | Identifying non-exactly matching text |
US11416713B1 (en) | 2019-03-18 | 2022-08-16 | Bottomline Technologies, Inc. | Distributed predictive analytics data set |
US11042555B1 (en) | 2019-06-28 | 2021-06-22 | Bottomline Technologies, Inc. | Two step algorithm for non-exact matching of large datasets |
US11269841B1 (en) | 2019-10-17 | 2022-03-08 | Bottomline Technologies, Inc. | Method and apparatus for non-exact matching of addresses |
US11763278B2 (en) | 2020-03-13 | 2023-09-19 | Bottomline Technologies, Inc. | Deposit token service system, apparatus and method |
US11966372B1 (en) | 2020-05-01 | 2024-04-23 | Bottomline Technologies, Inc. | Database record combination |
US11449870B2 (en) | 2020-08-05 | 2022-09-20 | Bottomline Technologies Ltd. | Fraud detection rule optimization |
US11544798B1 (en) | 2021-08-27 | 2023-01-03 | Bottomline Technologies, Inc. | Interactive animated user interface of a step-wise visual path of circles across a line for invoice management |
US11694276B1 (en) | 2021-08-27 | 2023-07-04 | Bottomline Technologies, Inc. | Process for automatically matching datasets |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4206442A (en) * | 1974-07-03 | 1980-06-03 | Nippon Electric Co., Ltd. | Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails |
US4379282A (en) * | 1979-06-01 | 1983-04-05 | Dest Corporation | Apparatus and method for separation of optical character recognition data |
JPS6274181A (ja) * | 1985-09-27 | 1987-04-04 | Sony Corp | 文字認識装置 |
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
US5062141A (en) * | 1988-06-02 | 1991-10-29 | Ricoh Company, Ltd. | Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition |
-
1994
- 1994-05-10 US US08/240,405 patent/US5600735A/en not_active Expired - Lifetime
-
1995
- 1995-05-08 BR BR9506217A patent/BR9506217A/pt not_active IP Right Cessation
- 1995-05-08 SK SK31-96A patent/SK3196A3/sk unknown
- 1995-05-08 ES ES95919009T patent/ES2181776T3/es not_active Expired - Lifetime
- 1995-05-08 CN CN95190365A patent/CN1128073A/zh active Pending
- 1995-05-08 HU HU9503881A patent/HU219991B/hu not_active IP Right Cessation
- 1995-05-08 AU AU24724/95A patent/AU672558B2/en not_active Ceased
- 1995-05-08 WO PCT/US1995/005640 patent/WO1995030965A1/en active IP Right Grant
- 1995-05-08 DE DE69527487T patent/DE69527487T2/de not_active Expired - Fee Related
- 1995-05-08 PL PL95312986A patent/PL312986A1/xx unknown
- 1995-05-08 EP EP95919009A patent/EP0708944B1/en not_active Expired - Lifetime
- 1995-05-08 JP JP7529125A patent/JPH09500473A/ja active Pending
- 1995-05-08 CZ CZ9660A patent/CZ285285B6/cs not_active IP Right Cessation
- 1995-05-08 AT AT95919009T patent/ATE221225T1/de not_active IP Right Cessation
- 1995-05-08 CA CA002162609A patent/CA2162609C/en not_active Expired - Fee Related
- 1995-05-08 IL IL11365895A patent/IL113658A/en not_active IP Right Cessation
- 1995-11-22 FI FI955609A patent/FI112403B/fi active
- 1995-12-15 NO NO955088A patent/NO309247B1/no unknown
Also Published As
Publication number | Publication date |
---|---|
FI955609A0 (fi) | 1995-11-22 |
SK3196A3 (en) | 1997-02-05 |
NO955088L (no) | 1995-12-15 |
IL113658A (en) | 1998-10-30 |
CZ6096A3 (en) | 1996-07-17 |
MX9600190A (es) | 1998-11-30 |
EP0708944A4 (en) | 1996-09-18 |
EP0708944B1 (en) | 2002-07-24 |
DE69527487T2 (de) | 2002-12-19 |
EP0708944A1 (en) | 1996-05-01 |
CZ285285B6 (cs) | 1999-06-16 |
FI955609A (fi) | 1995-11-22 |
NO955088D0 (no) | 1995-12-15 |
ATE221225T1 (de) | 2002-08-15 |
HU9503881D0 (en) | 1996-02-28 |
WO1995030965A1 (en) | 1995-11-16 |
CA2162609A1 (en) | 1995-11-16 |
JPH09500473A (ja) | 1997-01-14 |
ES2181776T3 (es) | 2003-03-01 |
IL113658A0 (en) | 1995-08-31 |
AU2472495A (en) | 1995-11-29 |
HUT73908A (en) | 1996-10-28 |
CA2162609C (en) | 1999-12-14 |
DE69527487D1 (de) | 2002-08-29 |
AU672558B2 (en) | 1996-10-03 |
BR9506217A (pt) | 1997-09-30 |
FI112403B (fi) | 2003-11-28 |
CN1128073A (zh) | 1996-07-31 |
PL312986A1 (en) | 1996-05-27 |
US5600735A (en) | 1997-02-04 |
NO309247B1 (no) | 2001-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
HU219991B (hu) | Eljárás kézzel írt karakter bemenőjeleket képező szegmensek azonosítására | |
US5513277A (en) | Measuring character and stroke sizes and spacings for an image | |
US5253307A (en) | Image analysis to obtain typeface information | |
US6577763B2 (en) | Document image recognition apparatus and computer-readable storage medium storing document image recognition program | |
US5841902A (en) | System and method for unconstrained on-line alpha-numerical handwriting recognition | |
JP3343864B2 (ja) | 語体の分離方法 | |
US5267332A (en) | Image recognition system | |
EP0476806B1 (en) | Improved segmentation process for machine reading of handwritten information | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
EP0526199B1 (en) | Image processing apparatus | |
CN110363202B (zh) | 指针式仪表数值读取方法及计算机终端 | |
KR960008205B1 (ko) | 육필 인식에 대한 기준선, 줄간격 및 문자 높이 예측 | |
US20020076111A1 (en) | Method and apparatus for formatting OCR text | |
US5787197A (en) | Post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
US9047655B2 (en) | Computer vision-based methods for enhanced JBIG2 and generic bitonal compression | |
US4918740A (en) | Processing means for use in an optical character recognition system | |
WO2003090153A1 (en) | Reshaping freehand drawn lines and shapes in an electronic document | |
JPH0519753B2 (hu) | ||
SE519014C2 (sv) | Metod och anordning för igenkänning av ett handskrivet mönster | |
US8005262B2 (en) | System and method for video object identification | |
US4845348A (en) | Method and apparatus for reading bar code magnetic ink characters | |
US8267322B2 (en) | Method and apparatus for correcting decoding errors in machine-readable symbols | |
CN117315668A (zh) | 一种基于ocr的文本智能识别系统 | |
HUT75820A (en) | Method of stroke segmentation for handwritten input | |
US6373997B1 (en) | Coarse and fine skew measurement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
DFC4 | Cancellation of temporary protection due to refusal | ||
HMM4 | Cancellation of final prot. due to non-payment of fee |