SK3196A3 - Method for recognizing handwritten input - Google Patents

Method for recognizing handwritten input Download PDF

Info

Publication number
SK3196A3
SK3196A3 SK31-96A SK3196A SK3196A3 SK 3196 A3 SK3196 A3 SK 3196A3 SK 3196 A SK3196 A SK 3196A SK 3196 A3 SK3196 A3 SK 3196A3
Authority
SK
Slovakia
Prior art keywords
distance
substantially parallel
continuous segments
calculating
value
Prior art date
Application number
SK31-96A
Other languages
English (en)
Inventor
John L C Seybold
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of SK3196A3 publication Critical patent/SK3196A3/sk

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Electrotherapy Devices (AREA)
  • Character Input (AREA)

Description

Oblasť techniky
Tento vynález sa všeobecne týka rozpoznávania rukopisov a hlavne rozpoznávania jednotlivých slov.
Doterajší stav techniky
Strojové rozpoznávanie ludského rukopisu je velmi zložitý problém a so súčasným prudkým rozširovaním výpočtových prostriedkov s možnosťou vstupu pomocou pera sa stalo dôležitou úlohou, ktorému je treba sa venovať. Strojové rozpoznávanie ludského rukopisu sa v súčasnej dobe aplikuje rôznymi spôsobmi.
Jeden príklad súčasnej aplikácie pre strojové rozpoznávanie ludského rukopisu nájdeme v osobných číslicových pomocníkoch, ako sú napr. výrobky EO alebo Newton. Typicky majú tieto druhy výrobkov dotykom ovládanú obrazovku, na ktorú môže užívatel uložiť rukopis. Tieto zariadenia potom slúžia na digitalizáciu rukopisného vstupu, ako je napr. alfanumerický vstup a potom sa pokúšajú spracovať vstup tak, aby bol rozpoznaný informačný obsah rukopisu.
Na základe jednej, v súčasnej dobe používanej, techniky rozpoznávania rukopisu sa vykoná najlepšie určenie tak, že sa identifikuje každý alfanumerický znak v postupnosti s tým, že výsledný reťazec znakov obsahuje výsledok rozpoznávacej činnosti. V tomto prístupe existuje velké množstvo nevýhod. Identifikácia priestorových hraníc kandidátov vstupu (v tomto prípade alfanumerických znakov, ktoré majú byť rozpoznávané) je velmi ťažká. Ak nie sú tieto hranice správne určené, je nemožné presne rozpoznať znak, lebo mu budú buď časti chýbať, alebo bude zahrňovať nesúvisiace časti z priľahlých znakov.
Jedným významným problémom strojového rozpoznávania ludského rukopisu je schopnosť rozpoznania konca jedného vstupu a začiatku ďalšieho vstupu konca jedného alfanumerického
Významný problém existuje napr. pri určovaní segmentu rukopisného vstupu, slova alebo vstupu, od začiatku nasledujúceho segmentu rukopisného vstupu, slova alebo alfanumerického vstupu. Zlé rozpoznávanie takýchto prerušení v rukopisnom vstupe má za následok zlú, nepresnú interpretáciu informačného obsahu rukopisného vstupu.
Preto je potrebná technika rozpoznávania rukopisu, ktorá vie v rukopisnom vstupe rozlíšiť koniec prvého segmentu rukopisného vstupu od začiatku druhého segmentu rukopisného vstupu, a tým poskytnúť presnejšiu interpretáciu informačného obsahu tohto rukopisného vstupu.
Prehľad obrázkov na výkresoch
Obr. 1 zobrazuje vývojový diagram činnosti v súlade s výhodným uskutočnením predloženého vynálezu.
Obr. 2 zobrazuje grafický pohľad na ilustračné zobrazenie v súlade s výhodným uskutočnením predloženého vynálezu.
Obr. 3 zobrazuje grafický pohľad na ilustračné zobrazenie v súlade s výhodným uskutočnením predloženého vynálezu.
Obr. 4 zobrazuje grafický pohľad na ilustračné zobrazenie v súlade s alternatívnym výhodným uskutočnením vynálezu.
Obr. 5 zobrazuje grafický pohľad na ilustračné zobrazenie v súlade s výhodným uskutočnením predloženého vynálezu.
Príklady uskutočnenia vynálezu
Rukopisný znakový vstup je zvyčajne získavaný od užívateľa vo forme oddelených- spojitých segmentov. Oddelený spojitý segment sa skladá z jedného či viacero ťahov pera, kde ťah pera je stopa, ktorú pero zanecháva počas doby svojho kontaktu so vstupným zariadením ako je digitalizačná tabuľka alebo papier. Ťah je vyjadrený ako postupnosť: bodov vzorkovaných vstupným zariadením v približne pravidelných intervaloch. Každý bod je určený minimálne súradnicami X a Y. Ťahy môžu byt snímané elektronicky za použitia digitalizačnej tabuľky alebo v alternatívnom uskutočnení môžu byt odvodené od skanovaného (riadkovo snímaného) alebo faxovaného obrazu procesom riadkovej detekcie v obraze; takéto metódy elektronického snímania vstupu sú v odbore známe.
Predložený vynález tak ako je uvedený, všeobecne určuje, či dva oddelené spojité segmenty tvoria čast rovnakého rukopisného znakového vstupu alebo časti viac ako jedného rukopisného znakového vstupu. V predloženom vynáleze sú rozpoznávané jednotky rukopisného vstupu tvorené jedným či viacerými oddelenými spojitými segmentmi. Rukopisný vstup je vstup, ktorý je snímaný elektronicky, čo zahrňuje, ale nie je obmedzené na nasledujúce: rukopisný vstup, elektronický vstup, vstup snímaný tlakom ako je tlačový vstup, vstup prijímaný elektronicky, ako napríklad faxom, prijímačom rádiového vyhľadávacieho systému alebo iným zariadením. Predložený vynález napríklad určuje, či dva oddelené spojité segmenty tvoria čast rovnakého slova, alebo tu tvoria časti rôznych slov. Vo svojom výhodnom spôsobe predložený vynález vypočítava jednu či viacero v podstate paralelných vzdialeností umiestnených v podstate paralelne s osou písma a porovnáva tieto vzdialenosti s jednou či viacerými vopred určenými prahovými hodnotami. Vopred určené prahové hodnoty špecifikujú minimálne hodnoty vzdialeností, ktoré musia byt v podstate paralelnými vzdialenostami prekročené, aby bolo možné usúdit, že prvý a druhý oddelený spojitý segment patrí k rôznym rukopisným vstupom, napr. k rôznym rukopisným slovám. Os písma je priamka, pozdĺž ktorej je pridávaný rukopisný vstup. Smer písma je smer, v ktorom sa pridáva každý ďalší rukopisný vstup. V angličtine je rukopisný vstup typicky pridávaný v smere horizontálnej osi písma s každým ďalším alfanumerickým vstupom nasledujúcim horizontálne za predchádzajúcim vstupom v smere písma zľava doprava. Rôzne ďalšie alternatívy osí a smerov písma sú podľa predloženého vynálezu možné.
Vo výhodnom uskutočnení je os písma horizontálna a rukopisný vstup tvorí rady slov. V tomto výhodnom uskutočnení sú v podstate paralelné vzdialenosti vypočítavané horizontálne a výstup hovorí, či oddelené spojité segmenty patria k rôznym slovám. V alternatívnom výhodnom uskutočnení je rukopisná os horizontálna a rukopisný vstup tvorí rady rôznych znakov, ktoré môžu byt alfanumerické znaky, ideografické znaky, vyskytujúce sa v jazykoch ako čínština alebo ktoré môžu mat podobu iných znakov či symbolov písomnej komunikácie. V tomto alternatívnom výhodnom uskutočnení výstup udáva, či oddelené spojité segmenty patria k rôznym znakom. V ďalšom výhodnom uskutočnení je rukopisná os vertikálna a rukopisný vstup tvorí rady rôznych znakov, ktoré môžu byt alfanumerické znaky, ideografické znaky alebo iný rukopisný text. V tomto výhodnom uskutočnení je os písma vertikálna a v podstate paralelné vzdialenosti sú radené vertikálne; výstup udáva, či oddelené spojité segmenty patria k rôznym znakom. V ešte ďalšom výhodnom uskutočnení je rukopisná os vertikálna a rukopisný vstup tvorí rady rôznych slov, iný rukopisný vstup, ako napr. čísel. V tomto výhodnom uskutočnení je os písma vertikálna a v podstate paralelné vzdialenosti sú radené vertikálne; výstup udáva, či oddelené spojité segmenty patria k rôznym rukopisným vstupom, ako napr. k rôznym slovám. Ako už bolo povedané vyššie a ako bude ďalej diskutované, predložený vynález demonštruje pomocou popisu niekoľkých výhodných uskutočnení, že môže existovať os písma v akomkoľvek uhle a rukopisný vstup môže byť interpretovaný všeobecnejšie ako zodpovedá oddeleným prvkom (zahrňujúcich, ale nie obmedzených na slová a znaky), obsahujúcim jeden či viacero oddelených spojitých segmentov. Aplikácia tu popísaných spôsobov na akékoľvek z rôznych výhodných uskutočnení vyžaduje iba zmenu v použitom alfanumerický vstup alebo vertikálny zoznam slov alebo systéme súradníc a takéto úpravy vynálezom vykonané.
môžu byt v súlade s predloženým
Obr. 1 objasňuje výhodný spôsob predloženého vynálezu. Predložený vynález možno aplikovať na jeden či viacero rukopisných vstupov oddelených spojitých segmentov. Výhodné procedúra, začínajúca môže byť použitá na uskutočnenia predloženého vynálezu možno aplikovať na dva či viacero rukopisných vstupov oddelených spojitých segmentov. Pre účely vysvetlenia sú použité len dva oddelené spojité segmenty SI a S2. Vo výhodnom spôsobe, objasnenom na obr. 1, je rukopisný vstup, skladajúci sa z dvoch oddelených spojitých segmentov SI a S2, prijímaný v kroku 110 zariadením ako je osobný číslicový pomocník alebo iné zariadenie. Iné zariadenia slúžiace na príjem rukopisného vstupu zahrňujú, ale nie sú obmedzené len na nasledujúce: počítače, modemy, prijímače rádiového vyhladávacieho systému, telefóny, číslicové, interakčné alebo iné televízie, zariadenia majúce digitalizačný tablet, telefaxové zariadenia, skanovacie zariadenia a akékoľvek zariadenia schopné snímať rukopisný vstup. Po prijatí rukopisného vstupu sú s výhodou identifikované v kroku 120 v podstate kolmé hranice bl a b2 medzi oddelenými spojitými segmentmi SI a S2. Hranice bl a b2, ktoré sú v podstate kolmé k osi písma, sú určené nájdením bodu v postupnosti ťahov SI, ktorý má najväčšie posunutie v smere písma, a nájdením bodu v postupnosti ťahov S2, ktorý má najmenšie posunutie v smere písmo - krok 120. V podstate kolmá hranica bl je vyhodnotením posunutia tohto bodu v postupnosti ťahov SI, ktorý má najväčšie posunutie v smere písma. V podstate kolmá hranica b2 je vyhodnotením posunutia tohto bodu v postupnosti ťahov b2, ktorý má najmenšie posunutie v smere písma. Výpočtom posunutia v smere písma postupne pre každý bod v SI a porovnaním tejto hodnoty s uloženou hodnotou, ktorá je spočiatku velmi vysoké záporné číslo, môže byť určená v podstate kolmá hranica bl, ktorá má najväčšie posunutie v smere písma. Ak je vypočítaná hodnota posunutia väčšia ako uložená hodnota, je táto uložená hodnota nahradená vypočítanou hodnotou posunutia. Len čo sú preskúmané všetky body, uložená hodnota bude obsahovať hodnotu najväčšieho posunutia nájdenú v postupnosti ťahov. Podobná s vysokou kladnou počiatočnou hodnotou, nájdenie bodu v S2, ktorý má najmenšie posunutie v smere písma tým, že sa vypočíta, posunutie v smere písma postupne pre každý bod S2 a porovná sa táto hodnota s hodnotou uloženou, ktorá je spočiatku velmi vysoké kladné číslo. Ak je vypočítaná hodnota posunutia menšia ako uložená hodnota, je táto uložená hodnota nahradená vypočítanou hodnotou posunutia. Podľa výhodného spôsobu sa potom vypočíta v kroku 130 prvá v podstate paralelná vzdialenosť d', kde d' = b2 - bj.
Podľa obr. 1 je prvá v podstate paralelná vzdialenosť d' porovnávaná s prvou vopred určenou prahovou hodnotou ť. Ak je d' väčšie ako rovné (>=) ť, usudzuje sa v kroku 145, že prvý oddelený spojitý segment SI a druhý oddelený spojitý segment S2 patria k rôznym segmentom rukopisného vstupu. Napríklad, ak je d' väčšie ako (>) ť, usudzuje sa, že SI a S2 sú rozdielne slová, znaky alebo iné jednotky rukopisného vstupu. Výber vopred určenej prahovej hodnoty ť je vykonaný v súlade so špecifickým uskutočnením. Voľba prahovej hodnoty ť bude diskutovaná podrobnejšie inde.
vstupu, ako sú vypočítaná druhá v podstate niekoľkých
Ak je hodnota d' menšia ako prahová hodnota ť, pokračuje sa ďalším spracovaním. Na určenie toho, či oddelené spojité segmenty SI a S2 tvoria rôzne oddelené spojité segmenty rukopisného rôzne slová, znaky alebo iné jednotky, je v podstate paralelná vzdialenosť d. Druhá paralelná vzdialenosť d sa nájde vypočítaním v podstate paralelných vzdialeností a výberom najkratšej z týchto vzdialeností. Vo výhodnom uskutočnení sa toto deje najprv v kroku 150 vypočítaním maximálneho rozsahu kolmého k osi písma a ohraničeného spoločne SI a S2. Tento rozsah je potom v kroku 160 rozdelený do mnohých pásem rovnakej výšky v podstate paralelných s osou písma. Ďalej sa nájde v kroku 170 v podstate paralelná vzdialenosť medzi SI a S2 pre každé pásmo. Najmenšia alebo najkratšia v podstate paralelná vzdialenosť medzi SI a S2 je vybraná v kroku 180 z množstva pásem a označená ako d. Ak je vo výhodnom spôsobe podľa obr. 1 nájdená v podstate horizontálna vzdialenosť d, sú vzdialenosť d a prvá v podstate horizontálna vzdialenosť d' kombinované, aby pomohli urobiť konečné rozhodnutie, či SI a S2 sú časti rovnakého rukopisného vstupu alebo sú časti rôznych oddelených spojitých segmentov rukopisného vstupu. Je vypočítaný vážený priemer d' ad. Výhodná rovnica pre výpočet váženého priemeru je (q'ď + qd)/(q' + q ) .
Empirickými testami na aktuálnych rukopisných dátach bolo zistené, že vážený priemer vzdialeností d' ad je presnejší ako d' alebo d samotné. V jednom výhodnom uskutočnení je q' = q, ale bola by možná ďalšia optimalizácia rozumnou volbou q' a q, ktoré by neboli zhodné. Ďalej môže byť q' a q rovné nule, ale nie obidve hodnoty súčasne.
Vážený priemer je porovnaný s druhou prahovou hodnotou t. Ak je vážený priemer menší ako t, výhodný spôsob z toho vyvodzuje v kroku 197, že SI a S2 sú časťou rovnakého segmentu rukopisného vstupu. Ak je vážený priemer väčší ako alebo rovný t, výhodný spôsob z tohto v kroku 199 vyvodzuje, že SI a S2 sú rôzne oddelené spojité segmenty rukopisného vstupu a výhodný spôsob je s týmto výsledkom ukončený.
Výhodný spôsob výberu ť a t je časťou špecifického uskutočnenia. V jednom uskutočnení môže byt ť stanovené zmeraním hodnoty d' pre velký súbor dát a výberom hodnoty, ktorá najlepšie rozlišuje skutočné deliace body od zlých volieb. V inom výhodnom uskutočnení môže byť ť stanovené ako konštantná hodnota zodpovedajúca určitému zlomku vzdialenosti medzi vstupnými vodidlami vo vstupnom zariadení. V inom výhodnom uskutočnení sa môže ť dynamicky meniť ako zlomok zmeraného rozsahu SI a S2 kolmého k osi písma. V inom uskutočnení môže byť ť určené explicitne užívatelom pred použitím tohto spôsobu. V popísanom výhodnom uskutočnení je ť stanovené ako 1/3 zmeraného rozsahu SI a S2 kolmého k osi písma, čo dáva dobrý výsledok pre anglický alfanumerický text. Je možné uvážiť mnoho ďalších spôsobov nastavenia ť, ktoré môžu byt optimálne pre rôzne riešenia. Rôzne spôsoby určenia t v rôznych uskutočneniach sú podobné tým, ktoré boli popísané na určenie ť.
Na obr. 2 je uvedené grafické znázornenie pre výhodné uskutočnenie. V tomto uskutočnení zodpovedajú oddelené spojité segmenty SI 210 a S2 220 anglickým slovám, os 230 písma je horizontálna a smer 270 písma je zlava doprava. V tomto výhodnom uskutočnení je posunutie v smere písma pre akýkoľvek bod jednoducho hodnota súradnice X pre tento bod, takže v podstate kolmá hranica bl 240 je hodnota súradnice X pre bod 210 v SI najviac vpravo a v podstate kolmá hranice b2 250 je hodnota súradnice X pre bod 220 v S2 najviac vľavo. V podstate paralelná vzdialenosť ď 260 je vzdialenosť medzi b-^ a b2.
Na obr. 3 je znázornená iná možnosť, kde oddelené spojité segmenty SI 310 a S2 320 zodpovedajú čínskym znakom, os 330 písma je vertikálna a smer 370 písma je zhora dole. V tomto uskutočnení je posunutie v smere 370 písma pre akýkoľvek bod jednoducho hodnota súradnice Y pre tento bod vynásobená -1 (za predpokladu štandardného súradnicového systému, kde Y rastie s pohybom zdola nahor), takže v podstate kolmá hranica bl 340 je hodnota súradnice Y bodu 310 v SI najviac dole vynásobená -1 a v podstate kolmá hranica b2 350 je hodnota súradnice Y bodu 320 v S2 najviac hore vynásobená -1.
V ďalších uskutočneniach môžu byť hodnoty bl a b2 vypočítané aplikáciou jednoduchého geometrického otočenia rukopisného vstupu tak, aby sa os písma vyrovnala s jednou z hlavných osí súradnicového systému a potom aplikáciou práve popísaného postupu. To je jednoduchá operácia, ktorá je známa odborníkom v tomto odbore. Inak môžu ďalšie uskutočnenia vypočítať posunutie bodov v smere písma, kde smer písma nie je súhlasný s jednou z hlavných osí súradnicového systému, jednoduchou geometrickou projekciou oddelených spojitých segmentov na osi a potom použitím trigonometrie k výpočtu posunutia premietnutých bodov od začiatku súradnicového systému. Toto je dobre známy matematický postup, ktorý môže byt na predkladaný vynález aplikovaný.
Ako bolo prv uvedené, ak je d' menšie ako ť, spracovanie pokračuje. V mnohých prípadoch sú segmenty, ktoré v skutočnosti patria k rôznym slovám alebo znakom, umiestnené tak, že d' je malé alebo dokonca záporné, ale stále je možné určiť, že SI a S2 patria k rozdielnym slovám alebo znakom. Obr. 4 ukazuje príklad tejto situácie pre uskutočnenie, v ktorom SI 410 a S2 420 sú anglické slová. V tomto príklade je d' 460 v skutočnosti záporné a b-L 440 je väčšie ako b2 450. V tomto príklade je os 430 písma horizontálna a smer 470 písma je zľava doprava.
V jednom uskutočnení, v ktorom je os písma horizontálna, je vypočítaný maximálny rozsah kolmý k osi písma a ohraničený SI a S2 nájdením minimálnej a maximálnej hodnoty súradnice Y v SI a S2. Kvôli nájdeniu minimálnej hodnoty súradnice Y je uložená hodnota inicializovaná veľmi vysokou kladnou hodnotou, a potom je postupne overovaný každý bod v SI a S2. Ak je hodnota jeho súradnice Y menšia ako uložená hodnota, je za uloženú hodnotu dosadená táto hodnota súradnice Y. Podobný spôsob je použitý na nájdenie maximálnej hodnoty súradnice Y. Odčítaním maximálnej a minimálnej hodnoty súradnice Y môže byt vypočítaný rozsah kolmý k osi písma. Všetky body v SI a S2 ležia vo vnútri tohto rozsahu.
Vo výhodnom uskutočnení môže byt tento proces účinnejší, ak bude uvažovaná len taká podmnožina bodov v SI a S2, kde je brané do úvahy iba pevne určené množstvo bodov blízko uvažovanej hranice, pretože sú to body, ktoré najpravdepodobnejšie ovplyvnia odvodzovanú hodnotu.
V inom uskutočnení, kde je os písma vertikálna, je maximálny rozsah kolmý k osi písma a ohraničený SI a S2 vypočítaný nájdením minimálnej a maximálnej hodnoty súradnice X v SI a S2. Na nájdenie minimálnej hodnoty súradnice X je uložená hodnota inicializovaná veľmi vysokou kladnou hodnotou. Potom je postupne overený každý bod v SI a S2 a ak je hodnota súradnice X menšia ako uložená hodnota, je za uloženú hodnotu dosadená táto hodnota súradnice X. Podobný spôsob je použitý na nájdenie maximálnej hodnoty súradnice X. Odčítaním maximálnej a minimálnej hodnoty súradnice X môže byt vypočítaný rozsah kolmý k osi písma.
V inom uskutočnení, kde os písma nie je ani horizontálna ani vertikálna, môže byt obrazová plocha otočená tak, aby sa os písma vyrovnala s osou X alebo Y súradnicového systému, ako bolo popísané vyššie pri výpočte v podstate paralelnej vzdialenosti ď v prípade, kedy os písma nie je ani horizontálna ani vertikálna.
Len čo bol nájdený rozsah kolmý k osi písma, výhodné uskutočnenie tento rozsah rozdelí do pásiem v podstate paralelných s osou písma tak, že každé pásmo popisuje úzky výrez cez SI a S2. V každom pásme je nájdený bod v SI s najväčším posunutím v smere písma a bod v S2 s najmenším posunutím v smere písma. Toto môže byt účinne vykonané pre SI inicializáciou uložénej hodnoty pre každé pásmo ako veľmi vysokého záporného čísla. Postupne je overený každý bod v SI. Najprv bolo overené jeho posunutie kolmé k osi písma, za účelom zistenia pásma, v ktorom leží. Pretože pásma prekleňujú celý rozsah SI a S2 kolmý k osi písma, je zaistené, že je možné nájsť pásmo pre akýkoľvek bod v SI a S2. Ak sa vo vyššie popísanom výhodnom uskutočnení pre výpočet kolmého rozsahu uvažujú iba podmnožiny bodov v SI a S2, nemusí kolmý rozsah obsahovať všetky body v SI a S2, takže každý bod musí byť overený, aby bolo isté, že leží vo vnútri pásma. Pokiaľ neleží, nie je ďalej braný do úvahy. Len čo je pásmo identifikované, je posunutie bodu v smere písma porovnané s uloženou hodnotou pre toto pásmo a ak je posunutie väčšie, je dosadené za uloženú hodnotu. Po overení všetkých bodov v SI bude uložená hodnota v každom pásme obsahovať najväčšie posunutie bodu, ktoré bolo v tomto pásme v SI nájdené. Ak neležia v danom pásme žiadne body z SI, uložená hodnota zostane ako veľmi vysoká záporná inicializačná hodnota. Podobný postup, používajúci v každom pásme druhú uloženú hodnotu inicializovanú vysokým kladným číslom, je používaný pre S2 posunutia bodu v smere písma v každom v danom pásme v S2 žiadne body, zostáva druhá uložená hodnota pre toto pásmo na svojej vysokej inicializačnej hodnote.
na nájdenie minimálneho pásme v S2. Ak nie sú
Na konci tejto operácie má každé pásmo dve uložené hodnoty zodpovedajúce najväčšiemu posunutiu v smere písma pre SI v danom pásme a najmenšiemu posunutia v smere písma pre S2 v danom pásme. Ak sa ani jedna uložená hodnota nezmenila zo svojej veľmi vysokej zápornej či kladnej hodnoty, potom informácia z tohto pásma nie je použitá v žiadnych ďalších výpočtoch. Inak je pre každé pásmo vypočítaná vzdialenosť odčítaním uloženej hodnoty posunutia bodu v SI od uloženej hodnoty posunutia bodu v S2. Ďalej sa nájde najmenšia z týchto vzdialeností postupným skúmaním vzdialenosti pre každé pásmo a uložením najmenšej z nich. Táto najmenšia vzdialenosť je v podstate horizontálna vzdialenosť d. Ak je d ménšie ako 0, čo môže nastať ak sa SI a S2 dotýkajú či prekrývajú, je vzdialenosti d priradená hodnota 0.
Jedno uskutočnenie, v ktorom je os písma horizontálna a smer písma je zlava doprava, je znázornené na obr. 5. V tomto uskutočnení je počet pásiem 510 rovný 10. V každom pásme je nájdený bod 520 v SI, ležiaci najviac vpravo a bod 530 v S2, ležiaci najviac vlavo. To sa u SI vykoná inicializáciou uloženej hodnoty pre každé pásmo velmi vysokým záporným číslom. Postupne je overený každý bod v SI. Najprv je overená súradnica Y, aby sa zistilo, v ktorom leží pásme. Pretože pásma prekleňujú celú výšku rozsahu SI a S2, je zaistené, že môže byť nájdené pásmo pre akýkolvek bod v SI a S2. Len čo je pásmo identifikované, je súradnica X bodu porovnaná s uloženou hodnotou pre toto pásmo a ak je súradnica X väčšia, je dosadená za uloženú hodnotu. Ak sú týmto spôsobom preskúmané všetky body v SI, bude uložená hodnota v každom pásme obsahovať súradnicu X bodu ležiaceho v tomto pásme SI najviac vpravo. Ak nie sú v SI žiadne body ležiace v danom pásme, uložená hodnota zostane na velmi vysokej zápornej inicializačnej hodnote. Podobný postup pre S2, používajúci druhú uloženú hodnotu v každom pásme inicializovanú vysokým kladným číslom, je použitý na nájdenie súradnice X bodu, ktorý leží v každom pásme v S2 najviac vlavo.
Ako bolo popísané prv, je hodnota d vypočítaná z uložených pozícií pre každé pásmo. Ako vzdialenosť d je vybraná z velkého množstva pásiem najmenšia či najkratšia, v podstate paralelná vzdialenosť medzi SI a S2. Vzdialenosť d je potom kombinovaná s d' pomocou váženého priemeru a porovnaná s t. Na základe porovnania s t spôsob podlá predloženého vynálezu vyvodzuje, či oddelené spojité segmenty SI a S2 patria k tomu istému rukopisnému vstupu alebo k rôznym rukopisným vstupom.
Odborníkom v danom odbore bude jasné, že popísaný vynález môže byt modifikovaný rôznymi spôsobmi a môže predstavovať veľa uskutočnení iných ako výhodné formy tu jednotlivo vyložené a popísané. Preto je pripojenými nárokmi zamýšľané pokryť všetky modifikácie vynálezu, spadajúce do pravej podstaty a rozsahu vynálezu a jeho ekvivalentov.

Claims (11)

  1. PATENTOVÉ NÁROKY
    1. Spôsob na rozpoznávanie rukopisného vstupu, vyznačujúci sa krokmi príjmu rukopisného znakového vstupu, kde tento rukopisný znakový vstup zahrňuje najmenej prvý a druhý oddelený spojitý segment, výpočtu najmenej jednej v podstate paralelnej vzdialenosti medzi prvým a druhým oddeleným spojitým segmentom, a použitie tejto v podstate paralelnej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným znakovým vstupom.
  2. 2. Spôsob podlá nároku 1, vyznačujúci sa tým, že krok výpočtu najmenej jednej v podstate paralelnej vzdialenosti zahrňuje krok výpočtu veľkého množstva v podstate paralelných vzdialeností medzi prvým a druhým oddeleným spojitým segmentom, krok výpočtu veľkého množstva v podstate paralelných vzdialeností ďalej zahrňuje krok identifikácie v podstate paralelnej vzdialenosti, ktorá má najmenšiu hodnotu a krok použitia paralelnej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom, zahrňuje krok použitia v podstate paralelnej vzdialenosti, ktorá má najmenšiu hodnotu, na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom.
  3. 3. Spôsob podľa nároku 1 alebo 2, vyznačujúci sa krokmi identifikácie v podstate kolmej hranice pre prvý i druhý oddelený spojitý segment, a výpočtu vzdialeností medzi v podstate kolmou hranicou pre prvý a druhý oddelený spojitý segment, kde krok použitia paralelnej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom zahrňuje krok použitia tejto vzdialenosti medzi v podstate kolmou hranicou pre prvý a druhý oddelený spojitý segment na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom.
  4. 4. Spôsob na rozpoznávanie rukopisného vstupu vyznačujúci sa krokmi príjmu rukopisného vstupu, kde tento rukopisný vstup zahrňuje najmenej prvý a druhý oddelený spojitý segment, identifikácie v podstate kolmej hranice pre prvý a druhý oddelený spojitý segment, výpočtu prvej vzdialenosti medzi v podstate kolmými hranicami pre prvý a druhý oddelený spojitý segment, výpočtu najmenej jednej v podstate paralelnej vzdialenosti medzi prvým a druhým oddeleným spojitým segmentom, keď prvá vzdialenosť neprekročí prvú vopred určenú prahovú hodnotu, a použitia prvej vzdialenosti a v podstate paralelnej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom..
  5. 5. Spôsob podlá nároku 4, vyznačujúci sa tým, že krok použitia prvej vzdialenosti a v podstate paralelnej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom, zahrňuje krok sčítania váženej prvej vzdialenosti a váženej v podstate paralelnej vzdialenosti za účelom získania výsledku a vydelenia tohto výsledku dvoma za účelom získania konečného výsledku a porovnania konečného výsledku s druhou vopred určenou prahovou hodnotou.
  6. 6. Spôsob podlá nároku 5, vyznačujúci sa tým, že prvá a druhá vopred určená prahová hodnota sú rovnaké alebo od seba odlišné, a vážiaci faktor tak, ako je aplikovaný na prvú vzdialenosť a v podstate paralelnú vzdialenosť, aby bola získaná vážená prvá -vzdialenosť a vážená v podstate paralelná vzdialenosť, je jedna, takže prvá vzdialenosť, je rovnaká s váženou prvou vzdialenosťou a v podstate paralelná vzdialenosť je rovnaká s váženou v podstate paralelnou vzdialenosťou.
  7. 7. Spôsob podlá nároku 4, vyznačujúci sa tým, že krok výpočtu prvej vzdialenosti medzi v podstate kolmými hranicami pre prvý a druhý oddelený spojitý segment zahrňuje kroky použitia v podstate paralelnej vzdialenosti ako v podstate paralelnej vzdialenosti, keď v podstate paralelná vzdialenosť má kladnú hodnotu, a použitia vopred určenej hodnoty ako v podstate paralelnej vzdialenosti, keď v podstate paralelná vzdialenosť má zápornú hodnotu, kde vopred určená hodnota je rovná nule.
  8. 8. Spôsob podlá nárokov 4 alebo 7, vyznačujúci sa tým, že krok výpočtu najmenej jednej v podstate paralelnej vzdialenosti zahrňuje krok výpočtu velkého množstva v podstate paralelných vzdialeností medzi prvým a druhým oddeleným spojitým segmentom.
  9. 9. Spôsob podľa nároku 8, vyznačujúci sa tým, že krok výpočtu veľkého množstva v podstate paralelných vzdialeností ďalej zahrňuje krok identifikácie tej v podstate paralelnej vzdialenosti, ktorá má najmenšiu hodnotu, a krok použitia prvej vzdialenosti a v podstate paralelnej vzdialenosti zahrňuje krok použitia v podstate paralelnej vzdialenosti, ktorá má najmenšiu hodnotu a prvej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom.
  10. 10. Spôsob podľa nároku 4, vyznačujúci sa tým, že prvý a druhý oddelený spojitý paralelne s osou písma, a hranice, ktorá je kolmá k segment sú umiestnené v podstate charakterizované krokmi identifikácie osi písma pre prvý a druhý oddelený spojitý segment a výpočtu prvej vzdialenosti medzi hranicami pre prvý a druhý oddelený spojitý segment, vyvodenia toho, že prvý a druhý oddelený súvislý segment patria k rôznym rukopisným vstupom, keď prvá vzdialenosť prekročí prvú vopred určenú prahovú hodnotu.
  11. 11. Spôsob určenia toho, že dva oddelené spojité segmenty patria k rôznym rukopisným vstupom, charakterizovaný krokmi prijatia rukopisného vstupu, kde tento rukopisný vstup obsahuje najmenej prvý a druhý oddelený spojitý segment, identifikáciu v podstate kolmej hranice pre prvý i druhý oddelený spojitý segment, kde v podstate kolmé hranice sú tie hranice, ktoré sú k sebe najviac priľahlé, výpočtu oddeľovacej vzdialenosti medzi v podstate kolmými hranicami pre prvý a druhý oddelený spojitý segment, vyvodenia toho, že prvý a druhý oddelený spojitý segment patria k rôznym rukopisným vstupom, keď oddeľovacia vzdialenosť prekročí vopred určenú prahovú hodnotu, výpočtu veľkého množstva v podstate paralelných oddeľovacích vzdialeností medzi časťami prvého a druhého Oddeleného spojitého segmentu, keď oddeľovacia vzdialenosť neprekročí prvú vopred určenú prahovú hodnotu, a použitia oddeľovacej vzdialenosti a najmenšej v podstate paralelnej oddeľovacej vzdialenosti na určenie toho, či prvý a druhý oddelený spojitý segment patria k rôznym rukopisným •vstupom.
SK31-96A 1994-05-10 1995-05-08 Method for recognizing handwritten input SK3196A3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/240,405 US5600735A (en) 1994-05-10 1994-05-10 Method of recognizing handwritten input
PCT/US1995/005640 WO1995030965A1 (en) 1994-05-10 1995-05-08 Method for recognizing handwritten input

Publications (1)

Publication Number Publication Date
SK3196A3 true SK3196A3 (en) 1997-02-05

Family

ID=22906381

Family Applications (1)

Application Number Title Priority Date Filing Date
SK31-96A SK3196A3 (en) 1994-05-10 1995-05-08 Method for recognizing handwritten input

Country Status (18)

Country Link
US (1) US5600735A (sk)
EP (1) EP0708944B1 (sk)
JP (1) JPH09500473A (sk)
CN (1) CN1128073A (sk)
AT (1) ATE221225T1 (sk)
AU (1) AU672558B2 (sk)
BR (1) BR9506217A (sk)
CA (1) CA2162609C (sk)
CZ (1) CZ285285B6 (sk)
DE (1) DE69527487T2 (sk)
ES (1) ES2181776T3 (sk)
FI (1) FI112403B (sk)
HU (1) HU219991B (sk)
IL (1) IL113658A (sk)
NO (1) NO309247B1 (sk)
PL (1) PL312986A1 (sk)
SK (1) SK3196A3 (sk)
WO (1) WO1995030965A1 (sk)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1102275C (zh) * 1994-11-14 2003-02-26 摩托罗拉公司 分解手写体输入的装置和方法
US5801941A (en) * 1996-08-12 1998-09-01 International Business Machines Corporation Mobile client computer programmed to establish soft keyboard targeting sensitivity
US6108444A (en) * 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
KR100595925B1 (ko) 1998-01-26 2006-07-05 웨인 웨스터만 수동 입력 통합 방법 및 장치
US7091959B1 (en) * 1999-03-31 2006-08-15 Advanced Digital Systems, Inc. System, computer program product, computing device, and associated methods for form identification and information manipulation
US6826551B1 (en) * 2000-05-10 2004-11-30 Advanced Digital Systems, Inc. System, computer software program product, and method for producing a contextual electronic message from an input to a pen-enabled computing system
US6798907B1 (en) * 2001-01-24 2004-09-28 Advanced Digital Systems, Inc. System, computer software product and method for transmitting and processing handwritten data
US20020107885A1 (en) * 2001-02-01 2002-08-08 Advanced Digital Systems, Inc. System, computer program product, and method for capturing and processing form data
US7639876B2 (en) * 2005-01-14 2009-12-29 Advanced Digital Systems, Inc. System and method for associating handwritten information with one or more objects
US7697001B2 (en) * 2005-01-31 2010-04-13 Microsoft Corporation Personalized ink font
US7295206B2 (en) * 2005-01-31 2007-11-13 Microsoft Corporation Ink input region adjustments
US7613341B1 (en) * 2005-04-19 2009-11-03 Adobe Systems Incorporated Gap detection in a drawing
US7720286B2 (en) * 2005-05-25 2010-05-18 Advanced Digital Systems, Inc. System and method for associating handwritten information with one or more objects via discontinuous regions of a printed pattern
CN100430958C (zh) * 2005-08-18 2008-11-05 富士通株式会社 调整候选字符的初始识别距离的方法和装置
CN101192124B (zh) * 2006-11-17 2010-04-21 中兴通讯股份有限公司 对触摸屏输入信息进行自动区分处理的系统及方法
US8269727B2 (en) 2007-01-03 2012-09-18 Apple Inc. Irregular input identification
US7855718B2 (en) * 2007-01-03 2010-12-21 Apple Inc. Multi-touch input discrimination
US8130203B2 (en) 2007-01-03 2012-03-06 Apple Inc. Multi-touch input discrimination
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
CN102663388B (zh) * 2012-03-27 2014-01-08 复旦大学 从背景图片中对手写体字符进行分割的方法
CN104346631A (zh) * 2013-07-30 2015-02-11 夏普株式会社 图像判别方法、图像处理装置以及图像输出装置
JP6492894B2 (ja) 2015-04-01 2019-04-03 富士通株式会社 認識プログラム、認識方法及び認識装置
US11762989B2 (en) 2015-06-05 2023-09-19 Bottomline Technologies Inc. Securing electronic data by automatically destroying misdirected transmissions
US20170163664A1 (en) 2015-12-04 2017-06-08 Bottomline Technologies (De) Inc. Method to secure protected content on a mobile device
US10235356B2 (en) 2016-06-03 2019-03-19 Bottomline Technologies (De), Inc. Dual authentication method for identifying non-exactly matching text
US11163955B2 (en) 2016-06-03 2021-11-02 Bottomline Technologies, Inc. Identifying non-exactly matching text
US11416713B1 (en) 2019-03-18 2022-08-16 Bottomline Technologies, Inc. Distributed predictive analytics data set
US11042555B1 (en) 2019-06-28 2021-06-22 Bottomline Technologies, Inc. Two step algorithm for non-exact matching of large datasets
US11269841B1 (en) 2019-10-17 2022-03-08 Bottomline Technologies, Inc. Method and apparatus for non-exact matching of addresses
US11763278B2 (en) 2020-03-13 2023-09-19 Bottomline Technologies, Inc. Deposit token service system, apparatus and method
US11449870B2 (en) 2020-08-05 2022-09-20 Bottomline Technologies Ltd. Fraud detection rule optimization
US11694276B1 (en) 2021-08-27 2023-07-04 Bottomline Technologies, Inc. Process for automatically matching datasets
US11544798B1 (en) 2021-08-27 2023-01-03 Bottomline Technologies, Inc. Interactive animated user interface of a step-wise visual path of circles across a line for invoice management

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US4379282A (en) * 1979-06-01 1983-04-05 Dest Corporation Apparatus and method for separation of optical character recognition data
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition

Also Published As

Publication number Publication date
HU9503881D0 (en) 1996-02-28
WO1995030965A1 (en) 1995-11-16
CZ6096A3 (en) 1996-07-17
CA2162609C (en) 1999-12-14
FI112403B (fi) 2003-11-28
NO309247B1 (no) 2001-01-02
FI955609A0 (fi) 1995-11-22
AU672558B2 (en) 1996-10-03
JPH09500473A (ja) 1997-01-14
DE69527487D1 (de) 2002-08-29
AU2472495A (en) 1995-11-29
ES2181776T3 (es) 2003-03-01
EP0708944A1 (en) 1996-05-01
CN1128073A (zh) 1996-07-31
MX9600190A (es) 1998-11-30
NO955088D0 (no) 1995-12-15
EP0708944B1 (en) 2002-07-24
BR9506217A (pt) 1997-09-30
NO955088L (no) 1995-12-15
DE69527487T2 (de) 2002-12-19
IL113658A0 (en) 1995-08-31
CZ285285B6 (cs) 1999-06-16
CA2162609A1 (en) 1995-11-16
FI955609A (fi) 1995-11-22
ATE221225T1 (de) 2002-08-15
HUT73908A (en) 1996-10-28
US5600735A (en) 1997-02-04
EP0708944A4 (en) 1996-09-18
PL312986A1 (en) 1996-05-27
IL113658A (en) 1998-10-30
HU219991B (hu) 2001-10-28

Similar Documents

Publication Publication Date Title
SK3196A3 (en) Method for recognizing handwritten input
Yanikoglu et al. Segmentation of off-line cursive handwriting using linear programming
EP1703444B1 (en) Detecting an orientation of characters in a document image
Seni et al. External word segmentation of off-line handwritten text lines
EP0632403B1 (en) Handwritten symbol recognizer and method for recognising handwritten symbols
US7596272B2 (en) Handling of diacritic points
US7778464B2 (en) Apparatus and method for searching for digital ink query
US5583949A (en) Apparatus and method for use in image processing
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
EP0526196B1 (en) Image processing
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
US7164795B2 (en) Apparatus for extracting ruled line from multiple-valued image
US20040136591A1 (en) Method and device for recognition of a handwritten pattern
EP0953932A2 (en) Image status detecting apparatus and document image correcting apparatus
CN114937278A (zh) 基于行文本框分词算法的文本内容提取识别方法
CZ6196A3 (en) Method of segmentation of draws for hand-writing input
JP2002163608A (ja) 手書き文字認識装置
JP4142911B2 (ja) 文字認識装置、および文字認識方法
JP3343305B2 (ja) 文字切り出し装置、及び文字切り出し方法
JPH08315068A (ja) 帳票書式識別方法及び装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2012008980A (ja) 情報処理装置およびプログラム
JPH08249420A (ja) ループ候補抽出装置、真のループ候補判定装置、及び文字補完装置
MXPA96000189A (en) Method of segmentation of traces for the entry of characters manuscri